star star star star star

DeepSeek là gì? So sánh DeepSeek R1 vs. ChatGPT o1

avt
Anh Truong
10 tháng 2, 2025  

DeepSeek là một phòng thí nghiệm trí tuệ nhân tạo được thành lập vào tháng 5 năm 2023, chuyên về các mô hình ngôn ngữ lớn mã nguồn mở giúp máy tính hiểu và tạo ra ngôn ngữ con người. Gần đây Deepseek và mô hình AI của mình đã gây sốt trên toàn Thế Giới. Bạn muốn có thống kê về DeepSeek? Hãy xem những thống kê và sự thật về Chatbot AI DeepSeek trong bài viết dưới đây.

Xem thêm:

DeepSeek-R1 làm rung chuyển thị trường chứng khoán Mỹ

DeepSeek, một phòng thí nghiệm trí tuệ nhân tạo (AI) của Trung Quốc, đã làm chao đảo thị trường chứng khoán Mỹ với sự ra mắt của chatbot R1 vào ngày 20 tháng 1. Sản phẩm này nhanh chóng thu hút sự chú ý từ giới đầu tư, dẫn đến sự giảm giá của hợp đồng tương lai Nasdaq 100 khi các nhà đầu tư tại Thung lũng Silicon bắt đầu quan tâm.

Trong suốt cuối tuần ra mắt, DeepSeek đã leo lên vị trí hàng đầu trong App Store của Apple, và R1 đã lọt vào top 10 trong bảng xếp hạng Chatbot Arena của UC Berkeley. Sự gia tăng nhanh chóng này đã làm dấy lên lo ngại về tính hiệu quả chi phí của mô hình DeepSeek trong mắt các nhà đầu tư.

DeepSeek chỉ tiêu tốn 5,6 triệu đô la để đào tạo R1, không bao gồm chi phí R&D. Trong khi đó, các công ty Mỹ như OpenAI và Oracle đang đầu tư rất nhiều cho các sáng kiến Stargate AI. Sự chênh lệch chi phí này đã tạo ra “cuộc khủng hoảng tồn tại” như nhận định của Kathleen Brooks (giám đốc nghiên cứu tại XTB) đối với vị thế thống trị của Mỹ trong lĩnh vực AI. Tính khả thi về chi phí của mô hình DeepSeek đã dấy lên lo ngại về định giá của các nhà sản xuất chip, dẫn đến sự giảm giá cổ phiếu của Nvidia, Broadcom và AMD trong giao dịch trước thị trường.

Sự thành công của R1 đang thách thức các công ty công nghệ lớn đầu tư vào AI. Cổ phiếu của Microsoft và Alphabet đã giảm trước khi thị trường mở cửa. “Sự sụt giảm của DeepSeek” đã tác động đến thị trường chung, với hợp đồng Nasdaq 100 và hợp đồng tương lai S&P 500 đều ghi nhận giảm. Khi DeepSeek tiếp tục phát triển AI, các công ty buộc phải xem xét lại chiến lược và các khoản đầu tư của mình để duy trì vị thế cạnh tranh.

Xem thêm: 

Lịch sử phát hành DeepSeek

Phòng thí nghiệm DeepSeek được tài trợ bởi High-Flyer, một quỹ đầu tư mạo hiểm nổi tiếng của Trung Quốc, cả hai đều được thành lập bởi Lương Văn Phong ở Hàng Châu, Chiết Giang.

Lương Văn Phong được công nhận vì những đóng góp quan trọng trong lĩnh vực phát triển AI và đầu tư tài chính. Với nền tảng vững chắc trong khoa học máy tính và tài chính, ông đã có nhiều năm kinh nghiệm trước khi thành lập DeepSeek. Vai trò của ông tại High-Flyer không chỉ cung cấp hỗ trợ tài chính mà còn thúc đẩy sự phát triển công nghệ tại DeepSeek.

(Lương Văn Phong, với chuyên môn trong khoa học máy tính và tài chính, đã thành lập High-Flyer, một quỹ đầu tư mạo hiểm của Trung Quốc, để hỗ trợ đổi mới công nghệ. Vào tháng 5 năm 2023, ông thành lập DeepSeek, một phòng thí nghiệm AI ở Hàng Châu, tập trung vào các mô hình ngôn ngữ mã nguồn mở giúp cải thiện khả năng hiểu ngôn ngữ con người của máy tính.)

DeepSeek AI đã trải qua nhiều phiên bản, mỗi phiên bản mang lại những cải tiến và giải quyết các hạn chế trước đó. Dưới đây là cái nhìn chi tiết về các tính năng và thách thức chính của từng phiên bản.

Bảng tóm tắt lịch sử phát hành các mô hình DeepSeek AI:

Phiên bảnNgày phát hànhTính năng chínhThách thức
DeepSeek LLMNgày 2 tháng 11 năm 2023– Có sẵn mã nguồn mở- Truy cập miễn phí cho nghiên cứu và sử dụng thương mại- Tập trung vào các nhiệm vụ lập trình– Khả năng mở rộng hạn chế- Vấn đề hiệu quả tính toán
V2Tháng 5 năm 2024– Giá cả hợp lý với 2 RMB cho mỗi triệu token đầu ra– Cạnh tranh khốc liệt từ các mô hình xếp hạng cao hơn- Thâm nhập thị trường hạn chế
V3Tháng 12 năm 2024– 671 tỷ tham số- Được đào tạo trên 14,8 nghìn tỷ token- Vượt trội hơn Llama 3.1 và Qwen 2.5- Sự kết hợp của các chuyên gia với Multi-head Latent Attention Transformer– Chi phí đào tạo cao- Căng thẳng địa chính trị ảnh hưởng đến phát triển AI
R1Tháng 11 năm 2024– Chuyên về suy luận logic và lý luận toán học- Vượt trội hơn OpenAI (o1)- R1-Zero được đào tạo bằng học tăng cường mà không cần tinh chỉnh giám sát– Vấn đề khả năng đọc trong outputs- Hiệu suất hỗn hợp trong giải quyết vấn đề thực tế

Xem thêm:

Quá trình phát triển của DeepSeek từ khi ra mắt tháng 5 năm 2023

DeepSeek đã nhanh chóng trở thành một nhân tố quan trọng trong ngành công nghiệp AI bằng cách vượt qua những thách thức đáng kể, như các quy định xuất khẩu của Mỹ đối với các GPU tiên tiến. Những rào cản này đã thúc đẩy công ty đổi mới, tập trung vào hiệu quả và sự hợp tác.
Bằng cách tối ưu hóa việc sử dụng bộ nhớ và áp dụng phương pháp chuỗi tư duy (chain-of-thought), các mô hình của DeepSeek có thể xử lý các nhiệm vụ phức tạp như toán học nâng cao và lập trình mà không làm quá tải các GPU kém mạnh hơn.

Để thúc đẩy sự phát triển của mình, DeepSeek đã sử dụng chiến lược kết hợp giữa các GPU có tốc độ giới hạn được thiết kế cho thị trường Trung Quốc và một lượng lớn chip Nvidia A100 được mua trước các lệnh trừng phạt gần đây. Các báo cáo cho thấy công ty sở hữu ít nhất 10.000 đơn vị A100 (một số ước tính cho rằng con số này có thể lên tới 50.000). Sự khéo léo này đã cho phép DeepSeek tiếp tục mở rộng ranh giới của công nghệ AI.

Xem thêm: 

DeepSeek R1 vs. ChatGPT o1

Mô hình ngôn ngữ lớn R1 của DeepSeek  đã được giới thiệu như một đối thủ đáng gờm của ChatGPT o1 của OpenAI. Deepseek tuyên bố rằng R1 có thể cạnh tranh với ChatGPT o1 trong một số tiêu chuẩn trong khi hoạt động với chi phí thấp hơn đáng kể. Sự phát triển này được coi là một bước đột phá tiềm năng cho các nhà nghiên cứu và phát triển có nguồn lực hạn chế, đặc biệt là ở các nước Nam bán cầu, như Hancheng Cao (trợ lý giáo sư tại Đại học Emory) đã chỉ ra.

Điều gì làm cho R1 khác biệt so với o1

Mặc dù mô hình của DeepSeek và OpenAI có nhiều điểm tương đồng, vẫn có một số khác biệt nổi bật:

  • Hiệu quả chi phí: R1 có chi phí hoạt động thấp, giúp nó dễ tiếp cận cho các nhà nghiên cứu có ngân sách hạn chế.
  • Đơn giản trong kỹ thuật: R1 được thiết kế để cung cấp câu trả lời chính xác với yêu cầu tính toán tối thiểu, như đã được Dimitris Papailiopoulos từ phòng thí nghiệm AI Frontiers của Microsoft nhấn mạnh. 
  • Khả năng truy cập mã nguồn mở: DeepSeek đã phát hành sáu phiên bản R1 nhỏ hơn, một số có khả năng chạy trên các máy tính xách tay tiêu chuẩn, phù hợp với xu hướng phát hành mã nguồn mở tại Trung Quốc. 

Những tính năng này cùng nhau định vị R1 như một lựa chọn hiệu quả về chi phí và hiệu suất so với ChatGPT o1. R1 cung cấp một giải pháp thay thế cho những ai tìm kiếm khả năng AI tiên tiến mà không phải chịu chi phí cao. Khi DeepSeek tiếp tục đổi mới, những thành tựu của nó chứng minh cách rằng các hạn chế phần cứng có thể thúc đẩy kỹ thuật sáng tạo, có khả năng định hình lại bối cảnh LLM toàn cầu.

Xem thêm: 

Câu hỏi thường gặp

Dưới đây là những câu hỏi thường được hỏi nhất về DeepSeek AI

DeepSeek là gì?

DeepSeek là một công ty khởi nghiệp về trí tuệ nhân tạo (AI) tại Trung Quốc, được sáng lập bởi Lương Văn Phong. Công ty nổi bật với những cách tiếp cận đổi mới trong lĩnh vực AI, tập trung vào phát triển các giải pháp AI hiệu quả và dễ tiếp cận. Một trong những sản phẩm nổi bật của DeepSeek là mô hình ngôn ngữ lớn R1, với mục tiêu đưa công nghệ tiên tiến đến tay nhiều người dùng hơn.

So sánh R1 của DeepSeek với ChatGPT o1 của OpenAI

R1 của DeepSeek được thiết kế nhằm cạnh tranh với ChatGPT o1 của OpenAI, đặc biệt về hiệu suất và chi phí. R1 không chỉ tiết kiệm chi phí mà còn đơn giản về kỹ thuật, với khả năng truy cập mã nguồn mở. Những yếu tố này giúp R1 trở thành một đối thủ mạnh mẽ trong thị trường AI hiện nay.

DeepSeek đã giới thiệu những đổi mới công nghệ nào?

DeepSeek đã tiên phong trong nhiều đổi mới công nghệ, đặc biệt trong việc đào tạo mô hình AI và tối ưu hóa hiệu suất. Công ty áp dụng phương pháp chuỗi tư duy và tối ưu hóa bộ nhớ, cho phép các mô hình của họ xử lý các nhiệm vụ phức tạp mà không cần đến GPU mạnh mẽ, từ đó thiết lập các tiêu chuẩn mới trong phát triển AI.

DeepSeek đã giải quyết những thách thức địa chính trị như thế nào?

Để vượt qua những thách thức do quy định xuất khẩu của Mỹ đối với GPU tiên tiến, DeepSeek đã điều chỉnh chiến lược của mình. Công ty sử dụng các GPU giới hạn tốc độ và tận dụng kho chip Nvidia A100 dự trữ, cho phép họ tiếp tục đổi mới bất chấp những hạn chế về phần cứng, biến khó khăn thành cơ hội cho sự sáng tạo.

DeepSeek đã tác động như thế nào đến các nước Nam Bán Cầu?

DeepSeek cung cấp các giải pháp AI giá cả phải chăng, mang lại lợi ích lớn cho các nhà nghiên cứu và phát triển ở Nam Bán cầu. Với việc cung cấp công nghệ tiên tiến với chi phí thấp, DeepSeek giúp các cộng đồng này tận dụng các khả năng AI cho nhiều ứng dụng khác nhau.

DeepSeek đã vượt qua OpenAI trên Apple App Store như thế nào?

DeepSeek đã thành công trong việc vượt qua OpenAI trên Apple App Store, điều này cho thấy sức hấp dẫn ngày càng tăng của các giải pháp AI mà công ty cung cấp. Bằng cách giới thiệu các ứng dụng sáng tạo và thân thiện với người dùng, DeepSeek đã thu hút sự chú ý của người dùng toàn cầu, phản ánh khả năng đáp ứng nhu cầu phát triển của người tiêu dùng trong lĩnh vực AI.

Xem thêm các bài viết liên quan: 

Nguồn: What is Deepseek? | SEO.AI

    stick_img
    Bạn muốn hiểu thêm?
    Xem chi tiết
    Bạn có tầm nhìn.
    Chúng tôi có đội ngũ để
    Giúp bạn đạt được tầm nhìn đó
    Chat