Công ty khởi nghiệp AI của Trung Quốc DeepSeek đã cập nhật mô hình AI hàng đầu V3 của mình và loại bỏ đề cập đến mạng nơ-ron suy luận R1 trong chatbot. Điều này được SCMP đưa tin.
Công ty đã thông báo về việc phát hành V3.1 trên WeChat. Bản cập nhật mở rộng cửa sổ ngữ cảnh của mô hình lên đến 128 000 token, cho phép nó lưu trữ nhiều thông tin hơn khi tương tác với người dùng. Khối lượng này tương đương với một cuốn sách khoảng 300 trang.
Cũng được ghi nhận là hiệu quả cao trong việc sử dụng các token.
Dữ liệu: X. Trong bảng xếp hạng Aider Polyglot, đánh giá LLM trong việc giải quyết các nhiệm vụ lập trình phức tạp ngay lập tức trên nhiều ngôn ngữ, DeepSeek V3.1 vượt trội hơn Claude 4 Opus.
DeepSeek V3.1 vượt qua Claude 4 Opus trên Aider Polyglot
Điều này khiến nó trở thành mô hình mã hóa không TTC tốt nhất và tất cả điều đó chỉ với ~$1 pic.twitter.com/QyJZnVRdVK
— Lisan al Gaib (@scaling01) 19 tháng 8, 2025
V3.1 duy trì sự cân bằng giữa tốc độ và chất lượng tạo ra. Nó chứa 685 tỷ tham số và dựa trên kiến trúc lai, cung cấp hiệu suất cao trong các nhiệm vụ đối thoại, lập luận và lập trình.
DeepSeek đã xóa đề cập đến R1 trong chức năng tư duy sâu. Tại SCMP, người ta suy đoán rằng điều này có thể chỉ ra những khó khăn trong việc phát triển phiên bản R2 mà mọi người đang mong đợi.
Startup AI DeepSeek đã thu hút sự chú ý vào tháng Giêng với việc ra mắt mô hình R1, tập trung vào lý luận. Nó đã chứng tỏ hiệu quả cao với mức đầu tư thấp, khiến các chuyên gia đặt ra nghi ngờ về sự cần thiết của những khoản đầu tư hàng tỷ vào lĩnh vực AI và sự phình to của ngành công nghiệp.
Nhắc lại, vào tháng Sáu, một công ty khởi nghiệp Trung Quốc đã bắt đầu tuyển dụng thực tập sinh để đánh dấu dữ liệu y tế nhằm cải thiện việc ứng dụng trí tuệ nhân tạo trong các bệnh viện.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
DeepSeek đã phát hành mô hình AI mới V3.1
Công ty khởi nghiệp AI của Trung Quốc DeepSeek đã cập nhật mô hình AI hàng đầu V3 của mình và loại bỏ đề cập đến mạng nơ-ron suy luận R1 trong chatbot. Điều này được SCMP đưa tin.
Công ty đã thông báo về việc phát hành V3.1 trên WeChat. Bản cập nhật mở rộng cửa sổ ngữ cảnh của mô hình lên đến 128 000 token, cho phép nó lưu trữ nhiều thông tin hơn khi tương tác với người dùng. Khối lượng này tương đương với một cuốn sách khoảng 300 trang.
Cũng được ghi nhận là hiệu quả cao trong việc sử dụng các token.
V3.1 duy trì sự cân bằng giữa tốc độ và chất lượng tạo ra. Nó chứa 685 tỷ tham số và dựa trên kiến trúc lai, cung cấp hiệu suất cao trong các nhiệm vụ đối thoại, lập luận và lập trình.
DeepSeek đã xóa đề cập đến R1 trong chức năng tư duy sâu. Tại SCMP, người ta suy đoán rằng điều này có thể chỉ ra những khó khăn trong việc phát triển phiên bản R2 mà mọi người đang mong đợi.
Startup AI DeepSeek đã thu hút sự chú ý vào tháng Giêng với việc ra mắt mô hình R1, tập trung vào lý luận. Nó đã chứng tỏ hiệu quả cao với mức đầu tư thấp, khiến các chuyên gia đặt ra nghi ngờ về sự cần thiết của những khoản đầu tư hàng tỷ vào lĩnh vực AI và sự phình to của ngành công nghiệp.
Nhắc lại, vào tháng Sáu, một công ty khởi nghiệp Trung Quốc đã bắt đầu tuyển dụng thực tập sinh để đánh dấu dữ liệu y tế nhằm cải thiện việc ứng dụng trí tuệ nhân tạo trong các bệnh viện.