DeepSeek发布了新的AI模型V3.1

2025-08-20 12:59:08

！[deepseek](http://img-cdn.gateio.im/social/moments-413db9a42e58f3549a3a69d6960cb975019283746574839201# DeepSeek发布新的AI模型v3.1

中国AI初创公司DeepSeek更新了其旗舰AI模型V3，并在聊天机器人中删除了推理神经网络R1的提及。有关此事的报道来自SCMP。

公司在 WeChat 上宣布发布 V3.1。此更新将模型的上下文窗口扩展到 128,000 个令牌，使其在与用户交互时能够存储更多信息。这个容量相当于大约 300 页的书。

也注意到代币使用的高效性。

![])http://img-cdn.gateio.im/social/moments-a3b33244d5fce041d05b086bade7acf6(数据：X.In Aider Polyglot 基准测试中，DeepSeek V3.1 的性能优于 Claude 4 Opus。

DeepSeek V3.1 在 Aider Polyglot 上击败 Claude 4 Opus

这使它成为最佳的非TTC编码模型，所有这些只需 ~$1 pic.twitter.com/QyJZnVRdVK

— Lisan al Gaib )@scaling01( 2025 年 8 月 19 日

V3.1 保持了生成速度与质量之间的平衡。它包含 6850 亿个参数，并基于混合架构，确保在对话、推理和编程任务中具有高性能。

DeepSeek 移除了深度思考功能中的 R1 提及。在 SCMP 中推测这可能表明在开发预期的 R2 版本时遇到了困难。

人工智能初创公司DeepSeek在1月发布了面向推理的R1模型，吸引了广泛关注。该模型在低资本投入下展现了高效能，因此专家们对在人工智能领域进行数十亿美元投资的必要性以及行业的泡沫性产生了怀疑。

提醒一下，今年六月，中国一家初创公司开始招聘实习生，以标记医疗数据，旨在改善人工智能在医院的应用。

DEEPSEEK2.35%

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

0/400

暂无评论