DeepSeek V3小版本升级实测堪比V3.5，非推理模型也有"啊哈时刻" | 量子位

2025年03月29日,17时41分09秒 OpenAI 阅读 69 views 次

DeepSeek V3小版本升级实测堪比V3.5，非推理模型也有“啊哈时刻”

梦晨 2025-03-25 18:12:08 来源：量子位

并非小版本升级

DeepSeek V3升级了，新版本V3-0324。

官方轻描淡写只说是“小版本升级”，但很多人实测下来可一点也不小。

把流行的小球弹跳测试，提升难度到4维空间超立方体也没问题。

编程这块，只需一句提示词开发一个完整产品着陆页，带自适应布局带动效，被评价为与Claude 3.7 Sonnet同一水平。

由于发布时间太短，还没有正式测评结果，不过在开发者Xeophon的个人Benchmark上所有指标都有大提升，成为该测试下最好的非推理模型。

不是推理模型也有“啊哈时刻”

DeepSeek-V3-0324并非推理模型，在回答之前不会给出思考过程，但依然遵循一定的思维方式分解问题。

走入死胡同的话，还表现出自主回到上一步重新思考的能力。

在“9.11和9.9那个大”、“Straberry有多少个r”已经不成问题的今天，最新折磨AI的难题是“让7米长的甘蔗通过2米高1米宽的门”。

在量子位的测试中，DeepSeek-V3-0324先是像它的前辈以及许多其他AI一样碰壁。

碰壁之后开始重新思考题目本身的含义，后面依旧陷入误区，但突然在中文解题过程中夹杂一句英语思考，类似DeepSeek-R1技术报告中的“啊哈时刻”。

顿悟之后，突然就走上了正确的道路，注意到了题目中没直接提到的隐藏条件。

虽然从计算过程看，还是没理解到问题的本质，但好歹得出了解决方案，还认识到了自己的误区。

依旧免费，依旧开源

像这样的优秀模型依旧免费，依旧开源，权重文件已火速上线HuggingFace，使用最宽松的MIT协议。

所有权重文件加起来占硬盘空间约688GB，与初代v3保持一致，说明依然是671B参数的MoE模型，目前没有更多技术细节，还需等待官方进一步发布公告。

目前在官网和官方APP（关闭深度思考即可）、HuggingFace等渠道都能体验到v3-0324。

也可以到大模型竞技场去与其他模型pk，不过投票结果还要等一段时间才能出来。

当然最让大家期待的还是，v3更新了，r2还会远吗？

官网试玩：

https://chat.deepseek.com/

HuggingFace：

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md

参考链接：
[1]https://x.com/TheXeophon/status/1904225899957936314
[2]https://x.com/Yuchenj_UW/status/1904223627509465116
[3]https://x.com/risphereeditor/status/1904194061780590773

(来源:量子位)

2026年 2月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

DeepSeek V3小版本升级实测堪比V3.5，非推理模型也有“啊哈时刻”

不是推理模型也有“啊哈时刻”

依旧免费， 依旧开源

关联资讯:

用户登录

依旧免费，依旧开源