Kimi和Minimax,争夺“下一个DeepSeek”心智
文 | 科技新知,作者丨樱木,编辑丨江蓠、九黎
近日,在 36氪WAVES 举办的大会上,一个有趣的环节引发了人们的热议:主办方让Kimi与Minimax两家的投资人进行了对谈。
随着 DeepSeek 的横空出世,整个中国大模型的牌局已天翻地覆。 行业龙头的格局,从原来的大模型六小龙,逐渐演变成了今天的基模五强。
当六小龙不再是市场的焦点时,安静很久的 Kimi 和 Minimax 在 前不久 不约而同有了新动作: Kimi 开源了编程模型 Kimi -Dev,它的第一个Agent Kimi -Researcher深度研究也开启小范围测试。而 Minimax 则开源了首个推理模型 Minimax -M1,并完成连续五天 包含大模型、视频生成、音频生成等多个方向的更加 。
从产品侧来看,Kimi将重心聚焦到agent,以深度研究为主要方向,似乎有意向金融、学术等方向发力,这条路线虽然已经有了智谱等竞争者,但远离了以生活服务为主的大厂射程,叠加原本不错的基础模型能力,Kimi似乎找到了自己的舒适区。
而另一边,Minimax则似乎想要弥补自身的遗憾,在没有接入DeepSeek之后,继续发力全方向的布局。
这似乎也意味着,大模型竞争进入下半场之后,更多的变量正在酝酿之中,而从各项评测来看,Kimi与Minimax的新产品,似乎都有着不错的效果。
在没等来R2之后的缓冲期,六小龙中的代表们,正在试图携带着各自的大招,开启下半场。而从报道来看,无论是频繁与DeepSeek撞论文的Kimi,还是曾经和DeepSeek赌同一个技术路径的Minimax,似乎都带着一丝不甘心。
而 在大厂 先后加入 大模型赛道 后 ,六小龙中, Kimi 和 Minimax 正试图 找到自己的生存方式。从某种程度来说,竞争的模式正在发生改变,而 在泡沫消散之后,越来越懂经营的六小龙们,也在期待着下一个周期的开始 。
Kimi和Minimax接连放大招
“ 一年前,就是比投放、比用户,现在则回到技术前沿,回到强认知,我相信反而更适合以技术大牛为核心的创业团队。因为比投放,其实是大厂的机会,所以我觉得他们状态还挺好的。 ”在这次对谈上,真格基金合伙人戴雨森在谈到Kimi与Minimax时如是说。
正如其所言, 近日,相较于在教育、医疗等垂类应用场景中争夺的大厂,Kimi与Minimax似乎更希望在基础技术上展现自身的底色。
6月20日,Kimi官方发布消息, Kimi -Researcher(深度研究) ,开始小范围灰度测试。 据官方消息透露, 模型即Agent, Kimi -Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,也是一个专为深度研究任务而生的Agent产品。
做为内测用户,可以看到的是,Kimi这次试图去打造的就是“高实用性”以及“靠谱”的产品。
按照官方的数据, 每个任务平均进行23步推理,自主梳理并解决需求 , 平均规划74个关键词,找到206个网址,由模型判断并筛选出信息质量最高的前3.2%内容,剔除冗余、低质信息 。 报告的平均长度在万字以上 , 平均引用约26个高质量、可溯源的信源 。
很明显,Kimi此次直指需要低幻觉类的垂类赛道。从小红书等社交媒体反馈来看,论文党、甚至如金融、法律等高频需要深度探索的方向,都对Kimi-researcher有着不错的评价。
专业评测博主mactalk评价道:深度研究不算什么新创新,但Kimi生成的内容,在信源和形式上确实不错,Kimi的深度研究功能,除了给到一份分析报告外,还会生成一个网页。看到网页的那刻,给人的感受是,网页也应该成为一种和文本同等重要的交互方式。
与此同时,Minimax也用全新的模型在展示自身的肌肉。根据极客公园报道, 作为推理模型, Minimax -M1在长上下文理解能力上,是目前包括所有闭源和开源模型在内,能力全球前二的模型,且在训练和推理成本上 有 极高的性价比。
M1仍然延续着MoE架构,而在注意力机制上和强化学习算法上的创新让M1鲜明 地 区别于其他推理模型。模型总参数达到4560亿参数,原生支持100万token的上下文长度输入,以及目前所有模型中最长的80ktoken的输出长度。
在 专业上下文能力的测评 中,M1的表现远超包括 DeepSeek -R1-0528和Qwen3-235B在内的所有开源模型,甚至超越OpenAI o3和Claude 4 Opus,仅小幅落后SOTA的Gemini 2.5 Pro。
除了基础模型的进展,Minimax在agent以及多模态等多个领域也是亮点频出。“ 大家最近刷抖音有没有看到 ‘ 吴彦祖教你学英语 ’ ?其实是 Minimax 在提供背后的技术支持。我第一次听的时候,也难以分辨到底是真人还是AI,直到后来才知道是 Minimax 的客户,感叹这真的挺厉害的。 ”云启资本合伙人陈煜提到。
实用性超强的agent,能力出众的大模型,Kimi和Minimax试图开启的是一场全方位的竞速,而从更深层次上来看,两家公司更希望表达的则是,打破大众对于大模型赛道的固有心智。
渴望一场DeepSeek式的胜利
相较于DeepSeek的光芒万丈,不得不说,此刻回头来看,Kimi与Minimax是两家曾充满遗憾的公司。
杨植麟 清华出身, 同时在 卡内基梅隆大学(CMU)语言技术研究所(LTI)读博,导师是苹果AI负责人Ruslan Salakhutdinov和Google AI首席科学家William W. Cohen,这样的学术背景,在技术可信度上远超普通创业者。
而且他 在 循环智能 等方面的创业经历 ,已经在企业级AI落地方面证明过自己。这 更能 让资本相信,这个人不只是懂技术,还会做生意。 高频快速的融资,让其估值迅速爬升。
技术背景,管理经验,同时具有大量子弹,这让杨植麟成为前DeepSeek时代的明星。
更重要的是, Kimi的第一仗还打的漂亮, 把长文本技术提升到了“中国AGI突破口”的高度,精准匹配了资本对 其的期待。
但不可否定的是, DeepSeek 的爆火,一定程度上掩盖了Kimi的部分声量。
不过,即便是到当下,仍然可以看出,Kimi在技术实力上,仍然不逊于DeepSeek。在基础研究环节, 2月18日, DeepSeek 和月之暗面几乎同时发布了他们各自最新的论文,而主题直接「撞车」—— 都是挑战Transformer架构最核心的注意力机制,让它能更高效的处理更长的上下文。而更有趣的是,两家公司的技术派明星创始人的名字 , 出现在各自的论文和技术报告里。
而在近日,两者撞车的事件又频频发生。在法律、医疗等方向招聘上的相似,潜移默化的让外界觉得,似乎Kimi仍然是能与DeepSeek并驾齐驱的存在。
而另一边Minimax的遗憾,则来的更为直接。在媒体的报道中,Minimax其实更早的启用了与DeepSeek相同的技术路线。 2023年下半年,大部分国内大模型厂商还在继续迭代稠密模型(dense model)之际, Minimax 创始人兼CEO闫俊杰就把80%以上的研发和算力资源 , 投到了一件不确定的事情上—— MoE(Mixture of Experts 混合专家模型)。
2024年1月, Minimax 上线的abab6,成为国内首个MoE大模型。此后,MoE架构彻底取代稠密架构,成了大模型领域技术迭代的新方向, 而 年初爆火出圈的 DeepSeek , 应用的正是 MoE。 虽然无法一概而论的将两者在此维度上进行比较,但可以验证的却是两者间肉眼可见的落差。
客观来说,与DeepSeek技术实力难分伯仲的Kimi与Minimax,在市场中早已无法得到与之匹配的影响力。
而从这个维度上来看,没有被大厂打败,而是被DeepSeek超越,也让两家在下一个周期即agent的争夺中,渴望着一场真正意义上的翻身仗。
正如戴雨森所言“ 我们不是因为大模型投资 Kimi ,而是投资团队。现在是技术革命的早期,他们仍然是拥有中国最优秀团队的AI创业公司之一,以及拥有最多资源的AI创业公司之一。 如果我们相信AI是一件非常大的事,你有最好的团队,又有最多资源,仍然能够做出很多有意思的事来。 ” 而AI的下半场,是否仍会按照当下大厂主导,DeepSeek重点突破的模式演绎,似乎仍然是一道谜题。
AI公司的生存逻辑正在重构
进入6月,AI圈似乎达到了比以往更为热闹的情景。罗永浩数字人直播带货拿下天量成交,夸克与元宝在高考报志愿竞逐,同时,豆包上线了AI播客功能,美团高层点了第一杯AI外卖咖啡,AI的想象力与应用正在不断加速地渗透至生活的各个角落。
这一切的快速演变,似乎让人看到了红杉AI峰会中所提到的, 下一轮 AI,卖的不是工具,而是收益。
但与此同时,对于agent未来演变的辩论也在持续。拾象CEO李广密曾坦言 Agent与当前模型能力的匹配程度。 他认为, 今天Agent 80%的能力依赖于模型这个引擎。比如,GPT到了3.5,多轮对话的通用范式出现了,Chatbot这种产品形态就行得通了。Cursor的崛起也是因为模型发展到了Claude 3.5的水平,它的代码补全能力才得以成立。
而 AI Research Lead钟凯祺 则认为:通用Agent的需求基本上就是信息检索和轻度代码编写这两类,而GPT-4o已经完成得非常好了。因此,通用Agent市场基本上是大模型公司的主战场,创业公司很难仅仅通过服务于通用需求来做大。而创业公司基本都聚焦在垂直(Vertical)领域。
回到本文的主角: 当 Kimi 用深度研究Agent叩开垂类专业场景的大门,当 Minimax 以推理模型M1刷新开源能力边界, 两家公司的每一步动作都在印证同一个事实:大模型竞争早已超越 “参数比拼” 的初级阶段,进入到 “心智占领” 的核心战场。
DeepSeek 的崛起证明,在大厂与创业公司的博弈中,技术突破与市场定位的精准耦合,足以重塑行业认知 —— 而这正是 Kimi 与 Minimax 此刻最迫切的目标。
从技术路径看, Kimi 押注“垂直 Agent”,试图用“深度研究”的专业标签切割出差异化赛道; Minimax 则 试图用 线性注意力机制 打出差异化 ,通过多模态能力构建全场景渗透的想象空间。两者的策略差异,本质是对“AI下半场生存法则”的不同解读:前者选择在大厂尚未重兵布防的垂类扎根,用“高实用性”对抗大厂的流量优势;后者则延续“全栈布局”的野心,试图以技术性价比弥补生态短板。
但这场争夺的关键,或许正如戴雨森所言——“投资团队而非模型”。当 DeepSeek 用技术叙事改写资本逻辑, Kimi 与 Minimax 的核心竞争力,仍在于创始团队对技术趋势的预判能力(如杨植麟对长文本技术的坚持、闫俊杰对MoE架构的提前布局)。在大厂凭借资源优势加速内卷的当下,创业公司的破局点从来不是 “硬碰硬”,而是像 DeepSeek 那样,在某个技术维度建立不可替代的认知优势,进而占领用户心智。
如今的AI下半场,既是技术落地的“马拉松”,也是心智认知的“闪电战”。 Kimi 与 Minimax 的每一次开源、每一个Agent的迭代,都是在为 “下一个 DeepSeek ” 的叙事加码。而当行业泡沫逐渐消散,真正能穿越周期的,或许正是那些既能在技术深水区扎根,又能在用户心智中刻下独特标签的团队。这场没有硝烟的战争,才刚刚开始。
参考资料:
(来源:钛媒体)
- 字母榜,《闫俊杰不甘心》
- 字母榜,《minimax的好日子来了?》
- 王智远,《 Kimi还能找到月之亮面吗? 》
- 凤凰网财经,《 Kimi和 DeepSeek 又撞车? 》
- 暗涌,《 一年后,当Kimi和MiniMax投资人再坐到一起 》
- 极客公园,《 巨头博弈下,Agent 的机会和价值究竟在哪里? 》
- 36氪,《 开源还要IPO?MiniMax不想被遗忘在这个夏天 》
- 月之暗面,《 模型即 Agent,Kimi-Researcher(深度研究)开启内测 》
- 极客公园,《 MiniMax-M1 登场,MiniMax 再次证明自己是一家模型驱动的 AI 公司 》