总理座谈会上的年轻人,春节暴涨超千亿
去年底因为参加总理座谈会而备受瞩目的闫俊杰,真正是度过了一个马上暴富的春节:
腊月25至正月初五,他创立的上海稀宇极智科技有限公司(MiniMax),股价从500多元飙升至近千元,市值也拉升到超过3000亿港元。
一个春节,暴涨超千亿。
闫俊杰和大多数AI创业者一样,是天才,也是超级学霸。
1989年出生于河南一座小县城的他,在中国科学院自动化所完成博士学业,之后又在清华大学计算机系从事博士后研究。
2015年,闫俊杰加入了当时的AI领军企业商汤科技,并快速晋升为公司副总裁、研究院副院长及智慧城市事业群CTO,参与和主导了商汤深度学习工具链及通用智能技术体系搭建,并发表顶级会议和期刊论文100余篇,成为业内公认的顶级专家。
▲图源:2021世界人工智能大会
2021年底,已是商汤副总裁的闫俊杰决定辞职,创业成立MiniMax。
彼时的商汤科技即将港股上市,以闫俊杰的职级,如果不辞职很可能成为亿万富翁。
放弃既得的大好钱程,冒险重新开始,是因为闫俊杰对AI的发展有了新的思考。
当时的AI炒得火热,大量资金涌入,发展却远不及预期。也就应用于人脸识别、语音识别领域,创造的社会价值不高,甚至被调侃为人工智障。
核心问题在于AI不够通用。当时行业用虚拟模型解决客户的问题,每做一个模型就要训练一次。
一旦客户有多个问题,就得训练多个模型,直接导致成本高、周期长、效率低。
能否摆脱这种为每个任务专门定制模型的路径,面向更广泛人群的需求,开发一个通用的模型,让AI像水电一样普及,融入并改变人们的生活呢?
比如,一款能回答大家各种问题的模型,一款能帮助大家写作的模型……闫俊杰认为,这是有可能的。
更进一步思考后,他开始为这种可能性感到兴奋,感到时不我待,希望自己可以亲手将它做出来。
于是,他做出让很多人意外的决定,于2021年底成立了MiniMax,毅然决然地希望做出自己的通用大模型。
现在回头看,他的这一时间选择可谓是相当美妙:
就在2022年底,OpenAI发布的ChatGPT爆火全球,也让通用大模型成为全球科技浪潮的暴风口。
MiniMax的创立顺应了大势,但其发展,相当程度上却都是逆行业而行。
当大模型爆火后,大多数AI公司都集中资源先精一项。MiniMax却从一开始就无视文本、语音、视频的界限,坚持全模态自研,想实现全精通。
这种“不聚焦”的战略,很可能贪多嚼不烂,让许多投资者忧心忡忡。但闫俊杰认为,只有全模态才能逼近人类智能交互能力。
在目标用户上,大多数AI公司深耕面向企业或组织的B端。MiniMax却双拳出击,不仅深抓B端,更发布了众多面向个人消费者的C端产品,诸如Talkie、海螺AI、MiniMax Agent等。
而且从创业伊始,闫俊杰就将主要精力侧重到具备付费习惯的海外市场。一些产品甚至是“海外先行,国内跟进”,比如2023年6月,AI社交应用Talkie登陆欧美市场,火了之后才推出国内版“星野”。
在技术路线上,闫俊杰更是孤注一掷,豪赌未来。
2023年下半年,他力排众议,坚持从行业常用的Dense架构,转向混合专家系统的MoE架构。而且不是小幅调整,是全力转向,几乎投入了公司所有的算力资源。
Dense架构的核心特征是每次计算都全员参与,这种方式效率低且资源消耗大,但也有结构简单、训练稳定的优点。
MoE架构的预训练难度更高,但能显著降低算力消耗和使用成本,实现更高的效率。
当时,大多数公司都选择了更简单、稳定的Dense架构。但闫俊杰认为,未来的发展会对算力和资源消耗提出更大要求。只有在算力和消耗上省下成本,才会更有竞争力。
“不管有钱的大厂,还是没有钱的创业公司,(中国公司)在算力层面的投入可能要比美国公司小1-2个数量级。这是接下来两三年内非常确定的事情。”
如何用更少的资金和算力追上美国,成为了最迫切的事情,闫俊杰反复思考后的答案就是,转向MoE架构。
“你会发现这不是选择,而是你能够想到的唯一一条路,只有那一条路可以通向你的目标。当时只能这样,如果做不出来就完了。”
这是一场豪赌,失败了就会出局。后来的经历也是相当艰险,连续两次转型,结果都失败了,如果第三次继续失败,公司很可能走向终局。
好在第三次成功了,公司不但活了下来,而且提前走到了正确的道路上,赢得了先机。
如闫俊杰所料,AI大爆发之后,MoE架构的技术路线逐渐成为行业主流。
抢先布局的MiniMax,在2024年1月上线了国内首个MoE大模型abab,不但引领了国内行业,而且仅以累计5亿美元的投资,约行业龙头OpenAI花销的百分之一,就跻身世界AI的第一梯队。
闫俊杰另两个反向而行——C端产品和“全模态”,也都获得了成功。
如今,MiniMax已经跑出了多个畅销全球的C端产品,拥有超2亿个人用户,覆盖200多个国家及地区。
其中,主打视频生成的海螺AI,全球用户数突破4000万,其生成的高质量视频连马斯克都点赞过。专注于AI角色陪伴与虚拟社交的Talkie,更是在全球爆火,用户数达到惊人的1.47亿名。
▲图源:海螺AI
而且这些应用的用户大多来自海外,尤其是美国,堪称真正的“国际明星”。
在MiniMax的营收中,已有超过70%为海外市场贡献。
多模态的坚持,则让MiniMax成为“全球唯四全模态进入第一梯队”的大模型企业。它的语音模型Speech-02、视频模型Hailuo-02、文本模型MiniMax M2,都在权威评测中达到全球顶尖水平。
这也就意味着,它可以最大限度地争取用户。无论是语音、视频、文本,甚至是音乐,它都能够满足需求。更关键的是,多模态可以融合,成就全能AI。
这些综合起来,共同筑成了MiniMax的王座。
2024年,仅仅成立三年的MiniMax,年营收达到2.14亿元,同比增长782.2%。
卓越的表现,不仅让MiniMax与月之暗面、智谱AI、阶跃星辰、百川智能、零一万物并称为中国大模型“六小虎”,而且还是估值最高的小虎,受到了腾讯、IDG、高瓴创投、米哈游等资本的狂热追捧。
2025年初,MiniMax满怀信心,上线了拥有4560亿参数的开源大模型MiniMax-01,期望以此巩固技术领先优势。
然而,一个巨大的挑战席卷而来。
MiniMax-01上线没几天,整个国内乃至世界AI圈都迎来了一件王炸级事件:
DeepSeek-R1横空出世,凭借推理模型的革命性技术爆火出圈,而且完全开源。
几乎是一夜之间,全球AI都在讨论,甚至畏惧着DeepSeek这家此前堪称默默无闻的公司,腾讯、百度等巨头,乃至各行各业也都纷纷接入其模型。
对于国家来说,这是国运级的科技成果。但对于很多大模型初创企业来说,这就是天塌了。
王者已现且气势如虹的压力之下,一众还在为大模型准备的初创公司,要么弃赛,要么接入,要么转行,继续坚持做自己的模型被认为是最危险的选择。
但闫俊杰选择了继续坚持做自己的模型。
很多人以为MiniMax会就此坠入深谷,闫俊杰也感觉大山压肩,但他化压力为动力,最困难时刻最大力度爆发,集中一切力量,继续孤注一掷,研发新一代的推理模型。
半年之后,格局再次被扭转了。
当年6月17日,MiniMax上线了自主研发的MiniMax-M1,不但赢得了“全球首个开源大规模混合架构的推理模型”的占位,还凭借支持100万Tokens的上下文输入(8倍于DeepSeek-R1),以及卓越的长文本理解等关键能力,在DeepSeek-R1之外,打出了自己的优势,也赢得不少赞誉。
虎口脱险般的闫俊杰,还发了一条意味深长的朋友圈:
“第一次感觉到大山不是不能翻越。”
而这还不是全部。之后的4天,MiniMax以“日更”的方式,陆续发布了全新视频生成大模型Hailuo 02、通用智能体产品MiniMax Agent、视频创作智能体Hailuo Video Agent、音色设计产品Voice Design。
5天时间,5款重磅模型和产品,MiniMax不仅重新坐上了牌桌,还吸引了“教主”黄仁勋的注意。
▲图源:腾讯科技
当年7月,英伟达CEO黄仁勋在北京链博会上公开称赞MiniMax,将其与阿里巴巴、百度等企业并称为“世界级”产品开发者。
链博会结束不久,黄仁勋又单独和闫俊杰会面,深入交谈了约两个小时。
此后的MiniMax,开始好消息连连,并在2026年1月9日,于港交所正式挂牌上市,上市首日股价大幅上涨近110%,市值超1000亿港元。
如今更是突破了3000亿港元,远高于老东家商汤科技,与另一家公司智谱AI并称为“大模型双雄”。
闫俊杰的身上,有一个巨大的反差点。
他总是满脸笑容,说话慢条斯理,但内心杀伐果断。当整个AI圈都在追逐 DAU(日活跃用户数)时,他依然信奉技术驱动,专注在大模型的研发上。
2025年前三季度,MiniMax实现营业收入3.75亿元,但研发投入高达12.63亿元,是同期营收的3倍多。这种专注,不仅让他们挺过了DeepSeek的冲击,还找到了引领世界的创新点。
在去年10月发布的文本大模型MiniMax-M2中,他们首创了“交错思维”机制,让推理模型在做事前,先停下来思考一下。
这种“行动—停下来思考—再行动”的循环,显著提升了推理模型的可靠性。在全球权威测评榜单Artificial Analysis 中,MiniMax-M2的总分位列开源第一,国内外的大模型都迅速学习,补齐了类似能力。
对比DeepSeek用极致的工程优化榨干每一分算力,MiniMax更加剑走偏锋,以算法突破和机制创新撬动无限可能。
而让人震惊的是,这个世界级的AI新贵,员工总数才385人(截至2025年9月)。而且团队中没有“硅谷天才”坐镇,很多人都是第一份工作。
▲闫俊杰参加《罗永浩的十字路口》
AI圈不都在高薪挖天才吗?为什么闫俊杰不挖呢?
因为他坚信AI不是玄学,完全可以用第一性原理拆解成若干个明确的工程,诸如算法的设计、训练效率的优化、数据链路的搭建。
只要找到正确的科学方法,根本就不用所谓的天才,普通人也能创造出非凡价值。这种人才观念,又为公司省下了一大笔资金。
与此同时,闫俊杰也陷入了恐惧。因为当大模型可以被量化,也就意味着它会不断进步,最终必然超越人类。当做出成功的模型时,他会感到不安。
而战胜恐惧的,是公司会议室墙上的一行字——Intelligence with Everyone。这是闫俊杰创业的初衷,让尖端AI“为人所用、与人同行”。
早期投资人黄明明评价,“闫俊杰是一个‘狠人’,在资源等方方面面有限的情况下,他还是专注在模型研发上。只有这样的企业家可能才能走得更远,走到终局。”
AI是中国不能输掉的一场比赛。
面对美国的算力优势,这个出生在河南小县城,在资源匮乏的环境中成长起来的俊杰,正在用有限的资源打造世界顶尖的AI公司。
“如果未来全球只有五家AI公司,至少有两家中国公司,至少第二名是中国公司。”
这是闫俊杰的希望,更是他的长期目标。
[1]《总理今年首场座谈会,这9人成为“座上宾”!继梁文锋之后,他作为AI大模型企业代表参会》华夏时报
[2]《85后河南小伙闫俊杰,参加总理座谈会的三大看点》河南省教育厅
[3]《上海AI独角兽,连放大招》财经天下weekly
[4]《对话MiniMax闫俊杰:AGI不是大杀器,是普通人每天用的产品》晚点LatePost
[5]《“狠人”闫俊杰,闯关IPO》中国企业家杂志
[6]《最“佛系”的创始人,最“凶猛”的上市:MiniMax为何被资本市场选中?》凤凰网财经
[7]《MiniMax闫俊杰对话黄明明:AGI,只有一条最难但唯一的道路》中国
(来源:新浪科技)









