多名核心人员流失 AGI梦想不敌商业化现实?DeepSeek开启首次外部融资
曾经凭借大模型成为中国AI风向标的DeepSeek正在努力追赶。
4月18日,澎湃新闻记者从多位创投圈人士处证实,DeepSeek确实正在开启其首次外部融资。此前据外媒报道,DeepSeek目标估值超过100亿美元,据外媒援引知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元以补充资金储备,应对成本日益高昂的AI军备大赛。
值得注意的是,DeepSeek曾以不追求商业化名扬业内,依托创始人梁文锋背后的幻方资本,DeepSeek此前在量化交易和智能金融领域有强大技术实力和算力基础,也是国内第一批拥有万卡集群的大模型公司,“梁文锋是一个有AI信仰的人,他坚持的技术浪漫主义,在业内非常知名。”曾有投资人向记者评论。
“DeepSeek公司高层明确对商业化不感兴趣,只想做技术研究。而投资机构需要通过公司进行商业化变现,对公司有收入利润和资本化诉求,还需要创始人让渡一定程度的股权和自由。”去年有一位投资人向记者坦言,在去年DeepSeek-R1成为席卷全球的神话之前,没有一家VC(风投机构)成功地投进这家公司。
DeepSeek在去年春节的现象级走红,曾一度被捧上神坛,不过,伴随国产AI的竞速加剧,来自智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek似乎已经不再是国产AI的神话。
在国产大模型突飞猛进的同时,DeepSeek却未留住人才。根据澎湃新闻记者采访梳理,去年以来,DeepSeek已经流失多位核心成员,其中大部分为“95后”青年科学家:4月12日,自动驾驶公司元戎启行首次对外确认,DeepSeek多模态模型核心贡献者阮翀已加盟公司出任首席科学家,将于北京车展首次公开亮相并发表演讲展示“基座模型”在智驾领域的最新成果。
DeepSeek第一代大语言模型(LLM)核心作者王炳宣,近期宣布加盟腾讯;DeepSeek-OCR系列核心作者魏浩然也在今年春节前后离职,但尚未披露正式入职哪家大厂。
4月16日,前DeepSeek核心研究员郭达雅被曝以亿元年薪加盟字节跳动,据相关消息披露,郭达雅已加入字节跳动负责大模型研发的组织Seed,是agent(智能体)方向负责人之一,职级为L8。有传言称,郭达雅的薪资水平接近国内顶级AI人才,年薪达到亿级,类似腾讯姚顺雨。
据公开资料,郭达雅是GRPO算法的主要贡献者之一,这一算法是DeepSeek-R1推理能力训练方法论的核心。
当天,抖音集团副总裁李亮回应称,相关消息不实,近期没有招聘到什么近亿元年薪的员工。Seed员工的字节和豆包期权未来收益根据期权价格有波动,但不排除有些Seed技术人员四年后收益会达到数亿元。不过,根据澎湃新闻记者从多方信源确认,郭达雅确实已经加盟字节跳动。
去年11月12日,澎湃新闻记者独家获悉,前DeepSeek核心研究员罗福莉在朋友圈发文:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的AGI。”这也是罗福莉首次官宣加入小米。
公开资料显示,罗福莉本科毕业于北京师范大学计算机专业,硕士阶段进入北京大学计算语言学深造。硕士毕业后,罗福莉加入阿里巴巴达摩院,担任机器智能实验室研究员,负责开发多语言预训练模型VECO,并推动AliceMind项目的开源工作。2022年,罗福莉加入DeepSeek母公司幻方量化从事深度学习相关工作,后又担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型。
根据上述信息,在基座大模型(LLM)、智能体(Agent)、文本识别(OCR)、多模态等多方面领域,DeepSeek均有核心人才流失。
据业内人士透露,从薪资待遇来看,DeepSeek在业内仅处于中等水平,并非最高,不过,如今猎头正在以2-3倍的高薪和期权加速挖角DeepSeek团队,加速其人员流失。
4月8日,记者查询发现,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在官网页面首次引入分层模式。
这也让DeepSeek更新V4的悬念再度成为大家讨论的热点,综合外媒报道和社交媒体、多方渠道信息,DeepSeek有望在4月正式上线V4版本——在外界预期中,此次V4发布如果要复刻去年春节轰动,无疑将面临更大挑战,而人才流失也无疑将对V4的发布造成冲击。
理想化的AGI梦想究竟是否能抵抗商业化的现实?伴随V4发布的脚步声临近,聚光灯已经落在了DeepSeek掌舵人梁文锋身上。
(来源:天天基金网)

