一份报告看尽2025上半年AI核心趋势,应用、模型、技术、行业全覆盖| 量子位智库 | 量子位
一份报告看尽2025上半年AI核心趋势,应用、模型、技术、行业全覆盖| 量子位智库
分析师 Xuanhao
量子位智库 | 公众号 AI123All
人工智能可能是人类有史以来最重要的发明,我们也正在见证AI的飞速发展,技术突破与场景落地交织推动着行业加速演进。过去半年AI圈到底有哪些核心趋势、关键动态?
量子位智库在《2025上半年AI核心成果及趋势报告》(以下简称《报告》)中将从应用、模型、技术、行业4个方面进行展开,为大家介绍过去半年AI领域的核心进展。

报告可点击「阅读原文」获得,文末亦附有完整报告下载链接。
应用趋势
Agent无疑是2025年AI圈最热门的核心话题,一批创新性的Agent产品开始进入市场,标志着AI从单纯的生成工具向智能代理的转型。
这些通用类Agent产品通过深度整合各种工具使用能力,主打完成场景多样的深度研究类任务,例如自动化市场调研、复杂数据分析等,其交付内容也变得更加丰富多样,不仅限于文本输出,还包括可视化报告、交互式海报等形式。这类产品已成为2025上半年应用领域的最大亮点。

此外,以视觉操作为核⼼的Computer Use Agent(CUA)开始推向市场,代表了通用类Agent的另⼀条路径,正在与基于⽂本的深度研究类Agent融合,例如OpenAI的ChatGPT Agent、Manus等产品。

通用类Agent之外,受益于⼤模型在语义理解、多模态等⽅面的能⼒提升,垂直应用场景开始Agent化,自然语⾔操控功能正在成为垂类⼯作流的⼀部分,帮助用户和创作者提高效率,我们已经可以观察到垂类Agent应用开始涌现。

AI编程已成为当前最核心的垂类应用领域,正在从源头彻底改变软件生产方式,通过自动化代码生成、调试和优化,缩短了开发周期。头部编程应用在收入增长速度上创下了纪录,获得了市场的有效验证,例如明星应用Cursor在短时间内年收入突破5亿美元大关,不仅反映了AI编程工具的商业潜力,也证明了其在实际工程项目中的可靠性和价值,吸引了从初创企业到科技巨头的广泛采用。

更好用户体验离不开充足的上下文(Context),过去半年模型上下⽂协议(Model Context Protocol,MCP)发展迅速,赋能模型获取⼤量外部信息、操控现有软件应用,打开更⼤应用空间,但尚未达到规模化⽣产级⽔平。MCP尝试解决模型和外界通信的标准问题,在今年上半年获得了AI社区的大量关注。

模型趋势
过去半年,模型推理能⼒在思维链范式下,依然可以通过堆积更多算⼒持续提升模型能⼒,其中数理类、代码类问题提升尤其显著,以思维链技术路线的提出者OpenAI为例,模型能力依然在稳步上升。

Agent不仅是应用层面的关键词,模型本身也开始走向Agentic化,通过端到端训练集成工具使用能力,相比仅基于文本的思维链推理有了重大提升,能够完成更复杂和困难的任务。对于人类而言,学会使用工具、发明工具是智能演化史上的重要里程碑,而目前大模型也在深度整合工具能力来强化其智能水平。

最近半年,大模型开始端到端融合视觉和文本能力,走向多模态推理,以语言作为中枢逐渐解锁多模态的慢思考、深推理模式。初代思维链推理模型的多模态能力相对薄弱,但经过半年迭代,多模态推理能力已成为推理模型的核心亮点,例如在处理图像-文本混合任务时,模型能更好地理解上下文、进行跨模态推理,这为视觉Agent的应用铺平了道路。

模型评估是观察模型能力变化的关键,正在加速演化,传统评估榜单(例如AIME、GPQA、MMLU等)在快速饱和。静态榜单的评测分数局限性越来越大,用户更希望模型能够贡献实际生产力,而非一味刷榜,因此未来可以动态更新,能在真实世界产⽣实用价值任务成为重要评估⽅向。

技术趋势
底层技术范式决定了模型会有什么样的能力,目前从模型训练阶段上来看,资源投⼊向后训练和强化学习倾斜,但预训练仍然有充⾜的优化空间,⼆者最终共同决定模型能⼒。

多智能体(Multi-Agent)系统可能成为继思维链推理模型之后的下一个前沿范式,继续提高智能上限,是Agent技术的下一步演进方向。头部模型厂商如OpenAI、xAI和Anthropic已经在部分功能上开始落地Multi-Agent技术,例如协作式问题求解、深度研究场景,但整体上还处于早期探索阶段,但为未来构建更复杂的AI生态系统打开了更多可能。

谷歌和强化学习之父Richard Sutton提出了“经验时代”(Era of Experience),强调AI和世界进行实时交互的重要性。从交互经验中学习有希望成为下⼀代模型学习⽅式,正在成为核⼼突破⽅向,可使模型摆脱对⼈类数据的依赖,提⾼智能上限,目前该领域还处于早期研究状态。

AI内容的生成和验证具有不对称性,生成相对容易,而验证是否可靠、正确需要的成本高难度大,以AI编程为例,代码验证成为目前AI编程自动化⽔平提升的前沿⽅向,可进⼀步加速软件⽣产自动化。

行业趋势
在上半年的AI大模型竞争中,xAI发布Grok 4,在多个领域达到SOTA⽔平,跻身全球⼤模型第⼀梯队,正在改变模型竞争格局,证明⼤模型的业务模式本身没有护城河,只是进入壁垒极高。

量子位智库认为算⼒是AI竞赛中的关键要素,强化学习对算⼒的需求超过预训练,头部⼤模型玩家的计算集群已达到数⼗万卡规模,并在持续扩张中。从“Bitter Lesson”的视角,AI的智能程度最终取决于算⼒的规模,拥有强⼤的计算资源是参与AI竞争的核心。

海外头部玩家的竞争动态上,上半年OpenAI技术领先优势明显弱化,海外头部玩家⽔平趋同,⾕歌和xAI在2025年上半年迎头赶上,模型在多个领域达到SOTA⽔准,例如Gemini 2.5 Pro在发布后受到社区好评,发布性能顶尖的视频生成模型Veo 3。

今年上半年,我们也观察到中美⼤模型技术差距缩小,中国模型公司在通用⼤模型之外的其他领域可以达到SOTA⽔平,尤其多模态领域表现出色。

关于国内大模型创业公司格局,我们观察到上半年各家路线开始分化,一些厂商积极发布前沿模型产品,追求智能上限的突破,保持技术驱动;其他厂商则专注垂类领域和商业化落地,放缓对通用模型的投入,转而强调实际营收和市场渗透。

更多详细内容,可在完整报告中获取。
报告下载链接:https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f?from=from_copylink
(来源:量子位)