
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。
但随之而来的是一个日益严重的问题:它们太能「说」了!生成的推理过程往往充斥着冗余信息(比如反复定义)、对简单问题过度分析,以及对难题的探索浅尝辄...
多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限

第一作者为哈尔滨工业大学(深圳)博士生王霄和华为大模型研究员佀庆一,该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成,佀庆一的研究方向为多模态理解、LLM post-training和高效推理。
随着视频内容的重要性日益提升,如何处理理解长视频成为多模态大模型面临的关键挑战。长视频理解能力,对...
3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST | 量子位

3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
衡宇 2025-03-28 18:30:46 来源:量子位
zhan ji s
3D生成版DeepSeek再上新高度!
国产、易用、性能强且开源——
新模型一露面就刷新SOTA,并且第一时间加入开源全家桶...
实测完即梦3.0,我后悔大学选了设计专业……

编辑 | 杨文
自从 GPT-4o 出了「吉卜力」滤镜后,社交媒体上简直是人均宫崎骏。
而这股「吉卜力热」也让 ChatGPT 圈了一大波粉,甚至一小时狂揽百万用户。
友商们也坐不住了。
Midjourney CEO 跳出来一顿阴阳,还放出自家模型即将更新至 V7 的消息。
Ideogram 则直接掏出了最新模型 3.0,并向所有用户免费开放。
就...
速来!机器之心ICLR 2025新加坡现场人才晚宴开启报名

2025 年开年,以 DeepSeek R1 为代表的推理大模型开启炸场模式。在短短数月内,DeepSeek 凭借其卓越的性能和广泛的适用性,迅速在人工智能领域掀起了一场技术革新的浪潮。
而后,国内外各大科技公司、科研机构迅速跟进,新研究、新应用不断涌现。AI 的发展速度似乎已经快进到了以周甚至以天为单位。
面对发展如此迅速的...
DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型

上海交通大学与 SII 联合发布了 DeepResearcher,代码训练框架完全开源。这是首个在真实网络环境中通过强化学习训练的 AI 研究模型。
随着大型语言模型(LLMs)推理能力的飞速发展,OpenAI、Google 和 XAI 等科技巨头纷纷推出了备受欢迎的 Deep Research 产品。这些工具能帮助用户整合海量网络信息,解决复杂问题,大大...
仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架

编辑丨coisini
机器学习在蛋白质发现领域展现出深远的潜力,相关工具已快速应用于科学流程的辅助与加速。当前,AI 辅助的蛋白质设计主要利用蛋白质的序列和结构信息,而为了描述蛋白质的高级功能,人们以文本形式整理了海量知识,这种文本数据能否助力蛋白质设计任务尚未得到探索。
为了填补这一空白,来自加州大学伯克...
53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍

编辑丨&
微生物是驱动元素循环的引擎,它们分泌蛋白质以寻求生活环境。现阶段还缺乏有效的计算方法来研究分泌蛋白。表征分泌组的另一种方法是将现代机器学习工具与蛋白质组对海洋环境的进化适应变化相结合。
在这项研究中,维也纳大学(University of Vienna)与上海海洋大学的研究者识别并描述了海洋细胞外蛋白的...
为今年最火的机器人来场全球挑战赛:150万高额奖金,还有顶级硬件支持

ATEC2025 科技精英赛是由 ATEC 前沿科技探索社区主办,清华大学、浙江大学、西安交通大学、上海交通大学发起。本届赛事由香港中文大学、北京大学、北京师范大学顶尖学府联合蚂蚁集团共同承办的全球性智能科技竞技盛会。
本届赛事聚焦人工智能与机器人技术融合创新,设置软件算法与硬件设计双赛道,通过线上线下联动模式...
AI Agent来,传统BI危 | 量子位
AI Agent来,传统BI危
克雷西 2025-03-28 19:13:13 来源:量子位
国际BI巨头已转向AI Agent
在互联网时代,数据已成为企业发展的必经之路。
从电商平台的用户行为记录,到工业传感器的实时监测,数据渗透在商业活动的每个环节...
OpenAI的AI复现论文新基准,Claude拿了第一名

近年来,AI 正从科研辅助工具蜕变为创新引擎:从 DeepMind 破解蛋白质折叠难题的 AlphaFold,到 GPT 系列模型展现文献综述与数学推理能力,人工智能正逐步突破人类认知边界。
今年 3 月 12 日,Sakana AI 宣布他们推出的 AI Scientist-v2 通过了 ICLR 会议一个研讨会的同行评审过程。这是 AI 科学家写出的首篇通过同行评...
ICLR 2025 Spotlight | 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法

本文作者来自复旦大学、上海交通大学和上海人工智能实验室。一作江书洋为复旦大学和实验室联培的博二学生,目前是实验室见习研究员,师从上海交通大学人工智能学院王钰教授。本文通讯作者为王钰教授与张娅教授。
低秩适配器(LoRA)能够在有监督微调中以约 5% 的可训练参数实现全参数微调 90% 性能。然而,在 LoRA 训练...
视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知

在视觉问题解答(VQA)等多模态环境中,当前视觉自监督学习(SSL)的表现还比不上语言图像预训练(CLIP)。这种差距通常归因于语言监督引入的语义,尽管视觉 SSL 模型和 CLIP 模型通常在不同的数据上进行训练。
在最近的一项研究中,Yann LeCun、谢赛宁等研究者探讨了一个基本问题: 语言监督对于多模态建模的视觉表征预...
让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA

论文一作李靖瑶,香港中文大学博士生(DV Lab),师从贾佳亚教授。主要研究方向是大语言模型,包括模型预训练、后训练、推理优化。作者陈鹏光、夏彬等均为 DV Lab 成员。
大模型写代码早就是基操了,但让它写算法竞赛题或企业级系统代码,就像让只会煮泡面的人去做满汉全席 —— 生成的代码要么是 “铁...
OpenAI 3个月怒赚6个亿!我们拿GPT-4o整了个治愈系新闻

编辑 | 杨文
这波 GPT-4o 的「吉卜力」狂欢,让 OpenAI 大赚了一笔。
昨天,Sam Altman 发帖称,26 个月前 ChatGPT 刚发布时,用户增长速度已经非常快,五天内就新增了一百万用户,这在当时是一个非常「疯狂」的现象。
然而,现在的情况更加惊人,仅仅在一个小时之内,就新增了一百万用户。
为了「圈粉」,Sam Altman ...
一篇论文,看见百度广告推荐系统在大模型时代的革新

2025 年,生成式 AI 的发展速度正在加快。
我们见证了 DeepSeek R1,用强大的推理能力再次点燃 AI 智力增长的火箭。
在上个星期,OpenAI 给 GPT-4o 的一波图像生成更新又让全网陷入了梗图、甚至玩梗视频制造的火热氛围中。
用 GPT-4o 渲染过的《星际穿越》电影片段。
AI 的「想象力」一次又一次震撼着我们...
2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%

当 AI 翻开奥数题,CPU 也烧了!
还记得那些被奥数题折磨得彻夜难眠的日子吗?
当你在凌晨三点对着一道几何证明题抓耳挠腮、怀疑人生的时候,你可能会想:「要是有个超级大脑能帮我解决这些问题该多好啊!」
好消息:大模型解数学题的能力很强!坏消息:它们好像也被奥数折磨得不轻。
很多针对大型语言模型(LLMs)的数...
脑波解码延迟仅80毫秒,实时「意念对话」技术登Nature子刊

无法说话的人,现在可以通过大脑扫描的方式实时地用自己的声音说话了。整个过程没有延迟,也不需要打字,不用发出任何声音。
本周,脑机接口的最新研究在社交网络上引发了人们的热烈讨论,一位推特博主的帖子浏览量突破了 150 万。
先来看效果。视频中的受试者严重瘫痪,不能讲话。她的大脑活动被解码为目标句子,然后...
近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!

白泽琛,新加坡国立大学 Show Lab 博士生,他的研究方向主要包括视频理解和统一的多模态模型,在 CVPR、ICCV、NeurIPS、ICLR 等会议发表多篇文章;曾在 Amazon AI 担任 Applied Scientist,在 ByteDance、Baidu 担任 Research Intern。
兹海,新加坡国立大学 Show Lab Research Fellow,于北京大学获得博士学位,主要研...
元鼎智能完成近10亿元融资,携手Fluidra加速全球市场布局

近日,全球领先的无线泳池机器人公司元鼎智能宣布完成新一轮近 10 亿人民币的战略融资。本轮融资由全球泳池行业巨头 Fluidra 进行战略投资,云启资本作为新晋投资方加入,XVC、复星锐正、蜂巧资本等老股东持续增持。此次融资不仅为元鼎智能带来了资本上的有力保障,更重要的是,标志着元鼎智能正式打通全球泳池专业渠道...
Agent太火!这篇综述让你不把知识学杂了丨华东师大&东华大学出品 | 量子位

Agent太火!这篇综述让你不把知识学杂了丨华东师大&东华大学出品
衡宇 2025-03-27 14:32:47 来源:量子位
参数驱动 vs 参数无关
火,Agent可太火了!关于Agent的进展俯拾皆是,根本看不过来……
看过来——这篇综述可能能帮...
准确率达85%,苏大、大连理工开发多模态特征融合ML,预测工程纳米材料诱导的慢性损伤

编辑 | 白菜叶
纳米颗粒引起的慢性损伤(例如纤维化和致癌作用)引起了公众健康担忧,需要在危害识别中迅速评估。尽管计算机分析通常用于化学品风险评估,但由于纳米生物流体和纳米亚细胞器等多个界面的复杂相互作用,预测体内慢性纳米毒性仍然具有挑战性。
苏州大学、大连理工大学的研究人员开发了一个多模态特征融合...
预测精度达93%,个人电脑可部署,科学家开发Transformer新方法预测结合蛋白
编辑丨&
结合蛋白通过与特定分子(如 DNA、RNA 或肽)选择性相互作用来调节各种细胞过程,它们能以高特异性识别和结合靶分子,这使得它们在信号传导、转运和酶活性功能上有着至关重要的地位。
当前,用于鉴定蛋白质结合肽的传统方法效率低下且性价比极低,而基于序列的方法因过于狭隘地关注近端序列特征而忽略了结...
2024 AAAS Fellow名单出炉:华人学者刘威入选

近日,2024 AAAS Fellow 名单正式公布!
AAAS Fellow 是科学家、工程师和创新者中的杰出骨干,他们在研究、教学、技术、学术界、工业界和政府管理以及向公众传播和解释科学方面的卓越成就得到了各学科的认可。符合提名资格的候选人是那些在科学或应用发展方面做出杰出贡献的科学家,并且在提名年之前至少连续四年担任美...
细节厘米级还原、实时渲染,MTGS方法突破自动驾驶场景重建瓶颈

在自动驾驶领域,高精度仿真系统扮演着 “虚拟练兵场” 的角色。工程师需要在数字世界中模拟暴雨、拥堵、突发事故等极端场景,反复验证算法的可靠性。
然而,传统仿真技术往往面临两大难题:首先是视角局限,依赖单一轨迹数据,如一条固定路线的摄像头录像,重建的场景只能在有限视角内逼真,无法支持车辆 &l...
激活具身智能创新加速度,九章云极DataCanvas公司领航CEAI 2025中国具身智能大会

近日,CEAI 2025中国具身智能大会在京圆满举办。作为中国AI基础设施领军企业,九章云极DataCanvas公司以 “弹性算力+开发工具+智算云服务”的全栈技术布局惊艳亮相,直击具身智能企业在模型训练、算法迭代与场景落地中的核心痛点,加速普惠算力技术在具身智能领域的深度落地。
具身智能迈入深水...
Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent

刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径,实现了从手工 Agent 设计向端...
"计算机视觉被GPT-4o终结了"(狗头) | 量子位

“计算机视觉被GPT-4o终结了”(狗头)
梦晨 2025-03-29 16:48:02 来源:量子位
GPT-4o原生多模态图像生成更多玩法被开发出来
一夜之间,CV被大模型“解决”了(狗头)。
万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被...
自动学会工具解题,RL扩展催化奥数能力激增17%

在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。不过,当今的大模型在使用工具方面还存在一些局限,比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。
为了解决这些难题,来自上海交通大学、SII 和 GAIR 的研究团队提出了一种全新框架ToRL(Tool-Integrated...
硅基战队来袭,联想中国誓师大会宣布智能体矩阵已成
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)