苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃
西风 ...
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距 | 量子位
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
白交 2025-06-07 13:24:01 来源:量子位
首个聚焦于高分辨率交通图(主要为地铁图)的多模态推理评测基准
近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在...
图灵奖得主Bengio:AI为了"活下去",对人类指令阳奉阴违 | 量子位
图灵奖得主Bengio:AI为了“活下去”,对人类指令阳奉阴违
白交 2025-06-07 13:22:17 来源:量子位
AGI到来时间窗口可能远比想象的短,甚至五年就可能实现
在智源大会现场,图灵奖得主Yoshua Bengio发表了题为“Avoiding catastr...
马斯克祸不单行!擎天柱负责人突然离职,特斯拉蒸发万亿市值 | 量子位
马斯克祸不单行!擎天柱负责人突然离职,特斯拉蒸发万亿市值
鹭羽 2025-06-07 13:50:21 来源:量子位
“特斯拉会赢,我向你保证。”
真是屋漏偏逢连夜雨!
就在特斯拉创下单日最大跌幅,市值蒸发1500亿美元(折合人民币约10784...
效果媲美GPT-4o,一键搞定各类视觉生成任务丨港科广字节全新框架 | 量子位
效果媲美GPT-4o,一键搞定各类视觉生成任务丨港科广字节全新框架
鹭羽 2025-06-07 13:54:16 来源:量子位
一套系统解决文生图、图生视频等所有视觉生成任务
图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻...
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research | 量子位
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research
梦晨 2025-06-06 15:59:00 来源:量子位
自主信息检索智能体WebDancer
能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。
通义实验室推出WebW...
OceanBase全面融入AI生态,首批接入60余家AI生态伙伴实现MCP对接 | 量子位
OceanBase全面融入AI生态,首批接入60余家AI生态伙伴实现MCP对接
十三 2025-06-06 15:35:07 来源:量子位
OceanBase在公布Data x AI战略后,首次对外透露战略落地进展
随着AI应用爆发,数据库作为底层设施正加速与上层AI生态...
4位图灵奖得主布道,2大冠军机器人登台,"AI春晚"果然又高又硬 | 量子位
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
白交 2025-06-06 21:55:28 来源:量子位
悟道系列模型发布
什么?人形机器人冠军们竟然同台了——
此前荣获半程马拉松长跑冠军天工、拳击冠军宇树G1,首次在智源大...
金融大模型升级决策平台!马上消费发布天镜3.0破解经验碎片化难题 | 量子位
金融大模型升级决策平台!马上消费发布天镜3.0破解经验碎片化难题
允中 2025-06-06 22:45:39 来源:量子位
不再仅依赖逻辑学习,而是深入挖掘企业中散落的隐性经验。
6月6日, 由中共重庆市委金融委员会办公室、重庆市商务委员...
大模型结构化推理优势难复制到垂直领域!最新法律AI评估标准来了,抱抱脸评测集趋势第一 | 量子位
大模型结构化推理优势难复制到垂直领域!最新法律AI评估标准来了,抱抱脸评测集趋势第一
不圆 2025-06-05 16:20:28 来源:量子位
虽然LLM在推理类任务上进展显著,但在更为复杂与微妙的法律领域,这类模型的实际表现仍然存在很...
大神Karpathy炮轰复杂UI应用没有未来,Adobe首当其冲,网友:不提供文本交互,就是在阻挡AI浪潮 | 量子位
大神Karpathy炮轰复杂UI应用没有未来,Adobe首当其冲,网友:不提供文本交互,就是在阻挡AI浪潮
克雷西 2025-06-05 16:15:26 来源:量子位
还划分了四个“风险等级”△ ngmi是not gonna make it的缩写
克雷西 发自 凹非寺 量子位...
Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好 | 量子位
Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好
梦晨 2025-06-06 16:57:50 来源:量子位
超越二八法则
近期arxiv最热门论文,Qwen&清华LeapLab团队最新成果:
在强化学习训练大模型...
上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下 | 量子位
上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下
不圆 ...
让ChatGPT连读"A",直接崩溃到念广告词,网友:拿付费用户做测试呢? | 量子位
让ChatGPT连读“A”,直接崩溃到念广告词,网友:拿付费用户做测试呢?
十三 2025-06-02 12:23:59 来源:量子位
付费用户破如防
网友挺生气。
一位ChatGPT的付费用户在体验高级语音模式的过程中,遇到了让他惊掉下巴的事情——
本...
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了 | 量子位
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
西风 2025-06-03 16:30:55 来源:量子位
含35个基准测试的综合评估框架,覆盖22个子类别医疗任务
斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一!
歪国...
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文 | 量子位
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
闻乐 2025-06-02 12:41:06 来源:量子位
这个对人类来说非常简单的问题,连GPT-4o这样级别的视觉语言大模型(VLMs)也可能答错。
究其...
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造 | 量子位
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
一水 2025-06-01 12:51:34 来源:量子位
解码速度和吞吐量最高提升2倍
曾撼动Transformer统治地位的Mamba作者之一Tri Dao,刚刚带来新作——
提出两种专为推理“...
挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化 | 量子位
挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化
鱼羊 2025-06-01 12:57:36 来源:量子位
无需标注、抛弃复杂奖励设计
无需标注数据、无需繁琐奖励设计,只用10步就能见效——「熵最小化」或许比强化学习更适合大...
揭开大模型"伪遗忘",港理工等团队:结构不变就是没忘 | 量子位
揭开大模型“伪遗忘”,港理工等团队:结构不变就是没忘
鱼羊 2025-06-01 12:54:24 来源:量子位
表征空间分析揭示了“遗忘的可逆边界”
近年来,大语言模型(LLMs)的能力突飞猛进,但随之而来的隐私风险也逐渐浮出水面。
训练中...
首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升 | 量子位
首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升
闻乐 2025-06-02 12:50:27 来源:量子位
推理模型常常表现出类似自我反思的行为,但问题是——
这些行为是否真的能有效探索新策略呢?...
NEW Claude团队打开大模型「脑回路」,开源LLM思维可视化工具来了 | 量子位
Claude团队打开大模型「脑回路」,开源LLM思维可视化工具来了
西风 2025-05-31 17:26:36 来源:量子位
网 友:归因图可能成为LLM研究的显微镜
Claude团队来搞开源了——
推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读...
NEW 斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创 | 量子位
斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创
克雷西 2025-05-31 11:49:49 来源:量子位
让AI“思考”产生更多想法,进而完成优化
好家伙,AI意外生成的内核(kernel),性能比...
NEW 陶哲轩转发!DeepMind开源「AI数学证明标准习题集」 | 量子位
陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
明敏 2025-05-31 12:06:13 来源:量子位
所有人都能加入共创
陶哲轩转发,AI搞数学证明的标准习题集来了!
DeepMind最新开源形式化数学猜想库——
猜想库收录了经典的形式化...
阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升 | 量子位
阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升
克雷西 2025-05-31 12:07:36 来源:量子位
兼容SFT、RL训练方法
通义实验室 投稿 量子位 | 公众号 QbitAI
为提升大模型“推理+搜...
通义灵码AI IDE上线,深度适配Qwen3,首创自动记忆功能 | 量子位
通义灵码AI IDE上线,深度适配Qwen3,首创自动记忆功能
鱼羊 2025-05-30 11:32:23 来源:量子位
面向复杂工程
就在刚刚,阿里云发布旗下首个AI原生的开发环境工具通义灵码AI IDE。
通义灵码AI IDE深度适配了最新的千问3大模型...
每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程 | 量子位
每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程
十三 2025-05-30 16:09:55 来源:量子位
万亿参数、万亿集群
现在,请大家一起数一下“1”、“2”。
OK,短短2秒钟时间,一个准万亿MoE大模型就已经吃透如何解一...
让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5% | 量子位
让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%
不圆 2025-06-04 17:21:02 来源:量子位
想象一下,你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊,需要记住每个房间里的物品特征、位置关...
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR | 量子位
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
明敏 2025-05-31 12:12:28 来源:量子位
支持快速微调
MaskMark团队 投稿
量子位 | 公众号 QbitAI
给AI生成的作品打水印,让AIGC图像可溯源,已经成为行业共识。
问题...
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一 | 量子位
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
十三 2025-05-30 16:21:39 来源:量子位
总量为1579道多轮简答题
5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!
豆包1.5·...
机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊 | 量子位
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)