
大模型结构化推理优势难复制到垂直领域!最新法律AI评估标准来了,抱抱脸评测集趋势第一
不圆 2025-06-05 16:20:28 来源:量子位
虽然LLM在推理类任务上进展显著,但在更为复杂与微妙的法律领域,这类模型的实际表现仍然存在很...
大神Karpathy炮轰复杂UI应用没有未来,Adobe首当其冲,网友:不提供文本交互,就是在阻挡AI浪潮 | 量子位
大神Karpathy炮轰复杂UI应用没有未来,Adobe首当其冲,网友:不提供文本交互,就是在阻挡AI浪潮
克雷西 2025-06-05 16:15:26 来源:量子位
还划分了四个“风险等级”△ ngmi是not gonna make it的缩写
克雷西 发自 凹非寺 量子位...
Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好 | 量子位

Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好
梦晨 2025-06-06 16:57:50 来源:量子位
超越二八法则
近期arxiv最热门论文,Qwen&清华LeapLab团队最新成果:
在强化学习训练大模型...
上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下 | 量子位
上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下
不圆 ...
让ChatGPT连读"A",直接崩溃到念广告词,网友:拿付费用户做测试呢? | 量子位

让ChatGPT连读“A”,直接崩溃到念广告词,网友:拿付费用户做测试呢?
十三 2025-06-02 12:23:59 来源:量子位
付费用户破如防
网友挺生气。
一位ChatGPT的付费用户在体验高级语音模式的过程中,遇到了让他惊掉下巴的事情——
本...
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了 | 量子位

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
西风 2025-06-03 16:30:55 来源:量子位
含35个基准测试的综合评估框架,覆盖22个子类别医疗任务
斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一!
歪国...
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文 | 量子位

5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
闻乐 2025-06-02 12:41:06 来源:量子位
这个对人类来说非常简单的问题,连GPT-4o这样级别的视觉语言大模型(VLMs)也可能答错。
究其...
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造 | 量子位

Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
一水 2025-06-01 12:51:34 来源:量子位
解码速度和吞吐量最高提升2倍
曾撼动Transformer统治地位的Mamba作者之一Tri Dao,刚刚带来新作——
提出两种专为推理“...
挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化 | 量子位

挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化
鱼羊 2025-06-01 12:57:36 来源:量子位
无需标注、抛弃复杂奖励设计
无需标注数据、无需繁琐奖励设计,只用10步就能见效——「熵最小化」或许比强化学习更适合大...
揭开大模型"伪遗忘",港理工等团队:结构不变就是没忘 | 量子位

揭开大模型“伪遗忘”,港理工等团队:结构不变就是没忘
鱼羊 2025-06-01 12:54:24 来源:量子位
表征空间分析揭示了“遗忘的可逆边界”
近年来,大语言模型(LLMs)的能力突飞猛进,但随之而来的隐私风险也逐渐浮出水面。
训练中...
首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升 | 量子位

首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升
闻乐 2025-06-02 12:50:27 来源:量子位
推理模型常常表现出类似自我反思的行为,但问题是——
这些行为是否真的能有效探索新策略呢?...
Claude团队打开大模型「脑回路」,开源LLM思维可视化工具来了 | 量子位

Claude团队打开大模型「脑回路」,开源LLM思维可视化工具来了
西风 2025-05-31 17:26:36 来源:量子位
网 友:归因图可能成为LLM研究的显微镜
Claude团队来搞开源了——
推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读...
斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创 | 量子位
斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创
克雷西 2025-05-31 11:49:49 来源:量子位
让AI“思考”产生更多想法,进而完成优化
好家伙,AI意外生成的内核(kernel),性能比...
陶哲轩转发!DeepMind开源「AI数学证明标准习题集」 | 量子位

陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
明敏 2025-05-31 12:06:13 来源:量子位
所有人都能加入共创
陶哲轩转发,AI搞数学证明的标准习题集来了!
DeepMind最新开源形式化数学猜想库——
猜想库收录了经典的形式化...
阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升 | 量子位
阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升
克雷西 2025-05-31 12:07:36 来源:量子位
兼容SFT、RL训练方法
通义实验室 投稿 量子位 | 公众号 QbitAI
为提升大模型“推理+搜...
通义灵码AI IDE上线,深度适配Qwen3,首创自动记忆功能 | 量子位

通义灵码AI IDE上线,深度适配Qwen3,首创自动记忆功能
鱼羊 2025-05-30 11:32:23 来源:量子位
面向复杂工程
就在刚刚,阿里云发布旗下首个AI原生的开发环境工具通义灵码AI IDE。
通义灵码AI IDE深度适配了最新的千问3大模型...
每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程 | 量子位

每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程
十三 2025-05-30 16:09:55 来源:量子位
万亿参数、万亿集群
现在,请大家一起数一下“1”、“2”。
OK,短短2秒钟时间,一个准万亿MoE大模型就已经吃透如何解一...
让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5% | 量子位

让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%
不圆 2025-06-04 17:21:02 来源:量子位
想象一下,你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊,需要记住每个房间里的物品特征、位置关...
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR | 量子位

1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
明敏 2025-05-31 12:12:28 来源:量子位
支持快速微调
MaskMark团队 投稿
量子位 | 公众号 QbitAI
给AI生成的作品打水印,让AIGC图像可溯源,已经成为行业共识。
问题...
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一 | 量子位

最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
十三 2025-05-30 16:21:39 来源:量子位
总量为1579道多轮简答题
5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!
豆包1.5·...
机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊 | 量子位

机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊
衡宇 2025-05-30 16:50:41 来源:量子位
挥拍速度12米/秒,与人类连续对打
来和机器狗一起运动不?你的羽毛球搭子来了!
无需人工协助,仅...
奖励是假的,能让Qwen提升25%性能却是真的! | 量子位
奖励是假的,能让Qwen提升25%性能却是真的!
鹭羽 2025-05-29...
英伟达再创历史纪录!Q1收入增长69%,数据中心贡献89% | 量子位

英伟达再创历史纪录!Q1收入增长69%,数据中心贡献89%
明敏 2025-05-29 15:33:59 来源:量子位
盘后股价跳涨
英伟达最新一季度财报出炉,不出所料,依旧亮眼。
总收入为441.1亿美元,环比增长12%,同比增长69%。
非GAAP毛利...
DeepSeek新版R1直追OpenAI o3!实测来了:"小版本升级"着实不小 | 量子位

DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
鱼羊 2025-05-29 09:57:24 来源:量子位
网友:开源的胜利
DeepSeek终于还是在端午节前来炸场了:
R1更新新版本DeepSeek-R1-0528,看名字你可能以为是个小版本...
鲲鹏昇腾开发者大会2025在北京成功举办 | 量子位

鲲鹏昇腾开发者大会2025在北京成功举办
十三 2025-05-25 16:41:17 来源:量子位
加速创新者创新
[中国,北京,2025年5月23日] 以“心怀挚爱,共绽光芒”为主题的鲲鹏昇腾开发者大会2025(KADC2025)在北京中关村国际创新中心成...
Claude 4破解困扰人类4年系统bug,30年码龄程序员200小时没搞定,GPT-4.1/Gemini-2.5也做不到 | 量子位

Claude 4破解困扰人类4年系统bug,30年码龄程序员200小时没搞定,GPT-4.1/Gemini-2.5也做不到
明敏 2025-05-28 14:53:44 来源:量子位
只需33个prompt+1次重启
30年码龄程序员4年都没搞定的bug,Claude Opus 4只用几个小时轻...
开源·开放·开创,2025张江具身智能开发者大会暨国际人形机器人技能大赛即将启幕 | 量子位

开源·开放·开创,2025张江具身智能开发者大会暨国际人形机器人技能大赛即将启幕
量子位的朋友们 2025-05-26 10:14:41 来源:量子位
构建人形机器人产业高地
5月29日,2025张江具身智能开发者大会暨国际人形机器人技能大赛将在...
多款AI应用重磅亮相:英特尔和微软举办 AI PC品鉴会 | 量子位

多款AI应用重磅亮相:英特尔和微软举办 AI PC品鉴会
十三 2025-05-27 19:51:52 来源:量子位
618预热季开启
2025年5月27日,北京——今天,英特尔联合微软和京东举办了“Windows 11 AI+ PC创新AI及游戏体验·618英特尔® 酷睿™ Ult...
AI项链?OpenAI首款硬件爆料,乔布斯爱将操刀,"像iPod Shuffle一样优雅" | 量子位

AI项链?OpenAI首款硬件爆料,乔布斯爱将操刀,“像iPod Shuffle一样优雅”
白交 2025-05-24 14:28:13 来源:量子位
奥特曼甚至已经抢先体验到了原型机
OpenAI和强纳肾合作首发AI硬件,很可能是——项链?!
才官宣合作没多久,...
出货195818台激光雷达重回第一!禾赛Q1交卷:机器人赛道出货猛增641%! | 量子位
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)