
大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题
梦晨 2025-04-02 17:08:50 来源:量子位
将强化学习训练扩展到医学、化学、法律、心理学、经济学等多学科
一个7B奖励模型搞定全学科,大模型强...
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek

万万没想到。Meta 选择在周六日,发布了最新 AI 模型系列 ——Llama 4,这是其 Llama 家族的最新成员。
该系列包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。所有这些模型都经过了大量未标注的文本、图像和视频数据的训练,以使它们具备广泛的视觉理解能力。
Meta GenAI 负责人 Ahmad Al-Dahle...
从0到1玩转MCP:AI的「万能插头」,代码手把手教你!

在人工智能飞速发展的今天,LLM 的能力令人叹为观止,但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」,无法直接触及实时信息或外部工具。
2024 年 11 月,Anthropic 推出了开源协议 MCP(Model Context Protocol,模型上下文协议),旨在为 AI 模型与外部数据源和工具之间的交互提供一个通用、...
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和...
大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳

大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。密歇根大学安娜堡分校的研究团队开发了一个名为「RoboCrafter-QA」的基准测试,用于评估 LLM 在软体机器人设计中的表现,探索了这些模型能否担任机器人设计的「自然选择器」角色。
这项研究为 AI 辅助软体机器人设计开辟了崭新道路,有望实现更自...
全网都在猜,这些视频是不是字节AI生成的:该跟动捕说再见了?

在 GPT-4o 的风到处吹时,X 平台(原推特)上有好多带视频的帖子爆了。到底是什么引来了一百万的浏览量?
没错,是玛丽莲・梦露「活了过来」。她不仅能够语音 — 口型保持一致,动作也能复刻参考示例。在大幅度的手臂摆动时,也不会出现严重的变形或虚影。
网友瞳孔震惊,「别告诉我,这些都是 AI 生成的......」
...
CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

文生图 or 图生文?不必纠结了!
人类大脑天然具备同时理解和创造视觉与语言信息的能力。一个通用的多模态大语言模型(MLLM)理应复刻人类的理解和生成能力,即能够自如地同时处理与生成各种模态内容,实现多模态交互,这也是向通用人工智能(AGI)迈进的关键挑战之一。最近爆火的新版 GPT4o 与 Gemini-2.0 在图文交互...
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
但最近,这种印象正被打破。更多的研究者开始探索在图像生成中引入自回归(如 GPT-4o),在语言生成中引入扩散。
香港大学和华为诺亚方舟实验室的一项研究就是其...
微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码

1975 年 4 月 4 日,比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。到今天,半个世纪过去了,微软早已成长为一家超级科技巨头。
近日,比尔・盖茨亲自撰文回忆了微软的诞生和他们的第一笔业务,同时还通过一份 157 页的 PDF 文件分享了他们为这项业务编写的 Altair BASIC 源代码。
顺带一提,比尔...
三思而后行,让大模型推理更强的秘密是「THINK TWICE」?

近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。OpenAI 的 o1 系列与 DeepSeek 的 R1 模型已展示出显著的推理能力提升。然而,在实现高性能的同时,复杂的训练策略、冗长的提示工程和对外部评分系统的依赖仍是现实挑战。
...
CVPR 2025 | GaussianCity: 60倍加速,让3D城市瞬间生成

想象一下,一座生机勃勃的 3D 城市在你眼前瞬间成型 —— 没有漫长的计算,没有庞大的存储需求,只有极速的生成和惊人的细节。
然而,现实却远非如此。现有的 3D 城市生成方法,如基于 NeRF 的 CityDreamer [1],虽然能够生成逼真的城市场景,但渲染速度较慢,难以满足游戏、虚拟现实和自动驾驶模拟对实时性...
GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了 | 量子位

GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
梦晨 2025-03-31 11:54:41 来源:量子位
OpenAI团队为此一直在熬夜
GPT-4o玩家太疯狂,奥特曼紧急呼吁别再生成图片了:OpenAI团队为此一...
周光:VLA模型将成智能驾驶体验颠覆性拐点 | 量子位

周光:VLA模型将成智能驾驶体验颠覆性拐点
西风 2025-03-31 18:36:19 来源:量子位
颠覆性体验,正在到来。
3月30日,在百人会智能汽车创新技术与产业论坛上,元戎启行CEO周光表示已完成VLA模型的道路测试,并将基于VLA模型打...
摸DeepSeek过河也得自身硬! 想开后的文小言,真香! | 量子位

摸DeepSeek过河也得自身硬! 想开后的文小言,真香!
西风 2025-03-31 16:31:49 来源:量子位
多模型融合玩出新花样
刚刚,百度文小言全面升级了。
基于多模型的能力,文小言升级了包括全新大语音模型、图片问答等在内的一系列...
具身前沿,智领未来!第二届中国具身智能大会成功举办 | 量子位

具身前沿,智领未来!第二届中国具身智能大会成功举办
量子位的朋友们 2025-03-30 16:30:46 来源:量子位
擘画具身智能发展新蓝图
在人工智能技术持续突破的浪潮中,具身智能正从单点突破迈向产业协同,开启生态化发展新阶段...
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP | 量子位

免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP
一水 2025-04-01 12:43:23 来源:量子位
一手实测来了
借助新版DeepSeek-V3,任何人现在可以一次性创建任何应用或游戏了——
而且是一边开发一边看效果的那种。
在...
ChatGPT会员北美大学生全免费,持续一个月,AI帮你过期末考试

本周五凌晨,OpenAI CEO 山姆・奥特曼宣布了一个令人兴奋的消息。
从现在开始,ChatGPT Plus(原价每月 20 美元)面向美国和加拿大的大学生免费了,时长持续一个月。只要是美国和加拿大授予学位学校的全日制和非全日制学生均有资格享受此优惠。
OpenAI 使用 SheerID 验证系统来验证学生的身份,具体可参看:https://hel...
Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer

当上下文包含大量 Token 时,如何在忽略干扰因素的同时关注到相关部分,是一个至关重要的问题。然而,大量研究表明,标准注意力在这种情况下可能会出现性能不佳的问题。
标准多头注意力的工作原理是使用点积比较当前查询向量与上下文 Token 对应的键向量的相似性。与查询相似的关键字会获得更高的注意力权重,随后其值向...
创新,责任,领导力|人工智能领军人才发展论坛成功举办 | 量子位

创新,责任,领导力|人工智能领军人才发展论坛成功举办
量子位的朋友们 2025-03-30 16:41:07 来源:量子位
推动人工智能领域的蓬勃发展
3月29日,2025年中关村论坛年会人工智能主题日专场论坛、2025“智领未来”北京人工智能系...
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?

这会是 DeepSeek R2 的雏形吗?本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。
当前,强化学习(RL)已广泛应用于大语言模型(LLM)的后期训练。最近 RL 对 LLM 推理能力的激励表明,适当的学习方法可以实现有效的推理时间可扩展性。RL 的一个关键挑战是在可验证问题或人工规则之外的各个领域获得 L...
思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套

自去年以来,我们已经习惯了把复杂问题交给大模型。它们通常会陷入「深度思考」,有条不紊地展示思维链过程,并最终输出一份近乎完美的答案。
对于研究人员来说,思考过程的公开可以帮助他们检查模型「在思维链中说过但在输出中没有说」的事情,以便防范欺骗等不良行为。
但这里有一个至关重要的问题:我们真的能相信模...
250多篇论文,上海AI Lab综述推理大模型高效思考

最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。
但随之而来的是一个日益严重的问题:它们太能「说」了!生成的推理过程往往充斥着冗余信息(比如反复定义)、对简单问题过度分析,以及对难题的探索浅尝辄...
多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限

第一作者为哈尔滨工业大学(深圳)博士生王霄和华为大模型研究员佀庆一,该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成,佀庆一的研究方向为多模态理解、LLM post-training和高效推理。
随着视频内容的重要性日益提升,如何处理理解长视频成为多模态大模型面临的关键挑战。长视频理解能力,对...
3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST | 量子位

3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
衡宇 2025-03-28 18:30:46 来源:量子位
zhan ji s
3D生成版DeepSeek再上新高度!
国产、易用、性能强且开源——
新模型一露面就刷新SOTA,并且第一时间加入开源全家桶...
实测完即梦3.0,我后悔大学选了设计专业……

编辑 | 杨文
自从 GPT-4o 出了「吉卜力」滤镜后,社交媒体上简直是人均宫崎骏。
而这股「吉卜力热」也让 ChatGPT 圈了一大波粉,甚至一小时狂揽百万用户。
友商们也坐不住了。
Midjourney CEO 跳出来一顿阴阳,还放出自家模型即将更新至 V7 的消息。
Ideogram 则直接掏出了最新模型 3.0,并向所有用户免费开放。
就...
速来!机器之心ICLR 2025新加坡现场人才晚宴开启报名

2025 年开年,以 DeepSeek R1 为代表的推理大模型开启炸场模式。在短短数月内,DeepSeek 凭借其卓越的性能和广泛的适用性,迅速在人工智能领域掀起了一场技术革新的浪潮。
而后,国内外各大科技公司、科研机构迅速跟进,新研究、新应用不断涌现。AI 的发展速度似乎已经快进到了以周甚至以天为单位。
面对发展如此迅速的...
DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型

上海交通大学与 SII 联合发布了 DeepResearcher,代码训练框架完全开源。这是首个在真实网络环境中通过强化学习训练的 AI 研究模型。
随着大型语言模型(LLMs)推理能力的飞速发展,OpenAI、Google 和 XAI 等科技巨头纷纷推出了备受欢迎的 Deep Research 产品。这些工具能帮助用户整合海量网络信息,解决复杂问题,大大...
仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架

编辑丨coisini
机器学习在蛋白质发现领域展现出深远的潜力,相关工具已快速应用于科学流程的辅助与加速。当前,AI 辅助的蛋白质设计主要利用蛋白质的序列和结构信息,而为了描述蛋白质的高级功能,人们以文本形式整理了海量知识,这种文本数据能否助力蛋白质设计任务尚未得到探索。
为了填补这一空白,来自加州大学伯克...
53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍

编辑丨&
微生物是驱动元素循环的引擎,它们分泌蛋白质以寻求生活环境。现阶段还缺乏有效的计算方法来研究分泌蛋白。表征分泌组的另一种方法是将现代机器学习工具与蛋白质组对海洋环境的进化适应变化相结合。
在这项研究中,维也纳大学(University of Vienna)与上海海洋大学的研究者识别并描述了海洋细胞外蛋白的...
为今年最火的机器人来场全球挑战赛:150万高额奖金,还有顶级硬件支持
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)