
本文由纽约州立大学布法罗分校的田运杰,David Doermann和中国科学院大学的叶齐祥合作完成。田运杰是布法罗大学博士后,David Doermann是布法罗大学教授、IEEE Fellow, 叶齐祥是中国科学院大学教授。三位作者长期从事计算机视觉、机器感知等方向的研究。
YOLO 系列模型的结构创新一直围绕 CNN 展开,而让 transformer ...
干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静

具身智能领域又传出新消息。
来自挪威的机器人创业公司 1X 于上周五发布了最新家用机器人 Neo Gamma。这款人形机器人将接替去年 8 月首次亮相的 Neo Beta。与之前的产品一样,Neo Gamma 是一款专为家庭环境测试而设计的原型机。它可以完成煮咖啡、洗衣服和用吸尘器清洁等一系列家务。
(来源:机器之心)
1X 表示,这款双足...
地平线高阶智驾北京市区实测:全程零接管,轻松应对复杂路况

说到国内智能驾驶,地平线是个一定绕不过去的名字。
去年 4 月,地平线正式发布了新一代智能驾驶方案征程 6 系列,该公司基于征程 6P 打造了 HSD(Horizon SuperDrive)全场景智能驾驶解决方案,首发了多项技术,刷新高阶智驾的天花板。
基于征程 6 系列,地平线官宣了多家批量合作车企及品牌,正在大规模量产落地。地平...
一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

本文来自南京大学计算机学院软件研究所徐经纬DeepEngine团队,作者为徐经纬准聘助理教授、硕士生赖俊宇和黄云鹏。目前该论文已被 ICLR2025 接收。
在大语言模型领域中,预训练 + 微调范式已经成为了部署各类下游应用的重要基础。在该框架下,通过使用搭低秩自适应(LoRA)方法的大模型参数高效微调(PEFT)技术,已经...
马斯克"地表最强"Grok 3炸场,竞技场首超1400分 | 量子位

马斯克“地表最强”Grok 3炸场,竞技场首超1400分
十三 2025-02-18 15:12:26 来源:量子位
超300万人次围观
刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)!
一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:
...
DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升 | 量子位
DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
克雷西 2025-02-17 16:59:27 来源:量子位
非代码/数学类推理任务也有提升
用代码训练大模型思考,其他方面的推理能力也能提升。
DeepSeek团队最新研究,利...
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
一水 2025-02-17 12:14:50 来源:量子位
说话方式成精了
GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。
除了数学(第6),还在多个单项上拿下第一...
无问芯穹领航铸造模速空间算力生态平台,以充沛算力助造全球最大人工智能孵化器

2月21日,2025年全球开发者先锋大会(2025 GDC)模速空间专场发布会现场,在上海市徐汇区指导下,徐汇区委常委、副区长俞林伟,上海市经济信息化委基础设施管理处处长祁超出席见证,上海大模型生态发展有限公司董事长杨晶晶,上海无问芯穹智能科技有限公司总经理曾书霖,上海智能算力科技有限公司商务生态中心总监陈雪晖...
阶跃星辰举办生态开放日,智能终端 Agent 成最大亮点!

2月21日,阶跃星辰在上海成功举办首届Step UP生态开放日,携手来自各行各业的重量级合作伙伴,集中展示了大模型技术赋能下的丰富应用场景与创新体验。阶跃星辰首先重点阐释了在智能终端Agent领域的布局,并宣布与吉利汽车集团、OPPO、智元机器人等企业深化合作关系。同时,还展示了在金融财经、内容创作、新零售、数字人...
慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统

编辑 | ScienceAI
OpenAI o1、DeepSeek R1 等模型成功实现了在数学、编程等领域的智能慢思考推理,通过自我反思和修正实现了运行时的性能外推。
然而,在医疗领域,仍然很少有模型可以实现具有长链慢思考的推理。目前医疗领域的推理模型大多是通过在医疗考试题上对 OpenAI 系列的模型进行蒸馏,并没有考虑推理过程的可...
清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1

编辑 | ScienceAI
2025年初,DeepSeek给全球引发了AI大模型的新一轮热议。多家市场咨询公司指出,在DeepSeek的影响下,从大模型供应商到基础设施和平台供应商的整个AI产业生态都掀起了一波「新浪潮」。DeepSeek R1以其强大的推理能力,为各行各业带来了智能化升级新机遇。而生物医药领域,也正在迎来它的DeepSeek时刻。...
DeepSeek冲击之下,大模型六小强如何「回应」? | 量子位

DeepSeek冲击之下,大模型六小强如何「回应」?
衡宇 2025-02-16 14:06:04 来源:量子位
东方深海巨鲸,搅动全球大模型风云
马上整整1个月了!
这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。
中外大厂、初创公...
从概念到应用,清华团队开发DeepTFBU工具包助力基因表达精准调控

编辑 | 萝卜皮
增强子通过与转录因子 (TF) 相互作用,在各种生物过程中充当基因表达的关键调节器。虽然转录因子结合位点 (TFBS) 被广泛认为是 TF 结合和增强子活性的关键决定因素,但其周围背景序列的重要作用仍有待定量表征。
清华大学的研究团队提出了转录因子结合单元(transcription factor binding unit,TFBU)概...
Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek | 量子位

Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek
十三 2025-02-15 12:24:24 来源:量子位
DeepSeek的含金量还在上升
AI搜索“老大哥”Perplexity,刚刚也推出了自家的Deep Research——
随便给个话题...
DeepSeek官方推荐:R1要这样设置 | 量子位

DeepSeek官方推荐:R1要这样设置
十三 2025-02-15 12:29:38 来源:量子位
一共四项内容
家人们,咱们到底该如何部署DeepSeek-R1,才能体验最佳啊?
对于这个问题,DeepSeek官方发话了:
DeepSeek推荐的设置非常简单,只有四...
微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666 | 量子位

微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666
衡宇 2025-02-16 12:37:12 来源:量子位
AI搜索格局一夜剧变
一睁眼,微信证实:
已正式接入DeepSeek-R1,还是满血版!
使用路径非常简单:打开微信——点击搜...
出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了

DeepSeek-R1 非常热门,而在其公布的训练配方中,GRPO(Group Relative Policy Optimization)非常关键,是 DeepSeek-R1 核心的强化学习算法。
PPO 与 GRPO 的对比,来自论文《DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models》
相较于 PPO,GRPO 去掉了价值模型,...
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

世界模型(World Model)作为近年来机器学习和强化学习的研究热点,通过建立智能体对其所处环境的一种内部表征和模拟,能够加强智能体对于世界的理解,进而更好地进行规划和决策。在强化学习领域中,世界模型通常被建模为一个神经网络,通过历史状态和动作,预测未来可能出现的状态。其中,Dreamer 算法在多种模拟环境的...
全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍

用 AI 提高 AI 的效率,它们就能变得像人类大脑一样高效?
我们的大脑只用了 20 瓦的能量就能完成复杂思考,而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。这种差距如何缩小?
日本 AI 初创公司 Sakana AI 团队提出了一个大胆的愿景:利用 AI 本身来优化 AI。他们开发的「AI CUDA 工程师」是这一理念的具体...
大模型扩展新维度:Scaling Down、Scaling Out

本文由悉尼大学计算机学院王云柯,李言蹊和徐畅副教授完成。王云柯是悉尼大学博士后,李言蹊是悉尼大学三年级博士生,徐畅副教授是澳洲ARC Future Fellow,其团队长期从事机器学习算法、生成模型等方向的研究。
近年来, Scaling Up 指导下的 AI 基础模型取得了多项突破。从早期的 AlexNet、BERT 到如今的 GPT-4,模...
踹了OpenAI后,Figure光速发布具身大模型Helix,能力前所未有、创多项第一

在 2 月份突然宣布终结与 OpenAI 合作之后,知名机器人初创公司 Figure AI 在本周四晚公开了背后的原因:他们已经造出了自己的通用具身智能模型 Helix。
Helix 是一个通用的视觉 - 语言 - 动作(VLA)模型,它统一了感知、语言理解和学习控制,以克服机器人技术中的多个长期挑战。
Helix 创造了多项第一:
全身控制:...
两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?

刚刚过去的春节,DeepSeek-R1推理大模型引爆了国内外 AI 社区,并火出了圈。最近,各个行业又掀起了接入 DeepSeek 的狂潮,大家唯恐落后于人。
北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读,也是此前o1 解读(北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化...
再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件

一直以来,研究者普遍认为,去噪扩散模型要想成功运行,噪声条件是必不可少的。
而大神何恺明的一项最新研究,对这个观点提出了「质疑」。
「受图像盲去噪研究的启发,我们研究了各种基于去噪的生成模型在没有噪声调节的情况下的表现。出乎我们意料的是,大多数模型都表现出了优美的退化,它们甚至在没有噪声条件的情...
史上最惊悚的机器人,看了让人睡不着,网友:像新鲜的尸体在抽搐

同是机器人,命运却各有各的不同。
有的机器人出生不久就站上了春晚舞台给全国人民送祝福,而有的机器人刚来到人类世界五分钟就选择了上吊。
如果是半夜打开这篇文章,已经有被吓到的网友当了你的嘴替:「像新鲜的尸体一样抽搐。」
「现在就烧掉它,简直就是噩梦!」
「都已经刷到这么恐怖的玩意儿了,是时候放下手...
2025年度国际挑战赛正式启动,期待你的加入!

•新挑战
○全新具身智能及自动驾驶赛道,全方位覆盖相关领域最新、最热话题,共同探讨具身智能核心问题。
•高奖金
○总奖池高达 10 万美元,单赛道最高奖金(创新奖 + 冠军)可达 1.5 万美元。
2025年度国际挑战赛旨在通过全球合作促进具身智能与自动驾驶领域的发展。赛事汇聚全球顶尖团队,推动创新实践。挑战...
地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

AI好好用报道
编辑:Sia
好消息!好消息!
堆了 20 万张 GPU、号称「地表最强」大模型 Grok-3 已经可用啦。
这两天,网友们已陆续晒出截图:作为非付费用户,我们昨天只能旁观 Grok 3,今儿突然可以免费体验部分功能。
但,次数有限 !
由此看来,Grok 3 ( beta )提供「三件套」服务(除了基础模型)。
Thin...
全球首家!联想将率先在AIPC端侧本地部署DeepSeek大模型

2025年2月20日,联想集团公布截至2024年12月31日的第三财季业绩,其中营收1351亿人民币,同比增长20%;净利润49.8亿人民币,同比增长达106%。在公布业绩的同时,联想集团宣布,将在AI PC端侧本地部署DeepSeek大模型,这将成为全球首家端侧部署该大模型的AI PC品牌。
小天个人智能体已全面接入DeepSeek-R1联网满血版大模...
钉钉AI企业搜索面向所有用户免费开放

2 月 20 日,钉钉宣布其 AI 企业搜索向所有用户免费开放,同时新增支持慢思考模式和全网搜索,支持移动端、桌面端 7.6.45 及以上钉钉版本。
自钉钉365会员权益上线以来,钉钉AI企业搜索已经帮助了大量个人用户构建动态的知识网络。它借助通义大模型的理解、推理和生成能力,可实现自然语言查询信息,并对钉钉内的用户自...
重磅发现!DeepSeek R1方法成功迁移到视觉领域,多模态AI迎来新突破!

嘿,各位开发小伙伴,今天要给大家安利一个全新的开源项目 ——VLM-R1!它将 DeepSeek 的 R1 方法从纯文本领域成功迁移到了视觉语言领域,这意味着打开了对于多模态领域的想象空间!
这个项目的灵感来自去年 DeepSeek 开源的那个 R1 方法,靠着 GRPO(Generative Reward Processing Optimization)强化学习方...
预测所有物种DNA、RNA、蛋白质的形式和功能,Arc、斯坦福、NVIDIA发布最大AI生物模型Evo2
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)