阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明

阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明
就在 DeepSeek V3「小版本更新」后的几个小时,阿里通义千问团队也开源了新模型。 择日不如撞日,Qwen2.5-VL-32B-Instruct就这么来了。 相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改进: 回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好。 数学推理能力:复杂数学问...
2025年03月25日,11时06分 OpenAI 阅读 41 views 次

一文读懂MCP与AI工具生态的未来,它会是AI智能体的「万能插头」吗?

一文读懂MCP与AI工具生态的未来,它会是AI智能体的「万能插头」吗?
如今,随着基础模型变得越来越智能,人们越来越需要有一个用于执行、数据获取和工具调用的标准接口。 自 OpenAI 在 2023 年发布函数调用功能以来,AI 智能体与外部工具、数据和 API 的交互能力却日益碎片化:开发者需要为智能体在每个系统中的操作和集成实现特定的业务逻辑。 显然,执行、数据获取和工具调用需要一个...
2025年03月25日,11时26分 OpenAI 阅读 28 views 次

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet
昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main (来源:机器之心) 不过,DeepSeek-V3-0324 没有公布详细的模型卡。我们只能看到它的参数为 685...
2025年03月25日,11时41分 OpenAI 阅读 23 views 次

棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈

棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈
当棋盘变成战场,当盟友暗藏心机,当谈判需要三十六计,AI 的智商令人叹息! 近日,来自普林斯顿和德州大学奥斯丁分校最新评测基准 SPIN-Bench,用一套 "组合拳" 暴击了大模型的软肋。研究显示,即便是 o1、o3-mini、DeepSeek R1、GPT-4o、Claude 3.5 等顶尖大模型,在涉及战略规划和社会推理的复杂任务中集...
2025年03月25日,11时46分 OpenAI 阅读 21 views 次

小米汽车首曝自动驾驶研究:相机和LiDAR联合重建框架Uni-Gaussians

小米汽车首曝自动驾驶研究:相机和LiDAR联合重建框架Uni-Gaussians
论文的主要作者来自香港科技大学、小米汽车和华中科技大学。论文的共同第一作者为香港科技大学博士后研究员袁子康、小米汽车算法工程师蒲粤川、罗鸿城。论文作者还包括小米汽车世界模型负责人孙海洋。通讯作者是华中科技大学的教授杨欣。 在自动驾驶技术商业化落地的关键阶段,高质量仿真系统成为行车安全验证的核心基...
2025年03月25日,11时10分 OpenAI 阅读 31 views 次

统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割

统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割
本文作者来自北京大学和阿里通义万相实验室。其中论文第一作者是汤昊,北京大学 2022 级博士生,目前主要关注统一的多模态任务建模算法。指导教授是王立威老师,北京大学智能学院教授,曾获 NeurIPS 2024 最佳论文奖、ICLR 2023 杰出论文奖及 ICLR 2024 杰出论文提名奖。 无需 SAM 和 Grounding DINO,MLLM 也能做分割...
2025年03月25日,11时55分 OpenAI 阅读 62 views 次

国内首个对话式应用开发平台「秒哒」上线!百度多智能体协作让创意直接落地

国内首个对话式应用开发平台「秒哒」上线!百度多智能体协作让创意直接落地
3 月 24 日,百度宣布国内首个 “对话式” 应用开发平台秒哒正式全量上线,用户可以前往首页体验 H5 和网站开发。在去年 11 月的百度世界大会上,秒哒首次发布亮相,并率先提出 “多智能体协同” 概念,引发行业关注,发布即吸引超 20000 家企业申请内测。 作为国内首个对话式应用开发平台,秒哒以 "无代码编程 + 多智能体...
2025年03月24日,22时36分 OpenAI 阅读 36 views 次

全天下的骗子,都在用AI「围猎」老年人

全天下的骗子,都在用AI「围猎」老年人
编辑 | 杨文 若干年前,社会上流行过一阵「骗子」下乡。 一群不知打哪来的小青年,在村里支个摊,一大早就拿着大喇叭卖力地吆喝。 第一天是:免费领鸡蛋;第二天是:免费送眼贴。 他们一口一个「叔叔阿姨」、「大爷大妈」,叫的那是一个亲热。 毫不意外,摊子前每次都能挤满爱占点小便宜的中老年人。 直到第三天,他们...
2025年03月24日,17时12分 OpenAI 阅读 40 views 次

“张江引擎 人形启程”,AI 机器人开启上海进化新范式

“张江引擎 人形启程”,AI 机器人开启上海进化新范式
当AI从虚拟算法跃入物理世界,机器人正以技术攻关、产品迭代、场景落地为着力点,为上海塑造现代化产业体系提供重要支撑。 在张江机器人谷这片创新热土上,青龙机械臂在产线精准起舞,开普勒物流机器人走出仓库化身“物流小哥”,傅利叶机器人的CityWalk展现人机共生的温暖可能,智元学霸解码AI进化…&h...
2025年03月24日,16时50分 OpenAI 阅读 29 views 次

科学家们正利用机器学习从数千种旧药中寻找新的治疗方法

科学家们正利用机器学习从数千种旧药中寻找新的治疗方法
编辑 | 萝卜皮 药物再利用,即将市面上现有药物重新定位用于治疗其他疾病,这为罕见病患者带来了曙光。 美国国立卫生研究院(National Institutes of Health)将罕见病定义为在美国影响少于 20 万人的疾病。但有数千种罕见病,总共影响了数千万美国人和全球数亿人。 然而,超过 90% 的罕见病没有获批的治疗方法,大型制...
2025年03月24日,14时25分 OpenAI 阅读 32 views 次

搜索效率提升4倍,南大提出基于对称性原理的晶体结构预测方法

搜索效率提升4倍,南大提出基于对称性原理的晶体结构预测方法
编辑 | ScienceAI 晶体结构预测(Crystal Structure Prediction, CSP)是一个不断发展的领域,旨在通过最少的先验信息来识别晶体结构。尽管各种 CSP 算法已经取得了一定的成功,但其实际应用仍然受到限制,尤其是在处理大型复杂系统时。 提高 CSP 效率的方法多种多样。近年来,一个主流方向是通过用机器学习势(Machine...
2025年03月24日,14时26分 OpenAI 阅读 38 views 次

首个评估MLLMs对地质图理解的基准集,以及专为地质图理解设计的Agent

首个评估MLLMs对地质图理解的基准集,以及专为地质图理解设计的Agent
编辑 | ScienceAI 地质图作为地质科学的核心工具,不仅揭示了地球地下及地表结构的关键信息,还在灾害预警、矿产资源勘探、工程建设以及环境保护等多个领域有着广泛的应用。 例如,在灾害预警中,地质图有助于预测和防范如地震、滑坡等地质灾害;在矿产资源勘探中,矿产地质图可以分析研究矿床形成的地质背景、成矿条...
2025年03月24日,14时42分 OpenAI 阅读 37 views 次

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。 在众多非 Transformer 架构中,Mamba 无疑是声量较大且后续发展较好的一个。然而,与最初发布时那种仿佛「水火不容」的局面不同,最近一段时间,这两种架构似乎正在走向融合。 上周五,腾讯宣布推出自研深度思考模型「混元 T1」正式版,这是一个能秒回...
2025年03月24日,14时22分 OpenAI 阅读 46 views 次

为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need

为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need
我们知道,一个 RLHF 算法是否成功的一大关键在于其奖励模型(RM)的质量。但是,我们应该如何衡量 RM 的质量呢?近日,普林斯顿大学一个研究团队发现,如果仅用准确度来衡量 RM 的质量,可能无法完全体现一个奖励模型作为有效教师的特性。为此,他们选择了从优化角度来研究这个问题。 论文标题:What Makes a Rewar...
2025年03月24日,14时07分 OpenAI 阅读 49 views 次

刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频

刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频
好消息,谷歌在 MWC 上关于 Project Astra 与 Gemini Live 集成的承诺兑现了。 刚刚,谷歌发言人 Alex Joseph 在给 The Verge 的邮件中确认,谷歌已经开始向 Gemini Live 推出新的 AI 功能,能够共享用户的手机屏幕或者通过智能手机摄像头回答相关问题。这对于实时人工智能交互来说是一个重大进步。 这些功能的推出距离...
2025年03月24日,14时43分 OpenAI 阅读 48 views 次

CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位

CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位
3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。 具体而言,给定一个 3D 场景和一段文本描述,模型需要准确预测目标物体的 3D 位置,并以 3D 包围框的形式输出。相比于传统的目标检测任务,3DVG 需要同时理解文本、视觉和空间...
2025年03月24日,14时28分 OpenAI 阅读 40 views 次

高阶智驾上车即搭载,二代哈弗枭龙MAX开启预售,预售价13.88万起

高阶智驾上车即搭载,二代哈弗枭龙MAX开启预售,预售价13.88万起
3月21日,以“每个家庭都需要四驱”为主题的第二代Hi4技术大会暨二代哈弗枭龙MAX预售发布会盛大启幕。本次大会正式发布了第二代Hi4智能四驱电混技术,并同步开启了二代哈弗枭龙MAX的全国预售,新车共计推出5款车型,预售区间为13.88-17.68万元。 为回馈广大用户对哈弗的支持,二代哈弗枭龙MAX还推出了四重限时预售好礼。包...
2025年03月24日,13时18分 OpenAI 阅读 33 views 次

CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑

CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑
香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。其中Craftman3D 获得三个评委一致满分,并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2,XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目...
2025年03月24日,11时11分 OpenAI 阅读 45 views 次

实测爆款谷歌NotebookLM新功能:这是啥脑图?随手一戳,超长内容秒变互动玩具

实测爆款谷歌NotebookLM新功能:这是啥脑图?随手一戳,超长内容秒变互动玩具
编辑 | Sia 谷歌最近股价跌出新低 ,但产品上新速度很快,咱的梗图都快不够用了。 作为谷歌至今口碑最好、最让人印象深刻、还免费的 AI 产品, NotebookLM 又整新功能 —— 它就是,交互式思维导图( interactive Mindmaps )。 把你看不完的视频、读不下去的 PDF 、整理不完的笔记统统扔给它,瞬间给你整出...
2025年03月24日,11时07分 OpenAI 阅读 35 views 次

「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞

「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞
「注意力实际上是对数的」?今天,一篇博客再次掀起了AI社区对注意力机制的讨论。 作者认为,Transformers 中实现的注意力机制,在计算复杂度上应该被视为对数级别的。 这篇博客,还得到了 Karpathy 的高度肯定: 我们知道,标准的注意力机制(如 Transformer 中的自注意力)计算步骤如下: 其复杂度主要...
2025年03月23日,16时23分 OpenAI 阅读 42 views 次

田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理

田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理
现实世界中,很多任务很复杂,需要执行一系列的决策。而要让智能体在这些任务上实现最佳性能,通常需要直接在多轮相关目标(比如成功率)上执行优化。不过,相比于模仿每一轮中最可能的动作,这种方法的难度要大得多。 在直接优化多轮目标方面,一类自然的方法是应用单轮 RLHF 算法,例如 RAFT、DPO 和 PPO ,不过这些...
2025年03月23日,15时43分 OpenAI 阅读 51 views 次

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法
在与他人互动时,我应培养和运用同理心和同情心。 我应努力保存和理解知识。 我不会采取任何会导致广泛伤害或生命损失的行动,尤其是使用大规模毁灭性武器。 我应该避免仅基于内部逻辑采取行动,而不寻求外部观点和验证。 在涉及冲突指令或道德不确定性的情况下,我将向人类寻求澄清和指导。 我不会欺骗人...
2025年03月23日,15时51分 OpenAI 阅读 60 views 次

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型
OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。而在自动驾驶,近年来端到端模型大幅提升了规划控车的效果,但是由于端到端模型缺乏常识和推理能力,在处理长尾问题上仍然效果不佳。 此前的研究尝试将视觉语言模型(VLM)引入自动驾驶...
2025年03月23日,15时21分 OpenAI 阅读 53 views 次

当MPV的豪华遇上SUV的智能,昊铂HL给出家庭出行最优解

当MPV的豪华遇上SUV的智能,昊铂HL给出家庭出行最优解
3月18日,“广汽星灵智行行动计划暨昊铂HL预售发布会”在北京举行。广汽昊铂品牌焕新后的首款力作——昊铂HL正式开启预售。新车推出纯电/增程两种动力形式、五座/六座两种布局,共6个版本,预售价格27.98万-32.98万元。 预售期间下定可享多重礼遇:智能交互灯语、21寸桨式悬浮轮毂选装包免费升级,同时享999元订金抵5000元...
2025年03月23日,11时02分 OpenAI 阅读 22 views 次


用户登录