机器人泛化能力大幅提升:HAMSTER层次化方法和VLA尺度轨迹预测,显著提升开放世界任务成功率

机器人泛化能力大幅提升:HAMSTER层次化方法和VLA尺度轨迹预测,显著提升开放世界任务成功率
近年来,人工智能在视觉和自然语言处理方面取得了惊人的泛化能力,但在机器人操作领域,端到端方法往往需要大量昂贵的本域数据,且难以在不同硬件平台与开放场景下推广。为此,HAMSTER(Hierarchical Action Models with Separated Path Representations)通过层次化架构,在高层利用域外数据微调的大模型(VLM)生成二...
2025年03月10日,18时02分 OpenAI 阅读 44 views 次

报名|这可能是讨论 Deepseek 部署与实践最有深度的闭门会

报名|这可能是讨论 Deepseek 部署与实践最有深度的闭门会
DeepSeek “接入潮” 持续火热,如何安全、可靠、高效地集成 DeepSeek 等先进 AI 能力,已成为各行各业当前关注的焦点。为系统性解决企业从技术选型到价值落地的全链路挑战,加速企业部署 DeepSeek 步伐,由张江集团、机器之心主办,模力社区协办的「DeepSeek 部署应用与技术开发」闭门研讨会,将于 3 月 13 ...
2025年03月10日,17时42分 OpenAI 阅读 50 views 次

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效
LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens 的序列。然而,这也给 KV cache 的存储带来了严峻挑战。为应对这一难题,“hybrid model” 成为了一条备受关注的可行路径:它在标准 transformer 的部分层中引入更高效的注意力机制(如 RNN 或 sliding window attention)...
2025年03月10日,17时54分 OpenAI 阅读 37 views 次

扩散模型+深度学习双剑合璧,生成式AI破解染色质构象

扩散模型+深度学习双剑合璧,生成式AI破解染色质构象
编辑丨& 人体内的每一个细胞都包含相同的基因序列,但每个细胞只表达这些基因的一个方面。这些细胞特异性基因表达模式确保脑细胞与皮肤细胞不同,部分由染色质的三维结构决定,遗传物质控制着每个基因的可及性。 高通量测序和成像技术的最新进展大大提高了如今研究单个细胞基因组组织的能力。然而,现有方法通常费...
2025年03月10日,15时25分 OpenAI 阅读 29 views 次

90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台

90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台
编辑丨& 功能蛋白质组学为癌症机制提供了关键见解,有助于发现新的生物标志物和治疗靶点。为了充分利用他们整合的将近 500 份高质量抗体的精选组合,美国德克萨斯大学决定采用 LLM 驱动来使资源更高效。 他们推出了 DrBioRight 2.0,这是一个由最先进的大型语言模型提供支持的直观生物信息学平台。使研究人员能够探...
2025年03月10日,15时01分 OpenAI 阅读 47 views 次

稚晖君的「好东西」揭晓!首个通用具身基座模型,机器人告别「看得懂做不来」

稚晖君的「好东西」揭晓!首个通用具身基座模型,机器人告别「看得懂做不来」
上周五,稚晖君在微博上预告,「下周有好东西发布」。 还没进入「下周」多久,智元机器人的「好东西」揭晓了,还是双重惊喜:Vision-Language-Latent-Action (ViLLA) 架构和通用具身基座大模型 GO-1。 机器人训练,苦数据难久矣。一方面是认知维度的数据:互联网上海量的文本和图片数据,帮助机器人建立基础认知,理解...
2025年03月10日,15时56分 OpenAI 阅读 41 views 次

DeepSeek的最佳用法?西湖大学发布可以自主进化的手机智能体AppAgentX

DeepSeek的最佳用法?西湖大学发布可以自主进化的手机智能体AppAgentX
1. 背景介绍 近年来,大语言模型(LLM) 的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1 这样的模型因其强大的理解和生成能力,已经在 对话生成、代码编写、知识问答 等任务中展现出了卓越的表现。如今,LLM 的应用范围正进一步拓展,催生了一类新的智能体 —— 基于 LLM 的 GUI 智能体(GUI Agents...
2025年03月10日,15时08分 OpenAI 阅读 59 views 次

2025具身智能机器人发展大会在天津成功举办

2025具身智能机器人发展大会在天津成功举办
2025年3月7日,2025具身智能机器人发展大会在天津国家会展中心隆重举行。本次大会以“智创未来——具身智能机器人产业发展与创新”为主题,汇聚全球1400余位行业精英,线上直播观看人次超30万,反响热烈。 大会现场 大会由灵心巧手(北京)科技有限公司总冠名,天津市科学技术局指导,由中国机电一体化技术应用协会、天津...
2025年03月10日,11时49分 OpenAI 阅读 51 views 次

AI在爱奇艺商业广告中的应用和探索

AI在爱奇艺商业广告中的应用和探索
业务背景 广告是互联网流量变现的重要手段,是驱动工业界大规模 AI 技术应用与研究最重要的场景之一。伴随着爱奇艺各项业务的快速发展,爱奇艺的广告业务也已达到百亿级规模。按广告推广目标的不同,爱奇艺广告业务分为品牌广告和效果广告。品牌广告主要出现在用户观看视频正片前,这个位置用户关注度高,可以帮...
2025年03月10日,08时26分 OpenAI 阅读 47 views 次

Colab Pro+每月50刀的会员值不值?有人做了个开箱测评

Colab Pro+每月50刀的会员值不值?有人做了个开箱测评
对于没有 GPU 的小伙伴们来说,谷歌 Colab 是一个公认的「真香」神器,穷苦学生党也能免费薅羊毛。 不过,使用的人多了,难免会出现不如意的情况,几个小时就掉一次线、分配的 RAM 不足等问题随之而来。然后 Colab 开启了会员机制。 就在前几天 Colab 搞了个会员 Colab Pro+,每月 50 刀、训练 24 小时不掉线。除了这...
2025年03月10日,08时16分 OpenAI 阅读 70 views 次

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用
半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。 它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择了「自杀」来回到上一段剧情。 这操作,怕不是 Claude 已经掌握了人类切电源重启的精髓? 事情是这样的,Claude 3.7 Sonnet 是全球首个混合推理模型,它拥...
2025年03月09日,19时51分 OpenAI 阅读 45 views 次

GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?

GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?
一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。 例如,在 Atari 游戏、围棋(如 AlphaGo)或《星际争霸》等环境中,游戏规则明确,边界清晰,研究者可以精确控制变量(如难度、初始状态、随机性等),确保实验的可重复性。而 AlphaGo 的胜利能直接证明其策略能力...
2025年03月09日,19时11分 OpenAI 阅读 28 views 次

随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。

随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。
随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。 传统上,困惑度(Perplexity, PPL)被视为衡量模型语言理解与生成质量的标准指标——困惑度越低,通常意味着模型对下一个词的预测能力越强。由于长文本可被视为一般文本的扩展,许多研究自然地通...
2025年03月09日,19时51分 OpenAI 阅读 56 views 次

7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!
研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研究所副研究员陆垚杰,主要研究领域包括大语言模型及其应用。 随着 DeepSeek-R1 的流行与 AI4Math 研究的...
2025年03月08日,18时12分 OpenAI 阅读 31 views 次

目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资

目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资
又有谷歌大模型核心成员出来创业了。 3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Reflection AI 的公司,旨在开发超级智能。 该公司一亮相,就已宣布获得 1.3 亿美元融资,估值更是高达 5.55 亿美元。 这家公司的两名创始人 Misha Laskin(图右)和 Ioannis Antonoglou(图左)也来头...
2025年03月08日,18时26分 OpenAI 阅读 29 views 次

微软甩开OpenAI自研大模型,还计划用DeepSeek

微软甩开OpenAI自研大模型,还计划用DeepSeek
众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。 但随着近期 AI 技术的突破、双方的分歧加剧,微软正开始在 AI 赛道上加码。据知情人士透露,微软已经开发内部人工智能模型以与 OpenAI 竞争,这一战略性举措的目标是直接替代 OpenAI 的 o1、o3-mini 等核心...
2025年03月08日,18时11分 OpenAI 阅读 39 views 次

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割
该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool 进行了多个研究项目。他的主要研究方向包括场景理解、小样本学习以及多模态学习。 当人形机器人能够辨识身边的一切,VR/AR 设备呈现出定制化的...
2025年03月08日,18时16分 OpenAI 阅读 26 views 次

攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」

攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」
本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。 在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人推理能力刷新多项基准,DeepSeek-R1 以极低的训练成本实现完全不输 o 系列模型的性能突破。 然而,在这股追求推理性能的...
2025年03月08日,15时56分 OpenAI 阅读 46 views 次

自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕

自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕
「所有投资者都在押注应用层…… 对训练能力存在强烈的负面偏见…… 我担心这是一场冒险赌注和市场误判。」这是一篇标题为「The Model is the Product(模型即产品)」的文章的主要观点。 文章指出,当前很多企业都以集成商的形式在提供 AI 服务,也就是调用 OpenAI、Anthropic 等大公司模型的...
2025年03月08日,15时15分 OpenAI 阅读 26 views 次

字节跳动Trae一手实测来了,懂编程也懂中文用户的AI IDE

字节跳动Trae一手实测来了,懂编程也懂中文用户的AI IDE
前些天,字节跳动的 AI IDE 产品 Trae 上线了国内版本,其具备「中文语境深度适配 + 全功能免费开放」的双重杀手锏,一上线就收获了不少支持者。全网一片夸赞,很少能看见批评的声音。 现在,虽然 Trae 的热度已经有所退减,但仍旧是非常值得我们关注的 AI IDE。机器之心也上手体验了一番,探索了其编程、图像理解以及文...
2025年03月08日,15时45分 OpenAI 阅读 62 views 次

夸克、DeepSeek登上全球AI应用排行榜TOP10

夸克、DeepSeek登上全球AI应用排行榜TOP10
全球AI格局正在改变,中国AI应用集体崛起。3月7日,全球著名投资基金、咨询公司a16z发布最新一期的《2025年全球100生成式AI消费级应用排行榜》。在移动端AI应用排行榜中,阿里巴巴旗下夸克排在第6位,成为跃升速度最快、最具竞争力的国产AI应用。 在移动端排行榜中,中国AI应用取得了非常亮眼的成绩,共有五款产品进入...
2025年03月08日,15时55分 OpenAI 阅读 46 views 次

Manus刷屏,汇智智能企业级Agent已在路上

Manus刷屏,汇智智能企业级Agent已在路上
继 DeepSeek 之后,一款由国内开发的通用 AI Agent 产品也引发热议。 3月6日凌晨,来自中国的创业公司Monica正式对外发布全球首款通用型AI Agent产品Manus。可与DeepSeek不同的是,Manus引发的争议褒贬不一,不过,其背后折射出的是国人对于Agent应用落地的迫切心情。 在国产大模型取得突破性进展的当下,大家自然更加期...
2025年03月08日,15时00分 OpenAI 阅读 28 views 次

实测字节免费AI编程,还让不让Cursor活了 | 量子位

实测字节免费AI编程,还让不让Cursor活了 | 量子位
实测字节免费AI编程,还让不让Cursor活了 克雷西 2025-03-04 13:06:32 来源:量子位 满血版DeepSeek R1已全面接入 国内首个原生AI IDE(集成开发环境),来自字节,实测在此: 哪怕一点代码都不懂,只要能说出自己的需求,就...
2025年03月07日,20时11分 OpenAI 阅读 63 views 次


用户登录