
4 月 11 日,MediaTek举办天玑开发者大会 2025(MDDC 2025),本届大会以 “AI 随芯,应用无界” 为主题,聚焦 AI 技术和产业变革趋势,探讨智能体 AI 体验发展和技术新范式下的共同机遇。
会上,MediaTek 正式启动 “天玑智能体化体验领航计划”,联手全球产业伙伴共同探索智能体 AI 体验发展与普...
“AI孙悟空”对话全球!讯飞星火作为大阪世博会中国馆“唯一大模型展项”正式亮相

4月13日,主题为“构想焕发生机的未来社会”的日本大阪·关西世博会(以下简称“大阪世博会”)开幕。大阪世博会中国馆以“共同构建人与自然生命共同体——绿色发展的未来社会”为主题,携“嫦娥五号”月壤样本、“蛟龙”号体验舱等顶尖科技成果亮相...
AI应用突围,中小企业的新周期已至 | 量子位

AI应用突围,中小企业的新周期已至
白交 2025-04-11 18:01:43 来源:量子位
如今的AI不再是“精英游戏”,而是转变为“全民工具”。
2025年,当算力成本一降再降,开源框架层出不穷,曾经“锁喉”中小企业发展的技术桎梏,正被逐一...
3D领域「源神」又开了两个新项目:三维部件编辑与自动绑定框架

在不久之前机器之心报道文章《3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目》中,我们曾介绍到,国内专注于构建通用 3D 大模型的创业公司 VAST 将持续开源一系列 3D 生成项目。
近日,新的开源项目它来了,包括针对任意三维模型生成完整可编辑部件的 HoloPart与通用自动绑定框架 UniRig。
今天,...
不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型

终于,华为盘古大模型系列上新了,而且是昇腾原生的通用千亿级语言大模型。
我们知道,如今各大科技公司纷纷发布百亿、千亿级模型。但这些大部分模型训练主要依赖英伟达的 GPU。
而现在的情形下,国内研究团队很难获得足够的计算资源,这也制约了国内大模型技术的快速发展。
我们看到华为盘古发布的这篇新研究,证明了...
强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。
在探索的过程中,一个核心的议题是:对于模型推理性能的提升来说,什么有效?什么无效?
DeepSeek - R1 论文曾提到:「我们发现将强化学习应用于这些蒸馏模型可以获得显著的进一步提升」。3 月 20 日,论文《Reinforcement Lea...
3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。
近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710 亿(371B)tokens,覆盖网页、代码和高质量合成数据三大领域。
报告标题:MegaMath: Pushing the Limits of Open Math Corpora
技术报告:htt...
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

本文作者刘圳是香港中文大学(深圳)数据科学学院的助理教授,肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生,刘威杨是德国马克思普朗克-智能系统研究所的研究员,Yoshua Bengio 是蒙特利尔大学和加拿大 Mila 研究所的教授,张鼎怀是微软研究院的研究员。此论文已收录于 ICLR 2025。
在视觉生成领域,...
GPT-4o图像生成架构被"破解"了?自回归主干+扩散解码器 | 量子位

GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器
一水 2025-04-09 17:44:32 来源:量子位
三大维度全面评估GPT-4o图像能力
GPT-4o图像生成架构被“破解”了!
最近一阵,“万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红...
阿里云造"Agent工厂",百炼MCP服务上线,无需代码5分钟建Agent | 量子位

阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟建Agent
西风 2025-04-09 17:10:32 来源:量子位
未来要做Agent Store
AI大模型在咖啡店怎么落地?
不是辅助设计宣传海报or制定营销策略,新姿势是:
帮忙质检,不仅包括...
NEW "AI眼镜的终极功能,是AI+社交" | 对话影目科技创始人 | 量子位
“AI眼镜的终极功能,是AI+社交” | 对话影目科技创始人
克雷西 2025-04-07 21:48:45 来源:量子位
“AI更多是一种底层能力,而不是一种聚焦的功能”
AI眼镜,究竟为什么这么热?
2023年10月,现象级产品Ray-Ban Meta智能眼镜发布...
Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了

编辑 | ScienceAI
随着人工智能在医学影像领域的广泛应用,文本到图像扩散模型(如 Stable Diffusion)正逐步渗透到医学数据合成、医学教育和数据共享中。然而,尽管生成质量整体较高,模型在不同人口统计属性(性别、种族、族裔)上却存在明显差异。例如,实验表明,Stable Diffusion 在生成女性、白人及非西班牙裔样本...
魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令

大模型驱动的 AI 助手又升级了。本周五,科技圈正在围观一个陪你一起玩《我的世界》的 AI。
它话不多说,就是埋头干活。一起盖房子的时候,你不需要给 AI 一张蓝图,或是不断告诉它该怎么做,你只需要盖自己的,它就能一边观察一遍配合,并观察你的意图随时改变计划。
现在,AI 可以不断主动学习、纠正错误,展现出了...
算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键

众所周知,人工智能在过去十五年里取得了令人难以置信的进步,尤其是在最近五年。
回顾一下人工智能的「四大发明」吧:深度神经网络→Transformer 语言模型→RLHF→推理,基本概括了 AI 领域发生的一切。
我们有了深度神经网络(主要是图像识别系统),然后是文本分类器,然后是聊天机器人,现在我们又有了...
苹果发现原生多模态模型Scaling Laws:早融合优于后融合,MoE优于密集模型

让大模型进入多模态模式,从而能够有效感知世界,是最近 AI 领域里人们一直的探索目标。
目前我们见到的很多多模态大模型应用是「组合式」的:其中集成了数个单独预训练的组件,例如将视觉编码器连接到 LLM 上并继续进行多模态训练;而在谷歌 Gemin 2.0 推出之后,原生多模态模型(NMM)被认为是正确的方向。
但从零开始...
面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

本文的作者均来自新加坡国立大学 LinS Lab。本文的共同第一作者为新加坡国立大学实习生许立昕和博士生刘子轩,主要研究方向为机器人学习和灵巧操纵,其余作者分别为硕士生桂哲玮、实习生郭京翔、江泽宇以及博士生徐志轩、高崇凯。本文的通讯作者为新加坡国立大学助理教授邵林。
在物流仓库、生产线或家庭场景中,机器人...
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯 | 量子位

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
衡宇 2025-04-06 10:41:26 来源:量子位
百万上下文+原生多模态
AI不过周末,硅谷也是如此。
大周日的,Llama家族上新,...
量子位

林樾 2025-04-08 15:51:06 来源:量子位
☄️ 速戳报名!4月16日,来 #中国AIGC产业峰会 看AI如何用起来? 👉 报名链接:https://hdxu.cn/Arf5
4月16日,北京金茂万丽酒店,第三届中国AIGC产业峰会就要来啦!观众报名通道已开启...
从算力设施到软件工具,华为云超节点引领全栈AI产品智能升级

4 月 10 日 - 11 日,华为云生态大会 2025 在安徽芜湖成功举行。在第二天的华为云产品技术发布会上,华为云面向伙伴和客户发布了全新升级的昇腾 AI 云服务、软件开发生产线 CodeArts、数字内容生产线 MetaStudio、云原生安全体系、数据治理生产线 DataArts、GaussDB 数据库等产品及解决方案。
对于本次产品技术发布会,...
原生多模态大模型也能强化学习,思维链长达几万字,商汤日日新V6来了
如果让大模型像人一样聪明,应该是什么样的?
你可能会回答,我们生活的世界纷繁复杂,常常涉及多模态信...
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
今天凌晨,OpenAI 的 CEO 山姆・奥特曼突然发推说自己睡不着了,因为有重要新功能要推出。
很快,OpenA...
传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?
高质量数据枯竭,传统预训练走向终点,大模型如何突破瓶颈?
当前(多模态)大模型正深陷「数据饥渴」...
西湖大学开发ESM-Ezy:一种用于挖掘高性能酶的深度学习策略

图示:相关MCO 的晶体结构。(来源:论文)
编辑 | 白菜叶
UniProt数据库是生物催化剂发现的宝贵资源,但预测酶功能仍然具有挑战性,尤其是对于低相似性序列。识别具有增强催化性能的优质酶更加困难。
为了克服这些挑战,西湖大学的研究团队开发了 ESM-Ezy,这是一种利用 ESM-1b 蛋白质语言模型和语义空间相似性计算的...
召回率98.5%,开源混合学习系统精准预测生物大分子中金属结合位点

编辑丨&
金属离子是许多蛋白质中用于蛋白质功能推断和工程化的重要成分,其复杂性与结构催化等作用有关。现如今的技术在应对过渡金属离子的建模,特别是在瞬时、可逆和浓度依赖性调节位点等难题时,显得有些乏力。
汕头大学医学院、湖南大学与美国弗吉尼亚大学(University of Virginia)带来了一种混合机器学习系...
中科大华为发布生成式推荐大模型,昇腾NPU可部署,背后认知一同公开 | 量子位

中科大华为发布生成式推荐大模型,昇腾NPU可部署,背后认知一同公开
白交 2025-04-06 10:48:10 来源:量子位
具备扩展定律的生成式推荐范式是未来趋势
推荐大模型也可生成式,并且首次在国产昇腾NPU上成功部署!
在信息爆炸时...
200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。从报告中可以看到,这是一个拥有 200B 总参数的 MoE 模型,每次工作时会激活其中 20B 参数。其表现非常惊艳,在各个领域的基准上都超过了拥有 671B 总参数的 DeepSeek-R1。有人猜测,这就是字节豆包目前正在使用的深度思考模型。
字节近期官...
DeepSeek前脚发新论文,奥特曼立马跟上:GPT-5就在几个月后啊 | 量子位

DeepSeek前脚发新论文,奥特曼立马跟上:GPT-5就在几个月后啊
十三 2025-04-05 13:02:37 来源:量子位
有点意思。
这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛,引得大家纷纷联想是不是R2马上要来了。
然鹅……...
IC-Light的视频版本来了,RelightVid:强光动态环境下的视频光照编辑神器

大家还记得那个 ICLR 2025 首次满分接收、彻底颠覆静态图像光照编辑的工作 IC-Light 吗?
今天,来自复旦大学、上海交通大学、浙江大学、斯坦福大学等机构的学者们正式宣布:IC-Light 的视频版本来了——RelightVid!
论文标题:RelightVid: Temporal-Consistent Diffusion Model for Video Relighting
...
国产最强语音工具趣丸千音全球邀测!有情绪高情商,中文绕口令碾压ElevenLabs
近期,国产最强语音大模型MaskGCT,正式落地到应用平台趣丸千音(英文名:All Voice Lab),全球同步邀测!MaskGCT模型在去年10月宣布开源,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。它在多个 TTS 基准数据集上都达到了 SOTA 效果,在某些指标上甚至超过了人类水平。如今,从实验...
整整157页,比尔盖茨亲自公开微软起家的源代码:Altair Basic | 量子位
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)