语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升

语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升
在人工智能技术日新月异的今天,语音合成(TTS)领域正经历着一场前所未有的技术革命。最新一代文本转语音系统不仅能够生成媲美真人音质的高保真语音,更实现了「只听一次」就能完美复刻目标音色的零样本克隆能力。这一突破性进展的背后,是大规模语音数据的积累和大模型技术的快速发展。 同时在技术前沿,DeepSeek 系...
2025年04月20日,10时32分 OpenAI 阅读 87 views 次

Nature子刊,EPFL与上海交大用多模态Transformer精准预测全局最低吸附能,助力催化剂设计

Nature子刊,EPFL与上海交大用多模态Transformer精准预测全局最低吸附能,助力催化剂设计
在大规模催化剂筛选中,快速评估催化剂表面与吸附质之间的全局最低吸附能(Global Minimum Adsorption Energy,GMAE)是一项关键任务。然而,由于每种表面/吸附质组合往往对应多个吸附位点与复杂构型,传统基于密度泛函理论(DFT)的计算方法面临高昂的时间和资源成本。 为应对这一挑战,来自洛桑联邦理工学院(EPFL)的P...
2025年04月19日,13时34分 OpenAI 阅读 74 views 次

满血版o3探案神技出圈,OpenAI疯狂暗示:大模型不修仙,要卷搬砖了!

满血版o3探案神技出圈,OpenAI疯狂暗示:大模型不修仙,要卷搬砖了!
这份工作的魅力之一,就是能第一时间体验到最新、最前沿的大模型。当然,发布初期难免有些社死时刻,但这次,例外。 就在前天深夜,OpenAI 重磅空降 o 系列模型的最新成员:o3 与 o4-mini,也是迄今为止他们最聪明的模型。人类的进化,始于制造和使用工具。o3 和 o4-mini 也是如此,他们的「聪明」源于学会了使用工具。 ...
2025年04月19日,13时12分 OpenAI 阅读 76 views 次

ICLR 2025|上海创智学院人才交流会,等您来~

ICLR 2025|上海创智学院人才交流会,等您来~
ICLR 2025 即将启幕,全球顶尖 AI 学者与技术先锋汇聚一堂。 作为新一代信息技术高地的建设者,上海创智学院将首次亮相 ICLR,邀您一起共赴关于未来科研与人才成长的深度对话。 我们跨界新生 上海创智学院成立于 2024 年 7 月,是全新的高等教育科研机构,致力于培养新一代信息技术高端人才。学院旨在汇聚活跃创造力的...
2025年04月19日,11时02分 OpenAI 阅读 124 views 次

AI大时代凝聚青年智慧,2025WAIC云帆奖持续报名中

AI大时代凝聚青年智慧,2025WAIC云帆奖持续报名中
在全球 AI 创新格局加速重塑之际,2025 WAIC 云帆奖已开启全球报名,期待汇聚更多有志于推动 AI 发展的青年力量。 从基础理论突破到产业实践创新,从跨学科交叉到开源生态建设,我们寻找能够在通往 AGI 的征途上贡献中国智慧的青年才俊。 下面,三位重量级奖项召集人向你发出诚挚邀请: WAIC 云帆奖得主赋能计划 ...
2025年04月18日,19时35分 OpenAI 阅读 71 views 次

好玩!复旦与阶跃星辰联合发布SVG矢量图生成大模型OmniSVG!挑战3万Token极限

好玩!复旦与阶跃星辰联合发布SVG矢量图生成大模型OmniSVG!挑战3万Token极限
在日常生活中,SVG(可缩放矢量图形)被广泛应用于网页设计、图标、徽标等领域。SVG 图形因其可缩放性和清晰度,在以下场景中得到了广泛应用: 网页设计:用于制作响应式图标、按钮和装饰元素,确保在不同设备上显示清晰。 品牌标识:企业徽标、品牌图形等,保持高质量的视觉效果。 用户界面设计:应用程序和网站...
2025年04月18日,19时29分 OpenAI 阅读 48 views 次

Alpha世代的智能终端⾰命:顾嘉唯⽤物理世界AI-OS重构「世界即交互界⾯」

Alpha世代的智能终端⾰命:顾嘉唯⽤物理世界AI-OS重构「世界即交互界⾯」
当AGI向着PhysicalAI物理具⾝智能时代演进,⼀场重塑未来认知的⻛暴正在悄然兴起。在2025 SENSETIMETECHDAY商汤技术交流⽇上,灵宇宙创始⼈兼⾸席执⾏官顾嘉唯做了分享。他认为在当下AI技术从“⼯具属性”向“伙伴属性”跃迁,⼈机交互范式正在经历从“⼈适应机器”到“机器理解世界...
2025年04月18日,17时17分 OpenAI 阅读 106 views 次

从国家级实验室前沿技术到聚焦能源智能化落地,中科类脑获国家级产业资本亿元投资

从国家级实验室前沿技术到聚焦能源智能化落地,中科类脑获国家级产业资本亿元投资
单笔融资破亿,能源 AI 杀出实力派 「 AI 的尽头是能源!」马斯克与 Sam Altman 的隔空对话,将能源革命与智能革命的交汇点推向全球视野。当前,这一进程正在中国加速。 据统计,2024 年前三季度,能源行业大模型招标项目超 80 个,多数能源企业已建成自有模型,涵盖核电、电网、发电等多个领域。DeepSeek 爆火后,以国...
2025年04月18日,17时52分 OpenAI 阅读 103 views 次

Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌

Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
4 月 14 日,谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲,主题为「AI 的重要趋势:我们是如何走到今天的,我们现在能做什么,以及我们如何塑造 AI 的未来?」 在这场演讲中,Jeff Dean 首先以谷歌多年来的重要研究成果为脉络,展现了 AI 近十五年来的发展轨迹,之后又分享了 Ge...
2025年04月18日,17时40分 OpenAI 阅读 63 views 次

AI应用创业公司:大模型最近的突破,全是作弊

AI应用创业公司:大模型最近的突破,全是作弊
「AI 大模型自去年 8 月以来就没有太大进步」。这是一位 AI 创业者在近期的一篇博客中发表的观点。 他在创业过程中发现,自去年 8 月以来,AI 大模型(如 Claude 3.7 等)在官方发布的基准测试上声称的巨大进步与实际应用场景中的有限提升之间存在明显脱节。这导致他们无法借助模型能力来提升产品体验。很多 YC 创业者也...
2025年04月18日,17时45分 OpenAI 阅读 54 views 次

评估AlphaFold3的综合基准?澳门理工姚小军、浙大侯廷军团队开发PepPCBench

评估AlphaFold3的综合基准?澳门理工姚小军、浙大侯廷军团队开发PepPCBench
编辑 | 菠菜 还记得预测所有生物大分子的 AlphaFold3(AF3)吗?距离它的发布已经过去了接近一年的时间。 在这一年里,有百余篇研究论文提及或引用了 AF3。它切切实实促进了生物大分子研究、药物发现、疾病研究等多个领域的发展。 最近,澳门理工大学姚小军、浙江大学侯廷军团队推出了 PepPCBench,这是一个专门为评估 A...
2025年04月18日,17时57分 OpenAI 阅读 297 views 次

4月24日相约新加坡,机器之心请大家吃饭,还有超多岗位等你来

4月24日相约新加坡,机器之心请大家吃饭,还有超多岗位等你来
你想要的机会,可能在新加坡。 今年的 ICLR 大会将于 4 月 24 日在新加坡开幕,想必很多从业者将前往现场参会。如果你也是其中之一,不妨关注一下另一份邀请 ——「云帆・ICLR 2025 AI Talent Meetup」。 这是机器之心与上海人工智能实验室、东方菁汇、 黄大年茶思屋科技网站、蚂蚁技术研究院、全球高校人工...
2025年04月18日,17时57分 OpenAI 阅读 41 views 次

RSS 2025|ConRFT: 真实环境下基于强化学习的VLA模型微调方法

RSS 2025|ConRFT: 真实环境下基于强化学习的VLA模型微调方法
本文第一作者为陈宇辉,中科院自动化所直博三年级;通讯作者为李浩然,中科院自动化所副研;研究方向为强化学习、机器人学习、具身智能。 视觉-语言-动作模型在真实世界的机器人操作任务中显示出巨大的潜力,但是其性能依赖于大量的高质量人类演示数据。 由于人类演示十分稀缺且展现出行为的不一致性,通过监督学习的方...
2025年04月18日,17时29分 OpenAI 阅读 136 views 次

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了
这几天的大模型圈子,特别热闹。凌晨是 OpenAI 的 o3 和 o4-mini,一觉醒来,国内这边的豆包大模型又上新了一波。 巧合的是,都是能看懂图像、能调用工具的新一代推理模型。 就在今天上午,2025 火山引擎 Force Link AI 创新巡展首站来到杭州。火山引擎总裁谭待宣布,「豆包 1.5・深度思考模型」加入豆包大模型全家桶。...
2025年04月17日,22时31分 OpenAI 阅读 323 views 次

报名开启|ICLR 2025新加坡,蚂蚁集团闭门研讨会、交流晚宴等你来!

报名开启|ICLR 2025新加坡,蚂蚁集团闭门研讨会、交流晚宴等你来!
当春风吹过狮城,ICLR 2025 如约而至,全球技术精英汇聚一堂。 从前沿展示到深度对话,再到思想碰撞的夜晚,蚂蚁集团邀你开启一场科技与灵感的奇妙之旅,共同见证技术的力量! 蚂蚁集团 ICLR 2025 之旅 ICLR 2025 论文录取结果已揭晓,大会共接收 11,565 份投稿,收录率为 32.08%,入选 Spotlight 和 Oral Presentation...
2025年04月17日,20时23分 OpenAI 阅读 103 views 次

CVPR 2025|视频抠图MatAnyone来了,一次指定全程追踪,发丝级还原

CVPR 2025|视频抠图MatAnyone来了,一次指定全程追踪,发丝级还原
本文由南洋理工大学和商汤科技联合完成。第一作者杨沛青为南洋理工大学 MMLab@NTU 在读博士生,在 CVPR、NeurIPS、IJCV 等国际顶级会议与期刊上发表多篇研究成果。项目负责作者为该校研究助理教授周尚辰和校长讲席教授吕建勤。 视频人物抠像技术在电影、游戏、短视频制作和实时视频通讯中具有广泛的应用价值,但面对复...
2025年04月17日,20时16分 OpenAI 阅读 259 views 次

联想展示 AI换脸防诈技术,精准识别 Deepfake伪造视频

联想展示 AI换脸防诈技术,精准识别 Deepfake伪造视频
随着人工智能和大模型技术的迅猛发展,它们为人们的生活带来了前所未有的便利与变革。从DeepSeek等应用的爆火,到AI PC等端侧AI设备的加速普及,AI 的身影无处不在。然而,AI 技术的滥用也带来了新的安全威胁。其中,AI 换脸诈骗作为一种新兴的、极具隐蔽性和危害性的手段,正逐渐成为网络安全领域的一大挑战。 两会期间...
2025年04月17日,20时11分 OpenAI 阅读 81 views 次

攻克胰腺癌早筛难题,阿里AI模型获国际权威认定“突破性医疗器械”

攻克胰腺癌早筛难题,阿里AI模型获国际权威认定“突破性医疗器械”
4月17日消息,阿里巴巴AI模型DAMO PANDA被FDA认定为“突破性医疗器械”。DAMO PANDA是阿里巴巴达摩院研发的胰腺癌筛查AI模型,可精准识别平扫CT影像中的细微病灶,攻克了胰腺癌早期筛查的国际难题。这也是中国头部科技企业首次拿下该项权威认可。 FDA(美国食品和药物管理局)从2016年起设立“突破性医疗...
2025年04月17日,20时16分 OpenAI 阅读 43 views 次

报名丨第七届智源大会,6月6-7日北京见

报名丨第七届智源大会,6月6-7日北京见
过去一年,技术的飞跃不断刷新人类对智能边界的认知。 从DeepSeek以轻量化全开源架构打破大模型技术的藩篱,到 AI 智能体 Manus 实现了自主学习与决策能力的跃迁;再到 Claude 3.7在创意编程领域掀起的智能革命。这一年,智能在参数中跃迁,在算法中进化。 它不再只是工具,而正在演化为我们认知世界、改造世界的全新思...
2025年04月17日,20时51分 OpenAI 阅读 101 views 次

清华学霸、OpenAI姚顺雨:AI下半场开战,评估将比训练重要

清华学霸、OpenAI姚顺雨:AI下半场开战,评估将比训练重要
最近新出的《黑镜》第七季大家都看了吗? 其中第三集聚焦一个叫 ReDream 的前沿技术,允许现代演员通过 AI 和虚拟现实与经典黑白电影中的虚拟角色互动,快速重拍经典影片。随着故事发展,主角发现 AI 角色似乎拥有自我意识。 想象一下,未来的 AI 不仅能听懂你的话,还能像你一样思考、决策 —— 这正是思维...
2025年04月17日,20时01分 OpenAI 阅读 222 views 次

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。 论文主页: https://madaoer.github.io/projects/physically_plausible_video_generation/ 论文链接: https://arxiv.org/abs/2503.23368 视...
2025年04月17日,20时33分 OpenAI 阅读 58 views 次


用户登录