Science | 深度学习为3亿年的大脑进化提供了新视角

Science | 深度学习为3亿年的大脑进化提供了新视角
编辑 | 白菜叶 在《Science》杂志发表的一项新研究中,比利时的一个研究小组探索了控制基因活动的基因开关如何定义不同物种的脑细胞类型。 他们用人类、小鼠和鸡的大脑数据训练了深度学习模型,发现虽然某些细胞类型在经过数百万年的进化后在鸟类和哺乳动物之间得到了高度保守,但其他细胞类型却以不同的方式进化。 这...
2025年02月25日,14时47分 OpenAI 阅读 55 views 次

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
自动形式化数学定理证明,是人工智能在数学推理领域的重要应用方向。此类任务需要将数学命题和证明步骤转化为计算机可验证的代码,这不仅能确保推理过程的绝对严谨性,还能构建可复用的数学知识库,为科学研究提供坚实基础。 早在上世纪中叶,戴维斯、明斯基等不少逻辑学家、数学家、人工智能先驱便已在探索相关问题...
2025年02月25日,14时31分 OpenAI 阅读 23 views 次

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。 昨天,他们开源了第一个代码库 ——FlashMLA。这是一款用于 Hopper GPU 的高效型 MLA 解码核,仅用了 24 小时就达到了接近 8k 的 star 量(详情请参见《刚刚,DeepSeek 开源 FlashMLA,推理加速核心技术,Star 量飞涨中》...
2025年02月25日,12时08分 OpenAI 阅读 61 views 次

2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来

2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来
|2025 WAIC 云帆奖面向华人 AI 青年人才开启全球征集 |欢迎点击文末「阅读原文」完成报名或提名! 当中国本土研发的 DeepSeek 展现世界级实力,当越来越多华人青年跻身全球 AI 创新前沿,我们比任何时候都更清晰地看到:一个由新生代力量主导的 AGI 进程正在加速展开。 在这个机遇与挑战并存的关键节点,WAI...
2025年02月25日,12时16分 OpenAI 阅读 41 views 次

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
本文由微软亚洲研究院的谢天、洪毓谦、邱凯、武智融、罗翀,九坤投资高梓添、Bryan Dai、Joey Zhou,以及独立研究员任庆楠、罗浩铭合著完成。 只刷逻辑益智题,竟能让 AI 数学竞赛水平大幅提升? 继中国大模型突破硅谷围堵后,国内团队再放大招,揭秘 DeepSeek R1 背后的秘密。他们通过仅五千条合成数据进行低成本强化...
2025年02月25日,12时46分 OpenAI 阅读 44 views 次

全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手

全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手
就在昨晚,Anthropic 要发新模型的消息开始在 AI 社区广泛发酵,不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。 (来源:机器之心) 图源:https://x.com/btibor91/status/1893970824484581825 今天凌晨,Anthropic 的新旗舰模型如约而至,正式发布了其迄今为止最智能的模型以及市面上首款混合...
2025年02月25日,12时56分 OpenAI 阅读 29 views 次

DeepSeek开源FlashMLA:Hopper GPU解码新标杆,测评大揭秘!

DeepSeek开源FlashMLA:Hopper GPU解码新标杆,测评大揭秘!
DeepSeek今天正式启动为期五天的开源成果发布计划,首个亮相的项目是FlashMLA。这一开源项目将先进的MLA算法与GPU优化技术相结合,为大模型推理提供了一套高性能、低延迟的解码方案。 FlashMLA是一款专门为Hopper GPU(比如H800 SXM5)优化的高效MLA解码内核,旨在加速大模型的计算任务,尤其是在NVIDIA高端显卡上提升性...
2025年02月25日,12时16分 OpenAI 阅读 44 views 次

稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA

稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA
当 DeepSeek 的 NSA 与月之暗面的 MoBA 以稀疏注意力掀起长序列技术热潮,行业对 “效率革命” 的追逐迎来关键一跃 —— 华为诺亚方舟实验室正式发布全新 ESA 算法(Efficient Selective Attention)。 论文地址:https://arxiv.org/pdf/2502.14477 通过稀疏化注意力的创新设计,ESA 突破了大模...
2025年02月24日,17时34分 OpenAI 阅读 28 views 次

模型安全武装,复旦新研究实现SOTA扩散模型风险概念擦除效果,入选AAAI 2025

模型安全武装,复旦新研究实现SOTA扩散模型风险概念擦除效果,入选AAAI 2025
论文第一、第二作者为复旦大学视觉与学习实验室的硕士生韩枫和博士生陈凯。通讯作者为陈静静副教授。研究团队专注于 AI 安全的研究,近年来在 CVPR,ECCV,AAAI,ACM MM 等顶会上发表过多篇 AI 安全的研究成果。 文生图模型生成图片过于露骨?不妨直接给图像穿上衣服。 复旦大学团队设计的风险概念移除网络 DuMo 不仅...
2025年02月24日,17时00分 OpenAI 阅读 13 views 次

双擎升级!商汤大装置DeepSeek企业版上线+免费版扩容

双擎升级!商汤大装置DeepSeek企业版上线+免费版扩容
今年2月,商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型,并为免费版提供3个月内千万Token额度,受到客户的热烈响应。 为了更好的服务用户,经过系列优化,,现正式推出企业版,同时完成免费版国产化适配与算力扩容,形成专业强支撑+普惠广覆盖的双擎驱动! 登录官网,即刻体验! https://console.sensec...
2025年02月24日,17时12分 OpenAI 阅读 42 views 次

速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现

速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现
编辑 | 白菜叶 机器学习为快速准确地预测结合亲和力提供了巨大的希望。然而,目前的模型缺乏稳健的评估,无法完成(命中到)先导化合物优化中遇到的任务,例如对一系列同类配体的结合亲和力进行排序,从而限制了它们在药物发现中的应用。 牛津大学的研究团队首先提出了一种新的基于注意力的图神经网络模型 AEV-PLIG(原...
2025年02月24日,15时33分 OpenAI 阅读 28 views 次

南京理工团队推出基于AI增强热力学建模预测3D场景红外辐射特性的新框架

南京理工团队推出基于AI增强热力学建模预测3D场景红外辐射特性的新框架
编辑 | ScienceAI 在现代军事科技中,虚拟战场构建技术对武器研发和战术决策具有深远影响。 然而,传统三维红外场景模拟面临计算资源消耗大、动态目标与环境交互建模困难、算法验证不足等挑战。 近期,南京理工大学的研究团队在《International Journal of Heat and Mass Transfer》发表了一项突破性研究《A novel fram...
2025年02月24日,15时40分 OpenAI 阅读 47 views 次

联手华为诺亚,南大LAMDA组获EDA顶会DATE 2025最佳论文

联手华为诺亚,南大LAMDA组获EDA顶会DATE 2025最佳论文
国内芯片设计研究团队,刚刚在国际学术顶会上获奖了。 近日,南京大学人工智能学院 LAMDA 组钱超教授团队在 DATE 2025 上发表论文《Timing-Driven Global Placement by Efficient Critical Path Extraction》获得了最佳论文奖。 论文:《Timing-Driven Global Placement by Efficient Critical Path Extraction》 ...
2025年02月24日,15时32分 OpenAI 阅读 38 views 次

开源赛道太挤了!月之暗面开源新版Muon优化器

开源赛道太挤了!月之暗面开源新版Muon优化器
月之暗面和 DeepSeek 这次又「撞车」了。 上次是论文,两家几乎前后脚放出改进版的注意力机制,可参考《撞车 DeepSeek NSA,Kimi 杨植麟署名的新注意力架构 MoBA 发布,代码也公开》、《刚刚!DeepSeek 梁文锋亲自挂名,公开新注意力架构 NSA》。 这次是开源。 上周五,DeepSeek 刚刚官宣这周要连续开源 5 个代码库...
2025年02月24日,15时22分 OpenAI 阅读 51 views 次

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。 近日,Netflix 资深研究科学家 Cameron R. Wolfe 发布了一篇题为「揭秘推理模型」的深度长文,详细梳理了自 o1-mini 开始至今的推理模型发展史,并详细介...
2025年02月24日,15时07分 OpenAI 阅读 41 views 次

扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体
本文的共同第一作者为浙江工商大学统计与数学学院硕士生孙文灏和阿里巴巴算法工程师崔奔雷,本文的通讯作者为浙江工商大学统计与数学学院董雪梅教授。 最近,扩散模型在生成模型领域异军突起,凭借其独特的生成机制在图像生成方面大放异彩,尤其在处理高维复杂数据时优势明显。然而,尽管扩散模型在图像生成任务中表...
2025年02月24日,15时35分 OpenAI 阅读 32 views 次

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。 第一个项目,果然与推理加速有关。 北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。 该项目上线才 45 分钟就已经收获了...
2025年02月24日,11时12分 OpenAI 阅读 69 views 次

征稿|CVPR2025首届ViSCALE研讨会,探寻计算机视觉的推理扩展律

征稿|CVPR2025首届ViSCALE研讨会,探寻计算机视觉的推理扩展律
计算机视觉与模式识别会议(CVPR)作为全球计算机视觉与人工智能领域最具影响力的顶级学术会议,将于 2025 年 6 月 11 日至 15 日在美国田纳西州召开。 来自清华大学、牛津大学、UCSC、UCLA、中科院等顶尖高校及学术机构的学者届时将联合举办 CVPR 首届计算机视觉推理扩展研讨会(Test-time Scaling in Computer Vision,...
2025年02月24日,11时42分 OpenAI 阅读 44 views 次

坦克400汽油版24.98万元,柴油版26.48万元,双车燃擎上市!

坦克400汽油版24.98万元,柴油版26.48万元,双车燃擎上市!
2月22日,备受瞩目的坦克400汽柴油版双车燃擎上市,坦克400汽油版建议零售价24.98万元,柴油版建议零售价26.48万元。用户可享受六大购车福利,3000元定金可抵10000元购车款,限2025年3月31日(含)前下定且在4月30日前开票提车客户,对于增、换购用户,还可享受最高7000元的官方补贴。同时,在质保、网联、保养、救援等...
2025年02月24日,11时22分 OpenAI 阅读 30 views 次

人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金

人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金
我不会编程,却在两年时间内靠 ChatGPT 写代码做 APP,年入千万美金。 没开玩笑,这不是拼好饭吃多了的最终幻想,而是现实生活中上演的真人真事。 故事的主人公叫 Blake Anderson,而他之所以能如此猛猛吸金,靠的是三个 APP:约会指导 Rizz GPT,年收入达 250 万美元;颜值管理软件 Umax,年收入接近 500 万美元;还有...
2025年02月23日,18时40分 OpenAI 阅读 56 views 次

3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?

3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
当 Scaling Law 在触顶边界徘徊之时,强化学习为构建更强大的大模型开辟出了一条新范式。 在机器人领域,强化学习也带来了意外之喜。 这只上过好几次全网热搜的机器狗Spot,想必大家都不陌生。 在原来的文章中,无论 Spot 做了什么高难度动作,哪怕是边喷火边跳踢踏舞,后台总有留言,「为什么波士顿动力不把机器人的...
2025年02月23日,18时35分 OpenAI 阅读 35 views 次

Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划
扩散模型(Diffusion Model)通过利用大规模离线数据对轨迹分布进行建模,能够生成复杂的轨迹。与传统的自回归规划方法不同,基于扩散的规划器通过一系列去噪步骤可以整体生成完整轨迹,无需依赖前向动力学模型,有效解决了前向模型的关键局限性,特别适用于具有长周期或稀疏奖励的规划任务。 尽管扩散模型具有这些优势...
2025年02月23日,18时15分 OpenAI 阅读 41 views 次

ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法

ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法
近年来,随着扩散模型和 Transformer 技术的快速发展,4D 人体 - 物体交互(HOI)的生成与驱动效果取得了显著进展。然而,当前主流方法仍依赖 SMPL [1] 这一人体先验模型来生成动作。尽管这些方法已取得令人瞩目的成果,但由于 SMPL 在衣物表现上的局限性,以及缺乏大规模真实交互数据的支持,它们依然难以生成日常生活...
2025年02月23日,18时39分 OpenAI 阅读 61 views 次

具身智能:以语料为翼,飞抵新高度

具身智能:以语料为翼,飞抵新高度
在科技浪潮汹涌澎湃的当下,人工智能领域又一盛事全球开发者先锋大会正在举办。本次大会聚焦前沿,其中深度探讨大模型、语料、算力、具身智能、科学智能以及其他“5+6”产业及领域的未来发展走向,为行业精英、开发者们提供一个思想碰撞与经验交流的绝佳平台。 语料互联 共创未来 语料是 AI 发展的根基,其质...
2025年02月23日,12时17分 OpenAI 阅读 65 views 次


用户登录