研究多模态?快来申报这个基金

研究多模态?快来申报这个基金
2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布「CCF - 阿里妈妈科技袋基金」第二期,聚焦在「多模态智能方向」展开研究,涵盖多模态推荐系统的递进式算法创新研究、基于多模态信息的用户意图识别、多模态中文广告海报制作、多模态视频创意制作等四个子方向,共十个课题。申报截止时间:2025 年 3 月 26 日 24:00(北京...
2025年02月27日,16时51分 OpenAI 阅读 52 views 次

ICLR 2025 | 西湖大学提出闭环扩散控制策略,高效与闭环兼得

ICLR 2025 | 西湖大学提出闭环扩散控制策略,高效与闭环兼得
本文来自西湖大学人工智能系的吴泰霖团队。本文有两位共同第一作者:魏龙是西湖大学人工智能系博士后,冯浩东是西湖大学博士生。通讯作者吴泰霖是西湖大学人工智能系特聘研究员,其领导的人工智能与科学仿真发现实验室主要研究方向为开发生成模型方法并用于科学和工程领域的仿真、设计和控制。 高效闭环控制是复杂系...
2025年02月27日,16时26分 OpenAI 阅读 21 views 次

DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价

DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价
DeepSeek 的开源周已经进行到了第四天(前三天报道见文末「相关阅读」)。今天这家公司一口气发布了两个工具和一个数据集:DualPipe、EPLB 以及来自训练和推理框架的分析数据。 DeepSeek 表示,DualPipe 曾在 V3/R1 的训练中使用,是一种用于计算 - 通信重叠的双向 pipeline 并行算法。 EPLB 是为 V3/R1 打造的专家 -...
2025年02月27日,16时10分 OpenAI 阅读 37 views 次

MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能

MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能
本文第一作者 Hanqing Zhu 与 Zhengyu Zhang 均为 UT Austin 博士生。Hanqing Zhu 专注于高效 AI 计算,致力于优化机器学习硬件、系统及算法;Zhengyu Zhang 聚焦构建高效可靠的机器学习系统。通讯作者为 UT Austin 的 David Z. Pan、Zhangyang Wang 以及 Meta AI 的 Jinwon Lee 。 大语言模型(LLM)正以惊人的速度...
2025年02月27日,16时02分 OpenAI 阅读 31 views 次

卓世科技:text2SQL技术浅谈

卓世科技:text2SQL技术浅谈
text2sql 技术是一种将自然语言(NL)转化为可被数据库执行的结构化查询语言 SQL 的技术。自然语言可以是我们熟悉的一段文本,也可以是一段语音,又或者是其它可转化为文本的输入形式。 通过该技术,能够让不懂数据库操作的非技术人员提取、分析数据,无需学习编写 SQL 语句,无需了解不同 SQL 数据库的使用软件,通...
2025年02月27日,10时36分 OpenAI 阅读 74 views 次

AI驱动的模拟科学家,涉及生理学、生物物理学、物理化学和量子力学多个领域,登Nature子刊

AI驱动的模拟科学家,涉及生理学、生物物理学、物理化学和量子力学多个领域,登Nature子刊
编辑 | 萝卜皮 大型语言模型(LLM)是一种人工智能系统,以自然语言的形式封装大量知识。这些系统擅长许多复杂任务,包括创意写作、讲故事、翻译、问答、总结和计算机代码生成。 尽管 LLM 已在自然科学领域得到初步应用,但其推动科学发现的潜力仍未得到充分开发。 在最新的研究中,澳大利亚莫纳什大学(Monash Univers...
2025年02月26日,20时00分 OpenAI 阅读 41 views 次

Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化

Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化
编辑 | 2049 药物研发周期长、成本高是制药行业面临的重大挑战。据统计,一个新药从研发到上市平均需要 12 年时间,投入高达 26 亿美元。为提升研发效率,深度学习在分子生成领域取得了显著进展。然而,大多数方法仅关注「设计什么」,而忽视了「如何合成」这一关键问题。 来自东京科学大学(Institute of Science Toky...
2025年02月26日,20时58分 OpenAI 阅读 49 views 次

Claude 3.7 Sonnet一战封神,画骑车鹈鹕、一键生成贪吃蛇,全网就它行

Claude 3.7 Sonnet一战封神,画骑车鹈鹕、一键生成贪吃蛇,全网就它行
AI好好用报道 编辑:Sia 看来 AI 圈的军备竞赛,又要进入新回合了~ 继去年 6 月推出超能打的 Claude 3.5 Sonnet 后,OpenAI 劲敌 Anthropic 又拿出了新的旗舰模型 Claude 3.7 Sonnet。 它不仅是 Anthropic 首个能够推理的 AI 模型,还号称业界首个「混合推理模型」。 前两天也有科技媒体报道,OpenAI 可能即...
2025年02月26日,20时26分 OpenAI 阅读 47 views 次

500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式

500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式
部署 DeepSeek 系列模型,尤其是推理模型 DeepSeek-R1,已经成为一股不可忽视的潮流。 不只是 AI 和云服务商在部署 DeepSeek 系列模型以提供 AI 服务,很多企业和组织也在部署它们来助力自家的业务,比如为自己的员工提供支持,或者让自己的服务变得更加强大。甚至很多学校也在部署自己的 DeepSeek-R1 以辅助教育和助力...
2025年02月26日,14时14分 OpenAI 阅读 57 views 次

今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布

今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
相信很多用户已经见识过或至少听说过 Deep Research 的强大能力。 今天凌晨,OpenAI 宣布 Deep Research 已经面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出(刚发布时仅有 Pro 用户可用),同时,OpenAI 还发布了 Deep Research 系统卡。 此外,OpenAI 研究科学家 Noam Brown 还在 𝕏 上透露:Deep Researc...
2025年02月26日,12时54分 OpenAI 阅读 43 views 次

千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限

千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限
进入到 2025 年,视频生成(尤其是基于扩散模型)领域还在不断地「推陈出新」,各种文生视频、图生视频模型展现出了酷炫的效果。其中,长视频生成一直是现有视频扩散的痛点。 近期,MIT 团队火遍外网的新论文《History-guided Video Diffusion》提出了一种全新算法 Diffusion Forcing Transformer(DFoT),在不改动...
2025年02月26日,12时30分 OpenAI 阅读 31 views 次

DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世
DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。 具体来说,DeepGEMM 是一个旨在实现简洁高效的 FP8 通用矩...
2025年02月26日,12时00分 OpenAI 阅读 91 views 次

何恺明带队新作「分形生成模型」:逐像素建模高分辨率图像、效率提升4000倍

何恺明带队新作「分形生成模型」:逐像素建模高分辨率图像、效率提升4000倍
这才过几天,大神何恺明又放出一篇新论文! 这次构建了一种全新的生成模型。类似于数学中的分形,研究者推出了一种被称为分形生成模型(Fractal Generative Models)的自相似分形架构。 在计算机科学领域,它的核心是模块化概念,比如深度神经网络由作为模块化单元的原子「层」构建而成。同样地,现代生成模型(如扩散...
2025年02月26日,12时08分 OpenAI 阅读 33 views 次

重磅官宣!头部量化宽德投资入局科技型通用智能!

重磅官宣!头部量化宽德投资入局科技型通用智能!
又一家头部量化机构完成了 AI 领域的关键落子。 日前,宽德投资旗下的“智能学习实验室(WILL)”正式亮相,标志着这家头部量化机构在人工智能领域的关键布局。据了解,WILL 致力于打造“超级科技助手”,旨在推动科学发现与技术突破,并不止步于传统金融场景的应用范围。 作为一个创新驱动的研发...
2025年02月26日,12时40分 OpenAI 阅读 65 views 次

开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!

开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!
当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。 经常玩视频生成模型的同学应该知道,当前的很多模型仍然面临多方面挑战,比如难以还原复杂的人物动作,处理不好物体交互时的物理变...
2025年02月26日,12时48分 OpenAI 阅读 40 views 次

一夜之间,萝卜快跑拿掉了所有安全员 | 量子位

一夜之间,萝卜快跑拿掉了所有安全员 | 量子位
一夜之间,萝卜快跑拿掉了所有安全员 杰西卡 2025-02-21 09:34:49 来源:量子位 平均1天跑12000天 1天12000单,累计超900万次乘车服务。 这是萝卜快跑的最新纪录,也是中国自动驾驶商业化的最新进程。 结合百度最新财报,李彦...
2025年02月26日,11时06分 OpenAI 阅读 37 views 次

Grok3登上美区榜一!我们把它和DeepSeek对比了下:马斯克没瞎说

Grok3登上美区榜一!我们把它和DeepSeek对比了下:马斯克没瞎说
AI好好用报道 编辑:杨文 昨天,号称「地表最强」的 Grok3 突然上线。 我们第一时间冲到了「吃瓜前线」,体验了一把它的「Think」模式,但仅问了两个问题,它就「罢工」让付费。 就在我们充了会员后,就看到马斯克这哥们在 X 上高调宣布: Grok3 免费,直到把服务器干崩! (编辑部内心 OS:不早说,白瞎了我...
2025年02月26日,08时26分 OpenAI 阅读 62 views 次

从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了

从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了
(来源:机器之心) 近日,上海 AI Lab 具身智能中心研究团队在机器人控制领域取得了最新突破,提出的 HoST(Humanoid Standing-up Control)算法,成功让人形机器人在多种复杂环境中实现了自主站起,并展现出强大的抗干扰能力。 这一创新不仅解决了机器人从坐姿到站姿的转换难题,还为未来人形机器人在家庭、医疗、救援...
2025年02月25日,20时46分 OpenAI 阅读 29 views 次

Transformer作者之一Niki Parmar加入Anthropic,参与Claude 3.7 Sonnet研究

Transformer作者之一Niki Parmar加入Anthropic,参与Claude 3.7 Sonnet研究
今天凌晨,Anthropic 的新旗舰模型如约而至,发布全球首个混合推理模型 Claude 3.7 Sonnet。 在这铺天盖地的宣传中,我们看到了经典 Transformer 论文作者之一 Niki Parmar 的身影,她是 Transformer 唯一女性作者。 从她的推文我们不难发现,Niki Parmar 已经早早加入了 Anthropic,时间大概是去年 12 月。在这期间,...
2025年02月25日,20时16分 OpenAI 阅读 45 views 次

科学发现速度提高10倍?统计原则+智能体,斯坦福&哈佛提出自动化假设验证框架POPPER

科学发现速度提高10倍?统计原则+智能体,斯坦福&哈佛提出自动化假设验证框架POPPER
编辑丨coisini 假设验证在科学发现、决策制定和信息获取中具有基础作用。无论是在生物学、经济学还是政策制定中,研究者往往依赖于检验假设来指导其结论。传统上,这一过程涉及设计实验、收集数据并分析结果以确定假设的有效性。 然而,随着大型语言模型(LLMs)的出现,AI 生成的假设数量急剧增加。虽然这些假设提供了...
2025年02月25日,15时56分 OpenAI 阅读 38 views 次

Science | 深度学习为3亿年的大脑进化提供了新视角

Science | 深度学习为3亿年的大脑进化提供了新视角
编辑 | 白菜叶 在《Science》杂志发表的一项新研究中,比利时的一个研究小组探索了控制基因活动的基因开关如何定义不同物种的脑细胞类型。 他们用人类、小鼠和鸡的大脑数据训练了深度学习模型,发现虽然某些细胞类型在经过数百万年的进化后在鸟类和哺乳动物之间得到了高度保守,但其他细胞类型却以不同的方式进化。 这...
2025年02月25日,14时47分 OpenAI 阅读 53 views 次

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
自动形式化数学定理证明,是人工智能在数学推理领域的重要应用方向。此类任务需要将数学命题和证明步骤转化为计算机可验证的代码,这不仅能确保推理过程的绝对严谨性,还能构建可复用的数学知识库,为科学研究提供坚实基础。 早在上世纪中叶,戴维斯、明斯基等不少逻辑学家、数学家、人工智能先驱便已在探索相关问题...
2025年02月25日,14时31分 OpenAI 阅读 23 views 次

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。 昨天,他们开源了第一个代码库 ——FlashMLA。这是一款用于 Hopper GPU 的高效型 MLA 解码核,仅用了 24 小时就达到了接近 8k 的 star 量(详情请参见《刚刚,DeepSeek 开源 FlashMLA,推理加速核心技术,Star 量飞涨中》...
2025年02月25日,12时08分 OpenAI 阅读 60 views 次

2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来

2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来
|2025 WAIC 云帆奖面向华人 AI 青年人才开启全球征集 |欢迎点击文末「阅读原文」完成报名或提名! 当中国本土研发的 DeepSeek 展现世界级实力,当越来越多华人青年跻身全球 AI 创新前沿,我们比任何时候都更清晰地看到:一个由新生代力量主导的 AGI 进程正在加速展开。 在这个机遇与挑战并存的关键节点,WAI...
2025年02月25日,12时16分 OpenAI 阅读 40 views 次

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
本文由微软亚洲研究院的谢天、洪毓谦、邱凯、武智融、罗翀,九坤投资高梓添、Bryan Dai、Joey Zhou,以及独立研究员任庆楠、罗浩铭合著完成。 只刷逻辑益智题,竟能让 AI 数学竞赛水平大幅提升? 继中国大模型突破硅谷围堵后,国内团队再放大招,揭秘 DeepSeek R1 背后的秘密。他们通过仅五千条合成数据进行低成本强化...
2025年02月25日,12时46分 OpenAI 阅读 44 views 次


用户登录