
2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布「CCF - 阿里妈妈科技袋基金」第二期,聚焦在「多模态智能方向」展开研究,涵盖多模态推荐系统的递进式算法创新研究、基于多模态信息的用户意图识别、多模态中文广告海报制作、多模态视频创意制作等四个子方向,共十个课题。申报截止时间:2025 年 3 月 26 日 24:00(北京...
ICLR 2025 | 西湖大学提出闭环扩散控制策略,高效与闭环兼得

本文来自西湖大学人工智能系的吴泰霖团队。本文有两位共同第一作者:魏龙是西湖大学人工智能系博士后,冯浩东是西湖大学博士生。通讯作者吴泰霖是西湖大学人工智能系特聘研究员,其领导的人工智能与科学仿真发现实验室主要研究方向为开发生成模型方法并用于科学和工程领域的仿真、设计和控制。
高效闭环控制是复杂系...
DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价

DeepSeek 的开源周已经进行到了第四天(前三天报道见文末「相关阅读」)。今天这家公司一口气发布了两个工具和一个数据集:DualPipe、EPLB 以及来自训练和推理框架的分析数据。
DeepSeek 表示,DualPipe 曾在 V3/R1 的训练中使用,是一种用于计算 - 通信重叠的双向 pipeline 并行算法。
EPLB 是为 V3/R1 打造的专家 -...
MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能

本文第一作者 Hanqing Zhu 与 Zhengyu Zhang 均为 UT Austin 博士生。Hanqing Zhu 专注于高效 AI 计算,致力于优化机器学习硬件、系统及算法;Zhengyu Zhang 聚焦构建高效可靠的机器学习系统。通讯作者为 UT Austin 的 David Z. Pan、Zhangyang Wang 以及 Meta AI 的 Jinwon Lee 。
大语言模型(LLM)正以惊人的速度...
成本打到6万以下,手把手教你用4路锐炫™显卡+至强®W跑DeepSeek | 量子位

成本打到6万以下,手把手教你用4路锐炫™显卡+至强®W跑DeepSeek
量子位的朋友们 2025-02-21 19:32:40 来源:量子位
凭借卓越性能表现与先天开源优势,DeepSeek正迅速成为全球扩展大模型应用实践的一大“圆心”。作为英特尔在GPU领...
卓世科技:text2SQL技术浅谈

text2sql 技术是一种将自然语言(NL)转化为可被数据库执行的结构化查询语言 SQL 的技术。自然语言可以是我们熟悉的一段文本,也可以是一段语音,又或者是其它可转化为文本的输入形式。
通过该技术,能够让不懂数据库操作的非技术人员提取、分析数据,无需学习编写 SQL 语句,无需了解不同 SQL 数据库的使用软件,通...
AI驱动的模拟科学家,涉及生理学、生物物理学、物理化学和量子力学多个领域,登Nature子刊

编辑 | 萝卜皮
大型语言模型(LLM)是一种人工智能系统,以自然语言的形式封装大量知识。这些系统擅长许多复杂任务,包括创意写作、讲故事、翻译、问答、总结和计算机代码生成。
尽管 LLM 已在自然科学领域得到初步应用,但其推动科学发现的潜力仍未得到充分开发。
在最新的研究中,澳大利亚莫纳什大学(Monash Univers...
Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化

编辑 | 2049
药物研发周期长、成本高是制药行业面临的重大挑战。据统计,一个新药从研发到上市平均需要 12 年时间,投入高达 26 亿美元。为提升研发效率,深度学习在分子生成领域取得了显著进展。然而,大多数方法仅关注「设计什么」,而忽视了「如何合成」这一关键问题。
来自东京科学大学(Institute of Science Toky...
Claude 3.7 Sonnet一战封神,画骑车鹈鹕、一键生成贪吃蛇,全网就它行

AI好好用报道
编辑:Sia
看来 AI 圈的军备竞赛,又要进入新回合了~
继去年 6 月推出超能打的 Claude 3.5 Sonnet 后,OpenAI 劲敌 Anthropic 又拿出了新的旗舰模型 Claude 3.7 Sonnet。
它不仅是 Anthropic 首个能够推理的 AI 模型,还号称业界首个「混合推理模型」。
前两天也有科技媒体报道,OpenAI 可能即...
安卓装DeepSeek就敢卖8999!最薄折叠?那没事了 | 量子位
安卓装DeepSeek就敢卖8999!最薄折叠?那没事了
克雷西 2025-02-20 21:45:06 来源:量子位
展开后只有type-C接口厚度
8999!比iPhone 16 Pro还贵,史上起售价最高的国产安卓AI手机来了!
而且首发就搭载满血版DeepSeek,还有...
500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式

部署 DeepSeek 系列模型,尤其是推理模型 DeepSeek-R1,已经成为一股不可忽视的潮流。
不只是 AI 和云服务商在部署 DeepSeek 系列模型以提供 AI 服务,很多企业和组织也在部署它们来助力自家的业务,比如为自己的员工提供支持,或者让自己的服务变得更加强大。甚至很多学校也在部署自己的 DeepSeek-R1 以辅助教育和助力...
今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布

相信很多用户已经见识过或至少听说过 Deep Research 的强大能力。
今天凌晨,OpenAI 宣布 Deep Research 已经面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出(刚发布时仅有 Pro 用户可用),同时,OpenAI 还发布了 Deep Research 系统卡。
此外,OpenAI 研究科学家 Noam Brown 还在 𝕏 上透露:Deep Researc...
千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限

进入到 2025 年,视频生成(尤其是基于扩散模型)领域还在不断地「推陈出新」,各种文生视频、图生视频模型展现出了酷炫的效果。其中,长视频生成一直是现有视频扩散的痛点。
近期,MIT 团队火遍外网的新论文《History-guided Video Diffusion》提出了一种全新算法 Diffusion Forcing Transformer(DFoT),在不改动...
DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。
具体来说,DeepGEMM 是一个旨在实现简洁高效的 FP8 通用矩...
何恺明带队新作「分形生成模型」:逐像素建模高分辨率图像、效率提升4000倍

这才过几天,大神何恺明又放出一篇新论文!
这次构建了一种全新的生成模型。类似于数学中的分形,研究者推出了一种被称为分形生成模型(Fractal Generative Models)的自相似分形架构。
在计算机科学领域,它的核心是模块化概念,比如深度神经网络由作为模块化单元的原子「层」构建而成。同样地,现代生成模型(如扩散...
重磅官宣!头部量化宽德投资入局科技型通用智能!

又一家头部量化机构完成了 AI 领域的关键落子。
日前,宽德投资旗下的“智能学习实验室(WILL)”正式亮相,标志着这家头部量化机构在人工智能领域的关键布局。据了解,WILL 致力于打造“超级科技助手”,旨在推动科学发现与技术突破,并不止步于传统金融场景的应用范围。
作为一个创新驱动的研发...
开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!

当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。
经常玩视频生成模型的同学应该知道,当前的很多模型仍然面临多方面挑战,比如难以还原复杂的人物动作,处理不好物体交互时的物理变...
一夜之间,萝卜快跑拿掉了所有安全员 | 量子位

一夜之间,萝卜快跑拿掉了所有安全员
杰西卡 2025-02-21 09:34:49 来源:量子位
平均1天跑12000天
1天12000单,累计超900万次乘车服务。
这是萝卜快跑的最新纪录,也是中国自动驾驶商业化的最新进程。
结合百度最新财报,李彦...
Grok3登上美区榜一!我们把它和DeepSeek对比了下:马斯克没瞎说

AI好好用报道
编辑:杨文
昨天,号称「地表最强」的 Grok3 突然上线。
我们第一时间冲到了「吃瓜前线」,体验了一把它的「Think」模式,但仅问了两个问题,它就「罢工」让付费。
就在我们充了会员后,就看到马斯克这哥们在 X 上高调宣布:
Grok3 免费,直到把服务器干崩!
(编辑部内心 OS:不早说,白瞎了我...
从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了

(来源:机器之心)
近日,上海 AI Lab 具身智能中心研究团队在机器人控制领域取得了最新突破,提出的 HoST(Humanoid Standing-up Control)算法,成功让人形机器人在多种复杂环境中实现了自主站起,并展现出强大的抗干扰能力。
这一创新不仅解决了机器人从坐姿到站姿的转换难题,还为未来人形机器人在家庭、医疗、救援...
Transformer作者之一Niki Parmar加入Anthropic,参与Claude 3.7 Sonnet研究

今天凌晨,Anthropic 的新旗舰模型如约而至,发布全球首个混合推理模型 Claude 3.7 Sonnet。
在这铺天盖地的宣传中,我们看到了经典 Transformer 论文作者之一 Niki Parmar 的身影,她是 Transformer 唯一女性作者。
从她的推文我们不难发现,Niki Parmar 已经早早加入了 Anthropic,时间大概是去年 12 月。在这期间,...
比尔盖茨自述:中学时期就开始偷偷996写代码 | 量子位

比尔盖茨自述:中学时期就开始偷偷996写代码
衡宇 2025-02-20 16:46:10 来源:量子位
翻窗夜奔,只为编程
57年前的西雅图冬夜,一个瘦削少年翻出卧室窗户,奔向名为“C的立方”的计算机实验室。
比尔·盖茨不会想到,这段在寒夜...
科学发现速度提高10倍?统计原则+智能体,斯坦福&哈佛提出自动化假设验证框架POPPER

编辑丨coisini
假设验证在科学发现、决策制定和信息获取中具有基础作用。无论是在生物学、经济学还是政策制定中,研究者往往依赖于检验假设来指导其结论。传统上,这一过程涉及设计实验、收集数据并分析结果以确定假设的有效性。
然而,随着大型语言模型(LLMs)的出现,AI 生成的假设数量急剧增加。虽然这些假设提供了...
谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现 | 量子位

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现
一水 2025-02-20 14:42:26 来源:量子位
CEO皮猜亲自站台
CEO皮猜亲自站台,谷歌的最新研究狠狠火了——
为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级...
中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果 | 量子位
中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果
克雷西 2025-02-19 17:23:24 来源:量子位
镍基材料首次突破麦克米兰极限
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI
中国高温超导,再迎新突破!
南方科技大学校...
Science | 深度学习为3亿年的大脑进化提供了新视角

编辑 | 白菜叶
在《Science》杂志发表的一项新研究中,比利时的一个研究小组探索了控制基因活动的基因开关如何定义不同物种的脑细胞类型。
他们用人类、小鼠和鸡的大脑数据训练了深度学习模型,发现虽然某些细胞类型在经过数百万年的进化后在鸟类和哺乳动物之间得到了高度保守,但其他细胞类型却以不同的方式进化。
这...
超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源

自动形式化数学定理证明,是人工智能在数学推理领域的重要应用方向。此类任务需要将数学命题和证明步骤转化为计算机可验证的代码,这不仅能确保推理过程的绝对严谨性,还能构建可复用的数学知识库,为科学研究提供坚实基础。
早在上世纪中叶,戴维斯、明斯基等不少逻辑学家、数学家、人工智能先驱便已在探索相关问题...
刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。
昨天,他们开源了第一个代码库 ——FlashMLA。这是一款用于 Hopper GPU 的高效型 MLA 解码核,仅用了 24 小时就达到了接近 8k 的 star 量(详情请参见《刚刚,DeepSeek 开源 FlashMLA,推理加速核心技术,Star 量飞涨中》...
2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来

|2025 WAIC 云帆奖面向华人 AI 青年人才开启全球征集
|欢迎点击文末「阅读原文」完成报名或提名!
当中国本土研发的 DeepSeek 展现世界级实力,当越来越多华人青年跻身全球 AI 创新前沿,我们比任何时候都更清晰地看到:一个由新生代力量主导的 AGI 进程正在加速展开。
在这个机遇与挑战并存的关键节点,WAI...
仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)