FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎

FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
随着 DeepSeek 引燃市场对于大模型私有化部署的热情,模型部署的效率与成本成为企业 AI 落地的关键瓶颈。 今天,清华系科创企业清程极智与清华大学翟季冬教授团队联合宣布开源大模型推理引擎「赤兔」(Chitu),率先实现了非 H 卡设备(英伟达 Hopper 架构之前的 GPU 卡及各类国产卡)运行原生 FP8 模型的突破。 在 A800...
2025年03月14日,13时23分 OpenAI 阅读 83 views 次

出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了

出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了
DeepSeek 引领的新一轮 AI 技术爆发才刚开始,激烈的应用侧竞争也进入了正在进行时。 由于官方服务器经常遭遇繁忙、限流等问题,各家云厂商的 MaaS 服务正在解决开发者们的燃眉之急。自 2 月份以来,各家云科技大厂纷纷上线满血版 DeepSeek V3、R1 大模型。它们不仅卷算力,也竞相提供更便捷的部署方案(从 API 到应用...
2025年03月14日,13时17分 OpenAI 阅读 59 views 次

MM-Eureka:极少数据实现多模态推理的R1-Zero时刻

MM-Eureka:极少数据实现多模态推理的R1-Zero时刻
尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。 例如,R1-V 仅在简单计数任务上表现出进步,未能实现回答长度的增长和顿悟时刻;R1-Multimodal-Journey 则在训练过程中回答长度反而降低;LMM-R1 虽然有所进步,但尚未在大规...
2025年03月14日,12时06分 OpenAI 阅读 38 views 次

CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景

CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景
本文的主要作者来自 VAST、北京航空航天大学、清华大学和香港大学。本文的第一作者为北京航空航天大学硕士生黄泽桓,主要研究方向为生成式人工智能和三维视觉。本文的通讯作者为 VAST 首席科学家曹炎培和北京航空航天大学副教授盛律。 在 Sora 引爆世界模型技术革命的当下,3D 场景作为物理世界的数字基座,正成为构建...
2025年03月14日,11时38分 OpenAI 阅读 27 views 次

arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读

arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读
还有人沉浸在阅读论文的苦恼吗?面对 arXiv 上浩如烟海的学术论文,你是否也曾感到无从下手? 复杂的术语、冗长的段落、晦涩的图表,仿佛一道道高墙,将知识与理解隔离开来。对于科研爱好者、学生甚至专业人士来说,读懂一篇论文往往意味着数小时的专注投入,甚至可能还需要反复查阅资料才能勉强理解其核心内容。 但...
2025年03月14日,11时48分 OpenAI 阅读 45 views 次

大模型平台+新一代智能客服双箭齐发!中关村科金领跑垂类大模型应用赛道

大模型平台+新一代智能客服双箭齐发!中关村科金领跑垂类大模型应用赛道
3月13日,由中关村科金与上海市人工智能行业协会联合主办的"DeepSeek企业应用之道——2025大模型技术与应用创新城市论坛"在上海圆满落幕。论坛汇聚金融、央国企、制造、零售等领域的400余位行业领袖,现场,中关村科金总裁喻友平发布基于DeepSeek全新升级的得助大模型平台2.5、得助智能客服4.0 两大...
2025年03月14日,11时13分 OpenAI 阅读 36 views 次

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人? 强化学习大牛、UC 伯克利教授 Pieter Abbeel 浅浅统计了一番:我带过的学生里,也就 12 个吧。 这些公司的名气都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都听说过。 刚刚,Pieter Abbeel 用一句...
2025年03月14日,11时38分 OpenAI 阅读 34 views 次

AI玩起抽象,让05后爱疯了,也成就这个最「狸谱」App

AI玩起抽象,让05后爱疯了,也成就这个最「狸谱」App
编辑 |杨文 还记得去年爆火出圈的 AI 模拟器《换你来当爹》吗? 玩家想方设法把一群逆子调教成「好大儿」,而相应的剧情和图片均由大语言模型实时生成。 最近,我们意外发现,这款 AI 模拟器背后的公司竟还出了个「狸谱」App,打出的口号就是面向 05 后二次元的「AIGC 抽象创作社区」。 本以为只是小打小闹,但一查数...
2025年03月14日,11时38分 OpenAI 阅读 28 views 次

老外「群殴」7万美刀中国机器人,竟吸引8千万人围观

老外「群殴」7万美刀中国机器人,竟吸引8千万人围观
编辑|杨文 还是老外会玩。 前段时间,一个名叫 Kai Cenat 的油管网红,靠「霸凌」机器人大火了一把。 截至目前,该视频在油管上已有 430 万播放量。 甚至 X 上转发的视频切片都有 8000 多万次播放量。 -1- 老外「殴打」中国机器人 事情是这样的。 Kai 花了 7 万美元,买了个宇树 G1 人形机器人,并带着它开了场直播...
2025年03月13日,19时06分 OpenAI 阅读 31 views 次

科研领域新成果:九章云极DataCanvas联合团队发布R1复现以及改进技术

科研领域新成果:九章云极DataCanvas联合团队发布R1复现以及改进技术
近日,中国人民大学STILL项目团队、北京智源研究院团队联合九章云极DataCanvas公司在大模型慢思考推理技术上形成系列技术成果,初步复现类R1推理模型,完整开源了类R1类的实现细节以及训练技巧。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME数学推理测试中超越DeepSeek-R1的模型性能。相关成果已经形成...
2025年03月13日,19时11分 OpenAI 阅读 37 views 次

“天工行者”定价29.9万元,优必选携国家队刷新全尺寸科研人形机器人底价

“天工行者”定价29.9万元,优必选携国家队刷新全尺寸科研人形机器人底价
人工智能、具身智能等产业的快速发展引起了广泛的关注,作为人工智能、具身智能技术的最佳载体,人形机器人正在为科学研究、高校教育带来前所未有的机遇。 3 月 12 日,优必选科技联合北京人形机器人创新中心(以下简称 “创新中心”)发布全尺寸科研教育人形机器人天工行者,不仅性能强悍,售价仅需 29.9 万...
2025年03月13日,14时36分 OpenAI 阅读 29 views 次

科学家构建多模态LLM框架,进行3D脑CT放射学报告生成

科学家构建多模态LLM框架,进行3D脑CT放射学报告生成
编辑 | 烂菜叶 多模态大型语言模型 (MLLM) 已经改变了现代医疗保健的格局,其中自动放射学报告生成 (RRG) 正在成为一种尖端应用。 虽然基于 2D MLLM 的 RRG 已经得到充分认可,但其在 3D 医学图像中的实用性仍未得到充分开发。 在这方面,台北荣民总医院(Taipei Veterans General Hospital)、台湾阳明交通大学(Natio...
2025年03月13日,14时58分 OpenAI 阅读 25 views 次

深度调研全球科研人员AI使用现状,威立发布权威报告中文版!

深度调研全球科研人员AI使用现状,威立发布权威报告中文版!
编辑 | ScienceAI AI 浪潮席卷全球,科研领域将迎来怎样的变革与先机? 2025 年 2 月,全球领先的研究与教育出版机构威立发布了基于对近 5000 名科研人员进行调研的研究报告 ExplanAItions。 该报告深入分析了人工智能在科研工作中的应用现状,颇具影响力的应用领域、各群体的使用意愿,以及出版机构如何协助科研人员更...
2025年03月13日,14时18分 OpenAI 阅读 29 views 次

阿里正式推出AI旗舰应用,新夸克发布“AI超级框”

阿里正式推出AI旗舰应用,新夸克发布“AI超级框”
3月13日,阿里巴巴宣布推出AI旗舰应用——新夸克。新夸克基于阿里通义领先的推理及多模态大模型,全面升级为一个无边界的“AI超级框”,为2亿用户带来全新体验。阿里巴巴表示,未来通义系列模型的最新成果都将第一时间接入夸克。 新夸克将告别传统搜索,升级为一个All in One的“AI超级框&rdqu...
2025年03月13日,11时53分 OpenAI 阅读 32 views 次

20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!

20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!
今天,视频生成领域迎来开源革命!Open-Sora 2.0—— 全新开源的 SOTA(State-of-the-Art)视频生成模型正式发布,仅用20 万美元(224 张 GPU)成功训练出商业级 11B 参数视频生成大模型,性能直追 HunyuanVideo 和 30B 参数的 Step-Video。权威评测 VBench 及用户偏好测试均证实其卓越表现,在多项关键指标上...
2025年03月13日,11时45分 OpenAI 阅读 39 views 次

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。 通常来说,这些方法在训练模型时可以产生比典型正确解决方案更长的轨迹,并包含了试图实现某些「算法」的 token:例如反思前一个答案、规划或实现某种形式的线性搜索。这些方法包括显式地微调预训练 LLM...
2025年03月13日,11时05分 OpenAI 阅读 35 views 次

YOLOe问世,实时观察一切,统一开放物体检测和分割

YOLOe问世,实时观察一切,统一开放物体检测和分割
它能像人眼一样,在文本、视觉输入和无提示范式等不同机制下进行检测和分割。 自 2015 年由华盛顿大学的 Joseph Redmon 研究团队提出 YOLO(You Only Look Once)以来,这项突破性的目标检测技术就像为机器装上了「闪电之眼」,凭借单次推理的实时性能刷新了计算机视觉的认知边界。 传统的 YOLO 系列如同我们人工效准的...
2025年03月13日,11时45分 OpenAI 阅读 28 views 次

长链推理表象下,大模型精细表征张冠李戴的本质

长链推理表象下,大模型精细表征张冠李戴的本质
作者:张拳石、陈鹭 近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。 然而,无论在学术界还是在工业界,目前对大模型应用的评测都是单纯在模型输出层面判断结果的准...
2025年03月13日,11时17分 OpenAI 阅读 15 views 次

阿里妈妈搜索广告2024大模型思考与实践

阿里妈妈搜索广告2024大模型思考与实践
作者:石士阿里妈妈技术团队 一、概览 随着大模型时代的到来,搜推广模型是否具备新的进化空间?能否延续像深度学习时期那样迸发旺盛的迭代生命?带着这样的过去,阿里妈妈搜索广告在两年的持续探索中,逐步成功清理了一些关键问题,落地了多个优化方向。现在,我们更加坚定地认为,搜推广模型与大模型的结合蕴藏着巨...
2025年03月13日,11时49分 OpenAI 阅读 48 views 次

AI写的论文能过审?双盲评审6.25分,达到ICLR研讨会水平

AI写的论文能过审?双盲评审6.25分,达到ICLR研讨会水平
去年 8 月,Transformer 论文作者之一 Llion Jones 与前谷歌研究者 David Ha 共同创立的人工智能公司 Sakana AI 推出了首个全自动科学发现的 AI 系统:AI Scientist,即「AI 科学家」。到 12 月份,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统 ASAL。这两项成果都吸引了无数眼球。 而就在...
2025年03月13日,11时29分 OpenAI 阅读 57 views 次

百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具

百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具
近日,阶跃星辰研究团队通过大规模实证探索,耗费了近 100 万 NVIDIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 100 万亿个 token,揭示了 LLM 超参数优化的全新的普适性缩放规律,为更好地提升 LLM 性能,提供了开箱即用的工具。该研究也是第一个全面研究模型最优超参随着 Model Shape、Den...
2025年03月13日,10时09分 OpenAI 阅读 46 views 次

20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭

20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭
DeepSeek 的风甚至吹到了美妆区。近日,一小红书博主跟足 DeepSeek 指示上妆,意外打造出「石矶娘娘」妆效,引发全网围观。一场看似无厘头的跨界实验,实则揭示了美妆与科技源远流长的共生关系:经济史上的「口红效应」本质就是技术迭代与消费心理的精准契合,而今 AI 又在重构美妆逻辑。 在美妆科技的赛道上,全球第一...
2025年03月12日,14时20分 OpenAI 阅读 28 views 次


用户登录