o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观

o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: (来源:机器之心) 刚刚上线,已经有网友迫不及待的拿它和席卷...
2025年02月03日,00时37分 OpenAI 阅读 44 views 次

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
本文的作者是李锡涵(Xihan Li)。他是伦敦大学学院(UCL)计算机系博士研究生,谷歌开发者专家,主要研究方向为学习优化,在 NeurIPS、ICLR、AAMAS、CIKM 等会议发表过学术论文,Circuit Transformer 作者,图书《简明的 TensorFlow 2》(https://tf.wiki)作者。 过年这几天,DeepSeek 算是彻底破圈了,火遍大江南...
2025年02月03日,00时30分 OpenAI 阅读 42 views 次

全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!

全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!
当下,视频生成备受关注,有望成为处理物理知识的 “世界模型” (World Model),助力自动驾驶、机器人等下游任务。然而,当前模型在从 “生成” 迈向世界建模的过程中,存在关键短板 —— 对真实世界物理规律的刻画能力不足。 为此,来自悉尼大学、西澳大学等研究机构的研究者,带来了...
2025年02月03日,00时50分 OpenAI 阅读 35 views 次

锌电池「返老还童」:电子科大联手湖北大学破解枝晶难题,效率提升99.95%!

锌电池「返老还童」:电子科大联手湖北大学破解枝晶难题,效率提升99.95%!
编辑 | 2049 随着电动汽车和便携设备的普及,开发高性能、低成本的储能系统变得愈发重要。于是,科学家们将目光转向了一种古老而新颖的材料——锌。这种地壳含量约为 70ppm 的金属,凭借成本仅为锂的 1/10、极高的安全性和环境友好性,成为下一代电池的「潜力股」。 然而,锌电池也有其「阿喀琉斯之踵」:充放电过程中,锌...
2025年02月02日,18时02分 OpenAI 阅读 51 views 次

成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体

成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体
编辑 |ScienceAI 优化酶的热稳定性对于蛋白质科学和工业应用至关重要。目前,通过(半)理性设计和随机诱变方法可以较为准确地设计多个增强酶热稳定性的单点突变。但当组合多个突变时,常常会出现复杂的上位效应,导致组合突变体完全失活。 因此,优化酶通常需要进行多轮设计,从而逐步引入单个突变位点,整个过程非常...
2025年02月02日,18时13分 OpenAI 阅读 17 views 次

只是RAG了一下,我看到了AI大模型的态度! | 量子位

只是RAG了一下,我看到了AI大模型的态度! | 量子位
只是RAG了一下,我看到了AI大模型的态度! 十三 2025-01-27 13:31:27 来源:量子位 理解、检索、生成,协同优化 如果想让AI大模型在作答的时候,能够做到既准确又丰富,还能观点鲜明有态度,该怎么办? 或许,给它一个RAG(检...
2025年02月02日,16时27分 OpenAI 阅读 17 views 次

万字长文解读Scaling Law的一切,洞见LLM的未来

万字长文解读Scaling Law的一切,洞见LLM的未来
Scaling Law 撞墙了吗?这算得上是近段时间 AI 领域最热门的话题之一。近日,资深机器学习研究科学家 Cameron R. Wolfe 更新了一篇超长的博客文章,详细介绍了 LLM scaling 的当前状况,并分享了他对 AI 研究未来的看法。 原文链接:https://cameronrwolfe.substack.com/p/llm-scaling-laws 近些年来,AI 领域的大...
2025年02月01日,21时37分 OpenAI 阅读 67 views 次

硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注

硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注
大部分人可能想不到,2025 年的春节,大模型圈子竟然会这么热闹。 一切还要从十天前说起,DeepSeek 正式开源了 DeepSeek-R1,在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。一众 AI 研究者感到「震惊」,纷纷猜测这是如何做到的。英伟达市值几千亿美元级别的震荡,更是让全世界看得目瞪口呆。 关于 Deep...
2025年02月01日,20时55分 OpenAI 阅读 63 views 次

ICLR 2025 | 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础模型

ICLR 2025 | 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础模型
本文一作孟维康是哈尔滨工业大学(深圳)与鹏城实验室联合培养的博士生,本科毕业于哈尔滨工业大学,主要研究方向是大规模基础模型的高效训练和推理算法研究。 通讯作者张正教授,哈尔滨工业大学(深圳)的长聘教授及博士生导师,教育部青年长江学者,广东特支计划青年珠江学者,深圳市优青。长期从事高效能多模态机...
2025年02月01日,20时07分 OpenAI 阅读 63 views 次

硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务

硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务
近日,DeepSeek-R1、DeepSeek-V3 大模型的开源引发全球震动,经过连日攻坚,2 月 1 日,硅基流动、华为云团队宣布为国内用户献上春节礼物:大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1。     硅基流动表示,无论是在昇腾上适配 DeepSeek-R1 & V3 双模型,还是在此前...
2025年02月01日,18时54分 OpenAI 阅读 166 views 次

赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!

赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!
编辑丨& 人工神经网络(ANN)是大多数深度学习(DL)算法的核心,这些算法可以成功解决图像识别、自动驾驶和自然语言处理等复杂问题。然而,与能够高效解决类似问题的生物大脑不同,DL 算法需要大量可训练参数,这使得它们能耗高且容易过拟合。 来自希腊研究与技术基金会两位研究员示了一种新的 ANN 架构,它结合了...
2025年02月01日,17时33分 OpenAI 阅读 60 views 次

Nature发布:2025年值得关注的七项技术

Nature发布:2025年值得关注的七项技术
编辑 | 2049 2025 年,全球科技发展正以惊人的速度重塑人类社会的未来。在气候危机、疾病威胁与资源短缺的多重压力下,技术创新聚焦于两大核心方向:可持续性与人工智能(AI)的深度结合。 《Nature》盘点了今年将密切关注的七项技术,从实验室的自动化革命到城市的生态改造,从精准医疗到环境修复,七项技术不仅加速科...
2025年02月01日,17时38分 OpenAI 阅读 307 views 次

AI语言模型的「人脑模式」:增量上下文机制如何让机器读懂长文本?

AI语言模型的「人脑模式」:增量上下文机制如何让机器读懂长文本?
编辑 | 2049 想象一下,一位读者在长达数小时的阅读中,始终能精准捕捉情节脉络与情感起伏——这种人类特有的语言理解能力,源自大脑对时间尺度层级信息的动态整合。 然而,当前最先进的大语言模型(Large Language Models, LLMs)虽在文本生成任务中表现卓越,其固定长度上下文窗口的并行处理机制,却与生物神经系统的增...
2025年02月01日,17时18分 OpenAI 阅读 58 views 次

奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek

奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek
奥特曼能不急吗? 被 DeepSeek 狂轰乱炸了一周后,终于在今天发布了新的模型 o3-mini。 此次发布,o3-mini 包含 low、medium 和 high 三个版本。 OpenAI 表示,今天发布的 o3-mini 是其推理模型系列中最新、最具成本效益的模型,已上线 ChatGPT 和 API 。 我们打开 ChatGPT,o3-mini 和 o3-mini-high 两个新模型已然上...
2025年02月01日,12时57分 OpenAI 阅读 23 views 次

27页综述,354篇参考文献!最详尽的视觉定位综述来了

27页综述,354篇参考文献!最详尽的视觉定位综述来了
论文题目:Towards Visual Grounding: A Survey 工作内容:视觉定位(Visual Grounding)任务十年发展系统性回顾 论文链接:https://arxiv.org/pdf/2412.20206 代码 / 仓库链接:https://github.com/linhuixiao/Awesome-Visual-Grounding. 作者:肖麟慧(中国科学院自动化研究所,中国科学院大学) 27 页...
2025年01月31日,22时14分 OpenAI 阅读 65 views 次


用户登录