
清华NLP开源RAG开箱即用框架,自动适配知识库无需纠结模型选型
梦晨 2025-01-29 15:37:16 来源:量子位
降低了学习成本和开发周期
RAG系统的搭建与优化是一项庞大且复杂的系统工程,通常需要兼顾测试制定、检索调优、模型调优...
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏 | 量子位

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
西风 2025-01-29 11:57:30 来源:量子位
网友:祝大家新年快乐,特别祝Sam
昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~
就在春晚直播进行时,阿里通义Qwen发...
德国车在华节节败退:保时捷销量大跌三成,奔驰下调利润目标,大众拉响警报 | 量子位

德国车在华节节败退:保时捷销量大跌三成,奔驰下调利润目标,大众拉响警报
杰西卡 2025-01-27 22:52:48 来源:量子位
奔驰CEO率先呼吁,欧盟应鼓励中国车企赴欧建厂
德系车慌了。
新年伊始,中国车企纷纷宣布刷新销量纪录,...
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini | 量子位

杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
衡宇 2025-01-28 10:37:54 来源:量子位
Qwen也在加班!横扫多个榜单
眼看着半只脚都跨进蛇年了,杭州城还是一如既往真卷啊!
今天凌晨4...
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观

AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。
OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型:
(来源:机器之心)
刚刚上线,已经有网友迫不及待的拿它和席卷...
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

本文的作者是李锡涵(Xihan Li)。他是伦敦大学学院(UCL)计算机系博士研究生,谷歌开发者专家,主要研究方向为学习优化,在 NeurIPS、ICLR、AAMAS、CIKM 等会议发表过学术论文,Circuit Transformer 作者,图书《简明的 TensorFlow 2》(https://tf.wiki)作者。
过年这几天,DeepSeek 算是彻底破圈了,火遍大江南...
全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!

当下,视频生成备受关注,有望成为处理物理知识的 “世界模型” (World Model),助力自动驾驶、机器人等下游任务。然而,当前模型在从 “生成” 迈向世界建模的过程中,存在关键短板 —— 对真实世界物理规律的刻画能力不足。
为此,来自悉尼大学、西澳大学等研究机构的研究者,带来了...
DeepSeek在美超越ChatGPT!问鼎苹果免费App第一 | 量子位

DeepSeek在美超越ChatGPT!问鼎苹果免费App第一
十三 2025-01-27 10:32:07 来源:量子位
昨天刚刚引爆一波复现潮
DeepSeek的热,还在持续ing。
就在刚刚过去的周末,DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排...
锌电池「返老还童」:电子科大联手湖北大学破解枝晶难题,效率提升99.95%!

编辑 | 2049
随着电动汽车和便携设备的普及,开发高性能、低成本的储能系统变得愈发重要。于是,科学家们将目光转向了一种古老而新颖的材料——锌。这种地壳含量约为 70ppm 的金属,凭借成本仅为锂的 1/10、极高的安全性和环境友好性,成为下一代电池的「潜力股」。
然而,锌电池也有其「阿喀琉斯之踵」:充放电过程中,锌...
成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体

编辑 |ScienceAI
优化酶的热稳定性对于蛋白质科学和工业应用至关重要。目前,通过(半)理性设计和随机诱变方法可以较为准确地设计多个增强酶热稳定性的单点突变。但当组合多个突变时,常常会出现复杂的上位效应,导致组合突变体完全失活。
因此,优化酶通常需要进行多轮设计,从而逐步引入单个突变位点,整个过程非常...
只是RAG了一下,我看到了AI大模型的态度! | 量子位

只是RAG了一下,我看到了AI大模型的态度!
十三 2025-01-27 13:31:27 来源:量子位
理解、检索、生成,协同优化
如果想让AI大模型在作答的时候,能够做到既准确又丰富,还能观点鲜明有态度,该怎么办?
或许,给它一个RAG(检...
AI 2025!8大热门赛道开年前瞻,从AI眼镜到推理Scaling一网打尽 | 量子位

AI 2025!8大热门赛道开年前瞻,从AI眼镜到推理Scaling一网打尽
十三 2025-01-27 13:25:39 来源:量子位
邀诸君共同参与或观望
明天就是辞旧迎新的春节假期,咱来点不一样的——
送上一份「年初展望」,站在2025年伊始,把AI科...
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini | 量子位

Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini
十三 2025-01-27 13:38:33 来源:量子位
在线可体验
谈到大模型的“国货之光”,除了DeepSeek之外,阿里云Qwen这边也有新动作——
首次将开源Qwen模型的上下文扩展到1...
万字长文解读Scaling Law的一切,洞见LLM的未来

Scaling Law 撞墙了吗?这算得上是近段时间 AI 领域最热门的话题之一。近日,资深机器学习研究科学家 Cameron R. Wolfe 更新了一篇超长的博客文章,详细介绍了 LLM scaling 的当前状况,并分享了他对 AI 研究未来的看法。
原文链接:https://cameronrwolfe.substack.com/p/llm-scaling-laws
近些年来,AI 领域的大...
硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注

大部分人可能想不到,2025 年的春节,大模型圈子竟然会这么热闹。
一切还要从十天前说起,DeepSeek 正式开源了 DeepSeek-R1,在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。一众 AI 研究者感到「震惊」,纷纷猜测这是如何做到的。英伟达市值几千亿美元级别的震荡,更是让全世界看得目瞪口呆。
关于 Deep...
ICLR 2025 | 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础模型

本文一作孟维康是哈尔滨工业大学(深圳)与鹏城实验室联合培养的博士生,本科毕业于哈尔滨工业大学,主要研究方向是大规模基础模型的高效训练和推理算法研究。
通讯作者张正教授,哈尔滨工业大学(深圳)的长聘教授及博士生导师,教育部青年长江学者,广东特支计划青年珠江学者,深圳市优青。长期从事高效能多模态机...
硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务

近日,DeepSeek-R1、DeepSeek-V3 大模型的开源引发全球震动,经过连日攻坚,2 月 1 日,硅基流动、华为云团队宣布为国内用户献上春节礼物:大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1。
硅基流动表示,无论是在昇腾上适配 DeepSeek-R1 & V3 双模型,还是在此前...
赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!

编辑丨&
人工神经网络(ANN)是大多数深度学习(DL)算法的核心,这些算法可以成功解决图像识别、自动驾驶和自然语言处理等复杂问题。然而,与能够高效解决类似问题的生物大脑不同,DL 算法需要大量可训练参数,这使得它们能耗高且容易过拟合。
来自希腊研究与技术基金会两位研究员示了一种新的 ANN 架构,它结合了...
Nature发布:2025年值得关注的七项技术

编辑 | 2049
2025 年,全球科技发展正以惊人的速度重塑人类社会的未来。在气候危机、疾病威胁与资源短缺的多重压力下,技术创新聚焦于两大核心方向:可持续性与人工智能(AI)的深度结合。
《Nature》盘点了今年将密切关注的七项技术,从实验室的自动化革命到城市的生态改造,从精准医疗到环境修复,七项技术不仅加速科...
AI语言模型的「人脑模式」:增量上下文机制如何让机器读懂长文本?

编辑 | 2049
想象一下,一位读者在长达数小时的阅读中,始终能精准捕捉情节脉络与情感起伏——这种人类特有的语言理解能力,源自大脑对时间尺度层级信息的动态整合。
然而,当前最先进的大语言模型(Large Language Models, LLMs)虽在文本生成任务中表现卓越,其固定长度上下文窗口的并行处理机制,却与生物神经系统的增...
豆包团队视频生成新突破:无需语言模型,仅凭"视觉"就能学习复杂任务 | 量子位

豆包团队视频生成新突破:无需语言模型,仅凭“视觉”就能学习复杂任务
十三 2025-01-27 13:47:13 来源:量子位
压缩视觉变化,让视频学习更加高效
豆包大模型团队 投稿
现有的视频生成模型,大多依赖语言或标签数据学习知识,...
鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜 | 量子位

鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜
十三 2025-01-26 16:22:10 来源:量子位
复杂学术搜索告别人工
中科院院士鄂维南、字节AI实验室总监李航领衔,推出高级论文搜索Agent。
名为PaSa...
奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek

奥特曼能不急吗?
被 DeepSeek 狂轰乱炸了一周后,终于在今天发布了新的模型 o3-mini。
此次发布,o3-mini 包含 low、medium 和 high 三个版本。
OpenAI 表示,今天发布的 o3-mini 是其推理模型系列中最新、最具成本效益的模型,已上线 ChatGPT 和 API 。
我们打开 ChatGPT,o3-mini 和 o3-mini-high 两个新模型已然上...
进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock
春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。
今天一觉醒来, DeepSeek R...
OpenAI洽谈巨额融资,估值有望达3000亿,部分用于「星际之门」
在中国 AI 初创公司 DeepSeek 持续引发热议之际,有消息称,OpenAI 正在进行新一轮融资谈判。
据 CNBC ...
线性扩散模型LiT来了,用极简线性注意力助力扩散模型AIPC时代端侧部署
王家豪,香港大学计算机系二年级博士,导师为罗平教授,研究方向为神经网络轻量化。硕士毕业于清华大...
27页综述,354篇参考文献!最详尽的视觉定位综述来了

论文题目:Towards Visual Grounding: A Survey
工作内容:视觉定位(Visual Grounding)任务十年发展系统性回顾
论文链接:https://arxiv.org/pdf/2412.20206
代码 / 仓库链接:https://github.com/linhuixiao/Awesome-Visual-Grounding.
作者:肖麟慧(中国科学院自动化研究所,中国科学院大学)
27 页...
360集团创始人周鸿祎宣布面向纳米AI搜索用户送100辆国产新能源汽车 | 量子位

360集团创始人周鸿祎宣布面向纳米AI搜索用户送100辆国产新能源汽车
十三 2025-01-26 16:27:33 来源:量子位
推广国产品牌
1月26日,360集团创始人周鸿祎宣布发起“刺激消费 推广国产品牌——纳米AI搜索送百辆新能源汽车回馈用户...
DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星 | 量子位

DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星
鱼羊 2025-01-26 11:41:07 来源:量子位
Open xx的风这回吹向了DeepSeek
当初OpenAI抛出Sora大饼,一时间Open Sora项目热火朝天。
现在,这股Open的风也是...
TeleAI "复杂推理大模型" 达竞赛级数学表现,评分超 o1-preview | 量子位
少数派报告-全球投资导向
我们将专门针对全球的经济政治状况,做最及时的分析与资讯共享。 同时将对国内的市场做适度的点评,提供各类关键分析资讯 我们的口号是:金钱永不眠!

Privacy Policy · Terms of Service · Contact Us
Copyright © 2014-2022 少数派报告 保留所有权利 (Registered:USA CA Fremont 94536)