开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了
DeepSeek 在海内外搅起的惊涛巨浪,余波仍在汹涌。 当中国大模型撕开硅谷的防线之后,在预设中总是落后半拍的中国 AI 军团,这次竟完成了一次反向技术输出,引发了全球范围内复现 DeepSeek 的热潮。 DeepSeek-R1 虽然开源,但也没有完全开源,训练数据、训练脚本等关键信息并未完全公布。 不过,有技术报告,相当于拥...
2025年02月11日,15时58分 OpenAI 阅读 55 views 次

网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend
本文一作王勋广是香港科技大学的在读博士生,本科和硕士分别毕业于中国地质大学和哈尔滨工业大学,主要研究方向是大模型安全。通讯作者吴道远,香港科技大学研究助理教授,研究方向包括大模型安全、区块链和智能合约安全、移动系统和软件安全。通讯作者王帅,香港科技大学长聘副教授。研究方向包括 AI 安全、软件安全、...
2025年02月11日,15时34分 OpenAI 阅读 49 views 次

本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关

本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关
1985 年,著名计算机科学家、图灵奖得主姚期智提出了一个与哈希表有关的猜想。现在,40 年过去了,一名本科生却成功推翻了这个猜想。而这项成就却源自一个始于 2021 年秋的故事。 量子杂志近日报道了这个故事,机器之心编译了该文章以飨读者。 原文地址:https://www.quantamagazine.org/undergraduate-upends-a-40-ye...
2025年02月11日,14时19分 OpenAI 阅读 83 views 次

重塑A轿“智”高点,第二代秦PLUS智驾版携四大升级强势登场

重塑A轿“智”高点,第二代秦PLUS智驾版携四大升级强势登场
2月10日,备受瞩目的第二代秦PLUS智驾版正式上市,包含插混和纯电两种动力,共6款车型,插混版本售价区间为7.98万-10.38万元,纯电版本售价区间为10.98万-12.98万元。新车以智驾、动力、美学、智舱四大升级为核心,搭载天神之眼 C - 高阶智驾三目版(DiPilot 100),插混版车型全系标配第五代DM技术,再次树立A级轿车价...
2025年02月11日,14时10分 OpenAI 阅读 43 views 次

比亚迪也在接入DeepSeek!7万级标配高阶智驾,端到端全面铺开

比亚迪也在接入DeepSeek!7万级标配高阶智驾,端到端全面铺开
昨晚,比亚迪在深圳总部重磅发布了全民智驾战略。 (来源:机器之心) 在整车智能战略下,比亚迪构建的「天神之眼」技术矩阵让高阶智驾技术覆盖了全系车型。 比亚迪集团董事长、总裁王传福表示:「仅在 2025 年,比亚迪的目标是实现产销总量 60% 以上的车型搭载高速 NOA 及以上的智驾技术。」按照 500 万辆的产销目标推算...
2025年02月11日,14时38分 OpenAI 阅读 69 views 次

PNAS顶刊 | 抗体中和活性提升1000倍,百奥几何生成式AI高效反击病毒新变种

PNAS顶刊 | 抗体中和活性提升1000倍,百奥几何生成式AI高效反击病毒新变种
编辑丨Science AI 近日,百奥几何(BioGeometry)携手上海交通大学药学院朱建伟团队,基于生成式 AI 驱动的抗体优化策略,在短时间内精准优化 8G3 抗体,实现其对最新病毒变异株 JN.1 的中和活性 1000-1500 倍的跃升。相关研究成果已正式发表在国际顶级期刊《美国国家科学院院刊》(PNAS)上【1】,继 CR3022 抗体、肿...
2025年02月10日,15时35分 OpenAI 阅读 107 views 次

从人才流失到智慧回流:AlphaFold 试图重塑非洲科研DNA

从人才流失到智慧回流:AlphaFold 试图重塑非洲科研DNA
编辑丨toileter 2024 年,诺贝尔化学奖再次强调了结构生物学在现代科学中的变革性作用。它表彰了 David Baker 对蛋白质设计和 AlphaFold 开发的贡献。 AlphaFold 是一种最先进的 AI 工具,用于根据初级氨基酸序列预测蛋白质的 3D 结构。它加速和完善了对基于结构的药物设计至关重要的蛋白质建模,从而有可能应对全球健...
2025年02月10日,15时43分 OpenAI 阅读 41 views 次

Yandex 开发并开源 Perforator,这款开源工具每年可为企业节省数十亿美元的服务器基础设施成本

Yandex 开发并开源 Perforator,这款开源工具每年可为企业节省数十亿美元的服务器基础设施成本
全球领先的科技公司 Yandex 开发并开源了 Perforator,这是一款用于对服务器和应用程序进行持续实时监控和分析的创新工具。 Perforator 帮助开发人员识别最占资源的代码部分,并提供详细的统计数据,以便进行后续优化。通过识别代码中的低效部分并支持基于配置文件的优化,Perforator 提供了准确的数据,使企业能够手动...
2025年02月10日,15时07分 OpenAI 阅读 61 views 次

飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了

飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了
如果你最近经常使用 DeepSeek-R1,那你一定很熟悉以下截图了: 以至于我们人类也祭出奇招,非得让 DeepSeek-R1 亲自尝尝服务器繁忙失联的痛苦。 巨大的用户需求带来的巨大访问量已经让 DeepSeek 的服务器不堪重负,这也极大地影响了用户们的使用体验。于是各种替代官网的客户端和 API 的服务也不断涌现;与此同时,也...
2025年02月10日,15时47分 OpenAI 阅读 135 views 次

如何优化测试时计算?解决「元强化学习」问题

如何优化测试时计算?解决「元强化学习」问题
优化大模型的测试时计算是提升模型部署效率和节省计算资源的关键一环。前段时间,黄仁勋在 CES 2025 的演讲中把测试时 Scaling 形容为大模型发展的三条曲线之一。如何优化测试时计算成为业界关注的重要课题。 到目前为止,改进大型语言模型 (LLM) 的主要策略是使用越来越多的高质量数据进行监督微调 (SFT) 或强化学习 (...
2025年02月10日,15时22分 OpenAI 阅读 41 views 次

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率
在大语言模型(LLMs)的发展历程中, Scaling Laws [1] 一直是推动性能提升的核心策略。研究表明,随着模型规模和训练数据的增长,LLMs 的表现会不断优化 [2]。然而,随着训练阶段规模的进一步扩大,性能提升的边际收益逐渐减小,训练更强大的模型需要巨额投入。因此,研究重点逐渐从训练阶段的扩展转向推理阶段的扩展...
2025年02月10日,15时02分 OpenAI 阅读 72 views 次

北航推出TinyLLaVA-Video,有限计算资源优于部分7B模型,代码、模型、训练数据全开源

北航推出TinyLLaVA-Video,有限计算资源优于部分7B模型,代码、模型、训练数据全开源
近年来,随着多模态大模型的崛起,视频理解技术取得了显著进展。但是目前主流的全开源视频理解多模态模型普遍具有 7B 以上的参数量,这些模型往往采用复杂的架构设计,并依赖于大规模训练数据集。受限于高昂的计算资源成本,模型训练与定制化开发对于资源有限的科研人员而言仍存在显著的门槛。 近日,北京航空航天大学...
2025年02月10日,15时34分 OpenAI 阅读 91 views 次

ICLR 2025 | Diffusion Planner: 基于扩散模型的自动驾驶规划算法,nuPlan SOTA!

ICLR 2025 | Diffusion Planner: 基于扩散模型的自动驾驶规划算法,nuPlan SOTA!
本文介绍了清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室的发表于ICLR 2025的最新研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。该算法创新性地设计了基于 Diffusion Transformer 的自动驾驶规划模型架构,高效处理复杂场景输入,并联合建模周车运动...
2025年02月10日,11时10分 OpenAI 阅读 121 views 次

谷歌AlphaGeometry2攻克IMO几何难题,已超越金牌得主平均水准

谷歌AlphaGeometry2攻克IMO几何难题,已超越金牌得主平均水准
OpenAI 与 DeepSeek 卷得不可开交的时候,谷歌 DeepMind 的数学推理模型又偷偷惊艳了所有人。 在最新的一篇论文中,谷歌 DeepMind 介绍了全新进化的 AlphaGeometry 2,该系统在解决奥林匹克几何问题方面已经超过了金牌得主的平均水准。 论文标题:Gold-medalist Performance in Solving Olympiad Geometry with Alph...
2025年02月10日,11时11分 OpenAI 阅读 40 views 次

DeepSeek冲击下,奥特曼刚刚给出对AGI的「三个观察」,包括成本速降

DeepSeek冲击下,奥特曼刚刚给出对AGI的「三个观察」,包括成本速降
今天凌晨,OpenAI CEO 再次发布长文,重申自己对于 AGI 的三个观察。 核心观点如下: 1. 人工智能模型的智能大致等于用于训练和运行该模型的资源的对数。 2. 使用一定水平的人工智能的成本每 12 个月就会下降约 10 倍,而较低的价格会带来更多的使用。 3. 线性增长的智能的社会经济价值具有超指数性质。 DeepSeek 等...
2025年02月10日,11时19分 OpenAI 阅读 36 views 次

推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体

推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体
DeepSeek 以低成本模型搅动全球 AI 格局之际,OpenAI CEO Sam Altman 正在进行他的东京之旅。 与软银创始人孙正义敲定 5000 亿美元的巨额投资之前,Sam Altman 和 OpenAI CPO Kevin Weil 到访了东京大学,在师生问答环节中透露了更劲爆的消息: (来源:机器之心) 「在 OpenAI 内部,我们已经达到了 GPT-4.5,而达到 GPT-...
2025年02月09日,15时39分 OpenAI 阅读 34 views 次

Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法

Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。」 原文地址:https://sebast...
2025年02月09日,15时46分 OpenAI 阅读 48 views 次

小红书语音识别新突破!开源FireRedASR,中文效果新SOTA

小红书语音识别新突破!开源FireRedASR,中文效果新SOTA
语音识别(ASR,Automatic Speech Recognition)是一种将语音转化为文字的技术,被广泛应用于智能语音交互和多媒体内容理解领域,例如语音助手、语音输入、视频字幕等场景。衡量中文 ASR 性能的主要指标是字错误率(CER,Character Error Rate),该值越低,表示模型的识别效果越好。 近日,小红书 FireRed 团队正式...
2025年02月09日,15时22分 OpenAI 阅读 145 views 次

无需引导采样,清华大学提出视觉模型训练新范式

无需引导采样,清华大学提出视觉模型训练新范式
引导采样 Classifier-Free Guidance(CFG)一直以来都是视觉生成模型中的关键技术。然而最近,清华大学 TSAIL 团队提出了一种极其简单的方法,实现了原生无需引导采样视觉模型的直接训练。他们在 Stable Diffusion,DiT,VAR,LlamaGen,MAR 五个截然不同的视觉架构上进行了验证,一致发现新方法性能与 CFG 相当,而采...
2025年02月09日,15时18分 OpenAI 阅读 47 views 次

OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?

OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?
一则非常重要的消息:除了已有的视频生成功能,OpenAI 似乎还在为 Sora 推出图像生成功能做准备。 OpenAI 正在内部测试这些图像生成功能:包括一个新的隐藏切换按钮,能允许用户在提示栏中直接在视频和图像生成之间切换。如果切换到图像,提示栏的描述会提示你描述一幅图像。 OpenAI 还对 Sora 的视频推送进行了改版,...
2025年02月09日,15时33分 OpenAI 阅读 50 views 次

NeurIPS 2024 | 用LLM探寻隐秘的因果世界

NeurIPS 2024 | 用LLM探寻隐秘的因果世界
因果发现的现实挑战:稀缺的高级变量 寻找并分析因果关系是科学研究中的重要一环,而现有的因果发现算法依赖由专家预先定义的高级变量。现实场景中的原始数据往往是图片、文本等高维非结构化数据, 结构化的高级变量是十分稀缺的,导致现有的因果发现和学习算法难以用于至更广泛的数据。因此,香港浸会大学与MBZUAI、卡...
2025年02月08日,17时30分 OpenAI 阅读 28 views 次

从纳米到秒级:NanoPyx用AI技术革新显微镜图像处理,效率大幅提升!

从纳米到秒级:NanoPyx用AI技术革新显微镜图像处理,效率大幅提升!
编辑 | 2049 随着显微镜技术的飞速发展,尤其是超分辨率显微镜(Super-Resolution Microscopy)的出现,生物学家们得以在纳米尺度上观察细胞内部的动态过程,揭示了许多以往无法捕捉的生物学现象。 然而,这种技术进步也带来了新的挑战:显微镜图像的数据量呈指数级增长,传统的图像处理工具在处理这些大规模数据时显得...
2025年02月08日,17时01分 OpenAI 阅读 92 views 次

AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊

AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊
编辑 | 2049 在电磁波调控的舞台上,超材料曾凭借其人工设计的亚波长结构,打破了自然材料的物理限制,实现了负折射、隐身斗篷等奇异现象。 然而,当工程师试图将这类「魔法材料」应用于动态环境时,却发现传统超材料如同精密的机械手表 —— 虽能精准运行,却无法根据环境变化自主调整。这种矛盾在自动驾驶...
2025年02月08日,17时25分 OpenAI 阅读 27 views 次

图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和Inference Scaling新范式!

图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和Inference Scaling新范式!
第一作者,郭子瑜,是香港中文大学 MiuLar Lab 的博士生,本科毕业于北京大学,曾在 Amazon、Roblox、上海人工智能实验室、腾讯等机构实习,研究多模态大模型和 3D 视觉,一作代表作有 Point-LLM、PointCLIP、SAM2Point 等。 随着 OpenAI o1 向社区展示了思维链 Chain-of-Thought(CoT)对于大模型推理能力的强大提升...
2025年02月08日,16时45分 OpenAI 阅读 21 views 次

腾讯云上线DeepSeek模型API接口,率先支持联网搜索!

腾讯云上线DeepSeek模型API接口,率先支持联网搜索!
2月8日,腾讯云宣布上线DeepSeek-R1及V3原版模型API接口,通过强大的公有云服务,腾讯云可以为用户提供稳定优质的服务。同时,腾讯云旗下大模型知识应用开发平台知识引擎也接入了这两款模型,并率先支持联网搜索,结合知识库和RAG能力,开发者可以借助该平台实现分钟级搭建基于DeepSeek大模型的联网应用。腾讯云成为国内...
2025年02月08日,14时22分 OpenAI 阅读 46 views 次


用户登录