华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。在那个瞬间,模型学会了自我反思等涌现技能,帮助它进行上下文搜索,从而解决复杂的推理问题。 在 R1-Zero 发布后的短短几天内,连续几个项目都在较小规模(如 1B 到 7B...
2025年02月07日,14时04分 OpenAI 阅读 36 views 次

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法
自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的...
2025年02月07日,14时06分 OpenAI 阅读 53 views 次

中国主导身体,英伟达要做大脑,特斯拉“做整合”——大摩详解人形机器人100强公司!

中国主导身体,英伟达要做大脑,特斯拉“做整合”——大摩详解人形机器人100强公司!
  大摩从“大脑”、“身体”和“整合者”三大核心环节,首次系统梳理了全球人形机器人产业链的100家核心上市公司,并指出中国在人形机器人供应链中占据63%的份额,占主导地位,尤其在“身体”环节优势显著,特斯拉、英伟达等科技巨头则成为各环节的关键力量。 来源:硬AI 作者:李笑寅 在特斯拉最新的业绩会上,马斯克直言,Op...
2025年02月07日,13时00分 国内动态 阅读 37 views 次

将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思

将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思
“What I cannot create, I do not understand.”---Richard Feynman 尽管多模态大语言模型(MLLM)在简单任务上最近取得了显著进展,但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻:只有掌握推理过程的每一步,才能真正解决问题。然而,当前的 MLLM 更擅长直接生成简短的最终答案,...
2025年02月07日,13时10分 OpenAI 阅读 58 views 次

A股新增开户156万,2025年首月开户数超上年6个月份,新开户驱动力正释放

A股新增开户156万,2025年首月开户数超上年6个月份,新开户驱动力正释放
转自:财联社 财联社2月7日讯(记者 王晨)上交所最新披露2025年1月A股新开股票账户数据。数据显示,2025年1月个人投资者新开A股账户达156.3888万户,机构投资者新开户数为0.6097万户。尽管较2024年部分月份的高点有所回落,但这一数据仍显示出市场在新年开局阶段的稳健态势。 如何看156万的开户数据?2024年有6个月新...
2025年02月07日,13时21分 国内动态 阅读 51 views 次

ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA

ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA
新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队,专注于开源语音基础引擎研发,从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路,旨在提高智能语音任务的准确率和效率。 目前,新一代 Kaldi 项目 (https://github.com/k2-fsa)主要由四个...
2025年02月07日,13时54分 OpenAI 阅读 40 views 次

感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整

感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整
DeepSeek 带来的压力已经传递给了每一个科技公司。最近一段时间,很多生成式 AI 产品正在加速更新技术。 今天凌晨,OpenAI 为 ChatGPT 上线了多项更新,其中之一是让用户可以更详细地查看 o3-mini、o3-mini-high 的思维链内容。 但遗憾的是,ChatGPT 向用户展示的并非完整的思维链,而是经过总结的版本(而且这个总结...
2025年02月07日,13时44分 OpenAI 阅读 24 views 次

多地强化生态环境分区管控,这份关键“拼图”仍待完善

多地强化生态环境分区管控,这份关键“拼图”仍待完善
到2025年,生态环境分区管控制度基本建立,全域覆盖、精准科学的生态环境分区管控体系初步形成。 被称为美丽中国建设关键“拼图”的生态环境分区管控,今年将在全国范围内加力推进,以科学指导各类开发保护建设活动。 生态环境分区管控是以保障生态功能和改善环境质量为目标,实施分区域差异化精准管控的环境管理制度。中...
2025年02月07日,13时41分 国内动态 阅读 27 views 次

突然大量出现!有人几天收入超5万元 事关DeepSeek

突然大量出现!有人几天收入超5万元 事关DeepSeek
DeepSeek爆火之后,第一批用它“搞钱”的人已经出现了。 打开各大社交平台,关于DeepSeek的相关教程层出不穷,从如何使用DeepSeek的基础概念,到教授如何使用指令集、提示词更好命令DeepSeek,再到如何用其赚钱。这些课程的价格从几元到几百元不等,有人短短几天收入已超5万元,还有社区平台仅会员费收入就超过18万元。 ...
2025年02月07日,13时02分 机构观点 阅读 61 views 次

一张图看18个直盘外汇支撑阻力:美元+欧系日系+商品货币+新兴货币(2025/02/07)

一张图看18个直盘外汇支撑阻力:美元+欧系日系+商品货币+新兴货币(2025/02/07)
汇通财经APP讯——一张图看直盘支撑阻力:美元+欧系日系+商品货币+新兴货币,更新于2025/02/07周五12:50,具体美元/欧元/日元/英镑/瑞郎/澳纽加元+人民币/港币/卢布/兰特/克朗等18个直盘,更多详见汇通财经析若特制图表中的内容。 如图数据显示,解读1:本文支撑阻力基于日图PP而来。 ★ 美元指数 USD INDEX的“日图PP”显示...
2025年02月07日,13时17分 外汇大宗 阅读 51 views 次

搭上人形机器人“风口” 这座三线城市的房价率先突围

搭上人形机器人“风口” 这座三线城市的房价率先突围
今年春晚,人形机器人“C位出道”,它们扭秧歌的灵活舞姿,悄然带动了稀土产业的热潮——春节一过,A股稀土板块持续走强,多家稀土上市公司冲击涨停,机构纷纷看好行业需求增长。 而江西赣州,这座看似普通的中部城市,正试图打好手上的“稀土牌”。 作为“稀土王国”,赣州的稀土产业规上营收占到了全国的三分之一,这座城市凭...
2025年02月07日,13时46分 机构观点 阅读 47 views 次

你坐过电影院的按摩椅吗?背后公司九个月赚了1个亿

你坐过电影院的按摩椅吗?背后公司九个月赚了1个亿
刚刚过去的春节假期,你是否注意到影院放映厅里不少座椅早已换成了智能按摩椅?这些按摩椅有专门公司运营吗?又有多少人会在看电影时付费按摩呢? 智能按摩椅吸金能力如何? “乐摩吧”主要通过在商场、影院等地提供智能按摩服务被外界熟悉。 近日,“乐摩吧”母公司福建乐摩物联科技股份有限公司(简称乐摩物联)递交招股书...
2025年02月07日,13时16分 机构观点 阅读 83 views 次

一张图看商品支撑阻力:金银油气+铂钯铜农产品期货(2025/02/07)

一张图看商品支撑阻力:金银油气+铂钯铜农产品期货(2025/02/07)
汇通财经APP讯——一张图看商品支撑阻力:金银油气+铂钯铜+农产品期货,更新于2025/02/07周五12:50,具体覆盖金银铂钯铜+原油天然气燃油+小麦玉米棉花14个品种,更多详见汇通财经析若特制图表中的内容。 如图数据显示,解读1:本文支撑阻力基于日图PP而来。 ★ 现货黄金 XAU/USD的“日图PP”显示:其枢轴点位于2854.35,对应...
2025年02月07日,13时57分 外汇大宗 阅读 46 views 次


用户登录