超越思维链?深度循环隐式推理引爆AI圈,LLM扩展有了新维度

超越思维链?深度循环隐式推理引爆AI圈,LLM扩展有了新维度
这是一种全新的语言模型架构,能够通过使用循环语言模型在潜在空间中隐式推理,显著提升模型的计算效率,尤其是在需要复杂推理的任务上。 近日,马里兰大学的一篇论文在 AI 研究社区中引发了关注,其提出的语言模型通过迭代循环块来工作,能在测试时展开到任意深度。这与当前通过生成更多 token 来扩展计算的主流推理模...
2025年02月12日,17时04分 OpenAI 阅读 28 views 次

外交部:中国将持续优化入境政策 不断扩大免签国家范围

外交部:中国将持续优化入境政策 不断扩大免签国家范围
外交部发言人郭嘉昆主持今天(2月12日)举行的例行记者会。有记者问:有关部门公告显示,东盟国家旅游团自2月10日起可免签入境云南西双版纳。数据显示,今年春节,中国共接待来自175个国家和地区的入境游客逾343万人次,同比增长6.2%。有评论认为,这充分体现了中国不断便利中外人员往来政策的成效。发言人对此有何评论...
2025年02月12日,17时53分 机构观点 阅读 19 views 次

美国不满对AI严格监管 外交部:反对将经贸科技问题政治化

美国不满对AI严格监管 外交部:反对将经贸科技问题政治化
2月12日,外交部发言人郭嘉昆主持例行记者会。法新社记者提问,美国副总统万斯在人工智能峰会上对AI的严格监管表示不满,美国也没有签署峰会的联合声明。对于这些言论以及美方立场,中方有何回应? “我刚才已经介绍了中方代表团出席人工智能行动峰会的有关情况。”关于人工智能合作,郭嘉昆表示,我们多次强调中方积极拥...
2025年02月12日,17时28分 机构观点 阅读 45 views 次

淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1

淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1
当看到这条消息时,机器之心编辑部陷入了集体沉默。作为一个免费开源的模型,DeepSeek 竟能让倒卖商如此大赚特赚,也着实让人震惊。而这也从侧面佐证了 DeepSeek 模型引发的本地部署热潮是多么汹涌。 图源:微博 @扬子晚报 打开淘宝和拼多多,搜索 DeepSeek,我们能看到电子货架上摆满了琳琅满目的本...
2025年02月12日,17时47分 OpenAI 阅读 28 views 次

京东入局,千亿外卖市场新战事又起

京东入局,千亿外卖市场新战事又起
出品|网易科技《态度》栏目 作者|李姝 编辑|丁广胜 谈起外卖平台,许多消费者第一反应往往是美团或者饿了么。这两大平台在市场上占据主导地位。现在,“一条鲶鱼”京东入局,千亿外卖市场迎来新变数。 2月11日,京东官宣启动外卖业务,并同步开启 “品质堂食餐饮商家” 招募计划。京东表示,2025年5月1日前入驻的商家,全年...
2025年02月12日,17时49分 科技新知 阅读 61 views 次

教育部认定一批学前教育普及普惠县

教育部认定一批学前教育普及普惠县
教育部认定一批学前教育普及普惠县 近日,教育部印发通知,通过县级自评、市级初核、省级评估、国家认定的程序,2024年认定天津市滨海新区等301个县(市、区)为学前教育普及普惠县。其中,浙江省湖州市、衢州市,山东省青岛市、东营市,福建省厦门市,新疆维吾尔自治区博尔塔拉蒙古自治州等6个市(州)已全域通...
2025年02月12日,17时47分 国内动态 阅读 30 views 次

地产股异动 万科A涨停!券商股尾盘直线拉升 DeepSeek概念股再度走强

地产股异动 万科A涨停!券商股尾盘直线拉升 DeepSeek概念股再度走强
2月12日,A股市场全天震荡走高,创业板指领涨。截至收盘,沪指涨0.85%,深证成指涨1.43%,创业板指涨1.81%。沪深两市全天成交额1.68万亿元,较上个交易日放量413亿元。 盘面上,地产股尾盘异动,万科A涨停;券商股尾盘直线拉升,天风证券涨停;芯片股午后爆发,韦尔股份等涨停;DeepSeek概念股再度走强。下跌方面,黄...
2025年02月12日,17时28分 机构观点 阅读 85 views 次

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA
在最近的一篇论文中,来自字节跳动、北京大学等机构的研究者提出了 Sa2VA。市面上第一个结合 SAM-2 和 LLaVA-like 的视频多模态大模型,结合了 SAM-2 和 LLaVA 的优势,实现了时空细粒度的理解。 论文地址:https://arxiv.org/pdf/2501.04001 项目主页:https://lxtgh.github.io/project/sa2va/ GitHub 地址:h...
2025年02月12日,17时42分 OpenAI 阅读 45 views 次

如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践

如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践
本文的通讯作者是北京大学计算机学院长聘教授李戈。 本文一作是 aiXcoder 蒋思源和北大李戈教授课题组博士生李佳,团队重点关注融合深度学习与软件工程的代码建模方法。 如何训练一个代码大模型?这一过程看似简单:获取代码数据、清洗数据,最终启动训练。如今,开源代码数据集层出不穷;数据清洗工具也已成熟,包括开...
2025年02月12日,17时02分 OpenAI 阅读 69 views 次

腾讯翻译君旗下产品将于3月13日整体下线,相关服务整合至腾讯元宝App

腾讯翻译君旗下产品将于3月13日整体下线,相关服务整合至腾讯元宝App
IT之家 2 月 12 日消息,腾讯翻译君 App 显示,腾讯翻译君旗下产品(腾讯翻译君-在线翻译、翻译君 App 和翻译君小程序)将于 3 月 13 日整体下线,正式停止运营,相关服务将整合至腾讯元宝 App。 官方表示,当前大模型正在深刻改变翻译产品。为了给用户一致的体验,我们计划将翻译服务迁移至腾讯元宝。基于此调整,腾讯...
2025年02月12日,17时56分 科技新知 阅读 122 views 次

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式
一.引言 推理大语言模型(LLM),如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等,通过模拟人类推理过程,在多个专业领域已超越人类专家,并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习(Reinforcement Learning)和推理规模(Inference scaling)。 主流的大模型强化学习算法,...
2025年02月12日,17时52分 OpenAI 阅读 42 views 次


用户登录