自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕

自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕
「所有投资者都在押注应用层…… 对训练能力存在强烈的负面偏见…… 我担心这是一场冒险赌注和市场误判。」这是一篇标题为「The Model is the Product(模型即产品)」的文章的主要观点。 文章指出,当前很多企业都以集成商的形式在提供 AI 服务,也就是调用 OpenAI、Anthropic 等大公司模型的...
2025年03月08日,15时15分 OpenAI 阅读 29 views 次

字节跳动Trae一手实测来了,懂编程也懂中文用户的AI IDE

字节跳动Trae一手实测来了,懂编程也懂中文用户的AI IDE
前些天,字节跳动的 AI IDE 产品 Trae 上线了国内版本,其具备「中文语境深度适配 + 全功能免费开放」的双重杀手锏,一上线就收获了不少支持者。全网一片夸赞,很少能看见批评的声音。 现在,虽然 Trae 的热度已经有所退减,但仍旧是非常值得我们关注的 AI IDE。机器之心也上手体验了一番,探索了其编程、图像理解以及文...
2025年03月08日,15时45分 OpenAI 阅读 67 views 次

夸克、DeepSeek登上全球AI应用排行榜TOP10

夸克、DeepSeek登上全球AI应用排行榜TOP10
全球AI格局正在改变,中国AI应用集体崛起。3月7日,全球著名投资基金、咨询公司a16z发布最新一期的《2025年全球100生成式AI消费级应用排行榜》。在移动端AI应用排行榜中,阿里巴巴旗下夸克排在第6位,成为跃升速度最快、最具竞争力的国产AI应用。 在移动端排行榜中,中国AI应用取得了非常亮眼的成绩,共有五款产品进入...
2025年03月08日,15时55分 OpenAI 阅读 46 views 次

Manus刷屏,汇智智能企业级Agent已在路上

Manus刷屏,汇智智能企业级Agent已在路上
继 DeepSeek 之后,一款由国内开发的通用 AI Agent 产品也引发热议。 3月6日凌晨,来自中国的创业公司Monica正式对外发布全球首款通用型AI Agent产品Manus。可与DeepSeek不同的是,Manus引发的争议褒贬不一,不过,其背后折射出的是国人对于Agent应用落地的迫切心情。 在国产大模型取得突破性进展的当下,大家自然更加期...
2025年03月08日,15时00分 OpenAI 阅读 28 views 次

实测字节免费AI编程,还让不让Cursor活了 | 量子位

实测字节免费AI编程,还让不让Cursor活了 | 量子位
实测字节免费AI编程,还让不让Cursor活了 克雷西 2025-03-04 13:06:32 来源:量子位 满血版DeepSeek R1已全面接入 国内首个原生AI IDE(集成开发环境),来自字节,实测在此: 哪怕一点代码都不懂,只要能说出自己的需求,就...
2025年03月07日,20时11分 OpenAI 阅读 64 views 次

全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键
仅仅过了一天,阿里开源的新一代推理模型便能在个人设备上跑起来了! 昨天深夜,阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B,其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。 基准测试数据显示,QwQ-32B 在数学推理、代码生成及通用任务处理能力上实现了显著突破,充分展现了强化学习应用于预训练基础模...
2025年03月07日,20时27分 OpenAI 阅读 41 views 次

纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science

纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
编辑 | 2049 想象一下,如果我们能像观察夜空中闪烁的星星一样,清晰地观察到原子在材料表面的「舞动」,这将为理解材料功能打开一扇全新的大门。 然而,传统的电子显微镜技术面临着一个根本性挑战:要实现毫秒级时间分辨率的原子尺度成像,必须大幅降低电子束剂量,而这导致图像被噪声淹没,模糊了关键细节。 为了解决...
2025年03月07日,16时11分 OpenAI 阅读 30 views 次

Nature封面:探索真菌网络,用机器人进行高通量延时成像研究

Nature封面:探索真菌网络,用机器人进行高通量延时成像研究
编辑 | ScienceAI 丛枝菌根(AM)共生关系是自然界中最为广泛的共生伙伴关系之一。4.5 亿年来,菌根真菌构建了用于与植物根系交换养分资源的网络。经过 4.5 亿年的自然选择,AM 网络的灵活性和响应性极强。一个引人深思的问题是:AM 网络的设计能否为人类构建的供应链架构提供启示? 为了监测 AM 网络的构建过程,来自...
2025年03月07日,13时51分 OpenAI 阅读 26 views 次

Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了

Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了
编辑丨coisini 识别显微镜图像中的对象,例如光学显微镜(LM)下的细胞和细胞核是生物学图像分析中的关键任务之一。由于显微镜成像方式的多样性和不同维度(二维 / 三维,时间维度)的存在,这些识别任务具有挑战性,目前需要采用不同的方法来解决。 基于深度学习的方法在过去几年中显著改善了 LM 下的细胞和细胞核分...
2025年03月07日,13时13分 OpenAI 阅读 54 views 次

11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP

11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP
编辑 | 萝卜皮 大型语言模型 (LLM) 在化学和生物医学研究中取得了显著进展,可作为各种任务的多功能基础模型。 浙江大学侯廷军、谢昌谕以及南方医科大学姜志辉等课题组组成的联合团队提出了 AMP-Designer,这是一种基于 LLM 的方法,用于快速设计具有所需特性的抗菌肽 (AMP)。 在 11 天内,AMP-Designer 实现了 18 种...
2025年03月07日,13时41分 OpenAI 阅读 32 views 次

不吹不黑,拿到邀请码一手实测Manus,还有人0天就复刻出了开源版

不吹不黑,拿到邀请码一手实测Manus,还有人0天就复刻出了开源版
昨天,一个叫「Manus」的通用 AI Agent 产品引起热议。它可以完成从文件处理、数据分析、代码编写到内容创作等多种任务,比如帮助用户生成旅行计划、分析股票数据、筛选简历或开发简单的网页游戏。 (来源:机器之心) 但是,由于「Manus」只发放了少量邀请码,能够体验到这款应用的人数目前还比较少。在电商平台上,邀请...
2025年03月07日,13时56分 OpenAI 阅读 44 views 次

千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。 一出手就是号称「世界上最好的 OCR 模型」! 新产品 Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。与其他模型不同,Mistral OCR 能够以前所未有的准确度和认知能力理解文档的每个元素(媒体、文本、表格、公式)。它以图像和 PDF 作...
2025年03月07日,13时36分 OpenAI 阅读 28 views 次

谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造
谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。 据外媒 The Information 本周四报道,拉里・佩奇成立了名为 Dynatomics 的创业公司,旨在用人工智能颠覆制造业。 有两位知情人士透露,佩奇和一小群工程师正在研究如何使用大语言模型(LLM)为各种物体创建高度优化的设计,然后让工...
2025年03月07日,13时11分 OpenAI 阅读 28 views 次

CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集
随着生成式人工智能技术(AIGC)的突破,文本到图像模型在故事可视化领域展现出巨大潜力,但在多角色场景中仍面临角色一致性差、布局控制难、动态叙事不足等挑战。 为此,北京大学、上海人工智能实验室、南洋理工大学联合推出 DiffSensei,首个结合多模态大语言模型(MLLM)与扩散模型的定制化漫画生成框架。 论文...
2025年03月07日,13时51分 OpenAI 阅读 49 views 次

FP8训练新范式:减少40%显存占用,训练速度提高1.4倍

FP8训练新范式:减少40%显存占用,训练速度提高1.4倍
近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。这表明,FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。 近期,来自伯克利,英伟达,MIT 和清华的研究者们提出了显存高效的 FP8 训练方法:COAT(CompressingOptimizer states andActiva...
2025年03月07日,10时30分 OpenAI 阅读 47 views 次

DeepSeek行业实战指南:下周四这场闭门会速来围观!

DeepSeek行业实战指南:下周四这场闭门会速来围观!
DeepSeek “接入潮” 持续火热,如何安全、可靠、高效地集成 DeepSeek 等先进 AI 能力,已成为各行各业当前关注的焦点。为系统性解决企业从技术选型到价值落地的全链路挑战,加速企业部署 DeepSeek 步伐,由张江集团、机器之心主办,模力社区协办的「DeepSeek 部署应用与技术开发」闭门研讨会,将于 3 月 13 ...
2025年03月07日,10时24分 OpenAI 阅读 70 views 次

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了
复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongHeads、多视觉专家大模型MouSi,发表ACL、ICLR、EMNLP等顶会顶刊论文 20 余篇。 DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为...
2025年03月06日,21时00分 OpenAI 阅读 49 views 次

强化学习成帮凶,对抗攻击LLM有了新方法

强化学习成帮凶,对抗攻击LLM有了新方法
事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。它既能帮助 AlphaGo 击败顶级围棋棋手,还能帮助 DeepSeek-R1 获得强大的推理能力,但它也可能被恶意使用,成为攻击 AI 模型的得力武器。 近日,威斯康星大学麦迪逊分校的一个研究团队发现,可以通过强化学习对模型实施有效的黑盒逃避攻击(B...
2025年03月06日,21时19分 OpenAI 阅读 40 views 次

当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?

当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?
2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。与此同时,一个隐藏在超大规模模型身后的技术命题浮出水面:如何让千亿参数超大规模 AI 模型真正达到商业级推理速度?这一问题的答案,隐藏在推理引擎 SGLang 的代码仓库中。该项目由 LMSYS Org 发起,并受到 xAI、NVIDIA、A...
2025年03月06日,21时59分 OpenAI 阅读 58 views 次

腾讯混元上线图生视频模型,我们用7个Prompt测试了下

腾讯混元上线图生视频模型,我们用7个Prompt测试了下
AI好好用报道 编辑:杨文 腾讯打了场「闪电战」。 3 月 3 日,腾讯元宝反超 DeepSeek,登顶中国区苹果 AppStore 免费榜榜单第一。 要知道,春节前,腾讯元宝的排名还在 200 名开外,在一众大模型面前就是个「小卡拉米」,但自从接入 DeepSeek 后,仅用了 10 天时间,就一口气杀到榜单第二。 紧接着又用了不到...
2025年03月06日,18时33分 OpenAI 阅读 37 views 次

Science子刊,AI与生物物理建模相结合,设计新型蛋白质

Science子刊,AI与生物物理建模相结合,设计新型蛋白质
编辑 | 萝卜皮 机器学习 (ML) 正在改变计算蛋白质设计的世界,数据驱动方法在实验成功率方面超越了基于生物物理的方法。然而,它们通常被报告为案例研究,缺乏整合和标准化,因此很难进行客观比较。 在最新的研究中,德国莱比锡大学(Leipzig University)的跨学科研究团队在 Rosetta 软件框架内建立了一个精简且多样化...
2025年03月06日,18时20分 OpenAI 阅读 47 views 次

智源开源多模态向量模型BGE-VL:多模态检索新突破

智源开源多模态向量模型BGE-VL:多模态检索新突破
BGE 系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型 BGE-VL,进一步扩充了原有生态体系。BGE-VL 在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。BGE-VL 借助大规模合成数据 MegaPairs 训练而成。这一设计具备以下两大核心优势: 优异的可扩展性:MegaPairs 结...
2025年03月06日,18时16分 OpenAI 阅读 58 views 次


用户登录