内存通胀“终结者”?谷歌公开最新极限压缩算法

内存通胀“终结者”?谷歌公开最新极限压缩算法
破解算力问题,降低模型所需的存算空间,有很多种途径,是减少训练时算力,还是减少推理时算力?稀疏化、量化、压缩、蒸馏等手段,都是方法之一。只是当前鉴于不同方法的优势特征,各家模型企业及研究机构都会选择不同的策略。 以长上下文任务为例,过去两年,AI算法团队曾提出要以键值缓存(KV Cache)为中心的分离架...
2026年03月26日,14时15分 科技新知 阅读 8 views 次

聊聊Token出海的生意经:模型开源给世界,中国赚什么?

聊聊Token出海的生意经:模型开源给世界,中国赚什么?
1 本周末有一条 AI 新闻挺有意思,跟大家聊聊。 AI 编程工具 Cursor 在 3 月 19 日发布了新模型 Composer 2,官网上写的是「自有模型」。 Cursor 是目前全球最火的 AI 编程工具,本质上是一个深度集成了 AI 能力的 VS Code 修改版(国内类似的是字节的 TRAE)。从 2024 年 10 月 Composer 1 发布以来,外界就一直怀疑它...
2026年03月26日,13时13分 科技新知 阅读 3 views 次

一篇论文引发存储芯片股暴跌,Google 的DeepSeek 时刻来了?

一篇论文引发存储芯片股暴跌,Google 的DeepSeek 时刻来了?
看过 HBO 神剧《硅谷》(Silicon Valley)的朋友,想必都对那个名为 Pied Piper(魔笛手)的虚构公司念念不忘。 在剧中,男主角 Richard Hendricks 发明了一种「中间压缩算法」,能以极高的压缩率无损处理文件,甚至因此改写了整个互联网的规则。 当时我们都以为这只是编剧的脑洞。直到 Google Research 正式发布了名为...
2026年03月26日,13时09分 科技新知 阅读 6 views 次


用户登录