优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效
LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens 的序列。然而,这也给 KV cache 的存储带来了严峻挑战。为应对这一难题,“hybrid model” 成为了一条备受关注的可行路径:它在标准 transformer 的部分层中引入更高效的注意力机制(如 RNN 或 sliding window attention)...
2025年03月10日,17时54分 OpenAI 阅读 57 views 次

香港Web3嘉年華部分議程揭曉:中國香港虛擬資產政策2.0時代將何去何從?

香港Web3嘉年華部分議程揭曉:中國香港虛擬資產政策2.0時代將何去何從?
香港Web3嘉年華部分議程揭曉:中國香港虛擬資產政策2.0時代將何去何從? 日期:2025年3月10日 下午4:57編輯:Annie 3月7日,在加密貨幣行業灼熱的目光中,首屆白宮加密峰會落幕。這場備受關注的會議並未釋放出任何實質性政策信號。而中國香港,作為明確支持虛擬資產發展,並已在長達兩年多的時間内,穩健推行各...
2025年03月10日,17时28分 港股动态 阅读 72 views 次

你的荣耀手机学会点屏幕了,为什么笨 AI 也有未来?

你的荣耀手机学会点屏幕了,为什么笨 AI 也有未来?
在移动世界通信大会 MWC 2025 上,我们看到荣耀和订餐订位产品 OpenTable 做的一次演示:用户用语音命令手机 AI 助理找家西班牙餐馆订个位,接着就看到手机屏幕被「接管」,一通自己操作。 这个 MWC 版本的演示,其实和荣耀去年 Magic 7 Pro 发布会上策划的那次「行为艺术」,是同一件事。 当时在深圳的发布会上,时任...
2025年03月10日,15时49分 科技新知 阅读 69 views 次

DeepSeek+机器人,解锁了什么?

DeepSeek+机器人,解锁了什么?
文 | 半导体产业纵横 年初,两大科技热点分别是DeepSeek国产AI大模型的火爆和宇数科技国产“秧歌”机器人的走红。AI和机器人行业在海外资本市场经验来看也是共同发展的,甚至不少概念标的有较大重合度。 2月17日,民营企业座谈会在北京召开。这是继2018年后,中央时隔七年再度召开民营企业座谈会,引发社...
2025年03月10日,14时00分 科技新知 阅读 49 views 次


用户登录