让黄仁勋“低头”的存储,到底有多金贵?
文 | 松果财经
存储是前段时间最热的板块之一,但目前其利好消息还在增加。
一方面是农历新年前两天,黄仁勋在英伟达总部附近的韩式餐厅宴请30多位来自SK海力士和英伟达的工程师,主动调制烧啤,挨桌向他们敬酒;另一方面是假期中铠侠官宣一季度对北美客户涨价,三星则被报道称HBM4组件售价可能较上一代涨价三成,海力士也有涨价计划。
作为一个可参考的指标,国内为数不多的能间接投资于三星、海力士的中韩半导体ETF(SH:513310),估值在过去半年接近翻倍,且一度顶着超过10%的溢价率往上涨。
![]()
而在新春假期,存储行业利好带动韩国指数继续大涨,韩国ETF-iShares MSCI(ARCA:EWY)日内大涨近5%,无疑会继续刺激市场。
![]()
这些景象都源于英伟达对HBM4提出了非常高的要求,解决存储瓶颈依然是提升AI算力的关键。黄仁勋此前表示,3月16日的英伟达GTC大会上,将有一款“让世界感到惊讶”的新型芯片。如果英伟达希望继续捅破算力的天,那么安抚鼓励工程师就是最重要的事情之一。
HBM卡住了算力时代的“脖子”
HBM(高带宽内存)是一种通过垂直堆叠多片DRAM、再用TSV(硅通孔)把它们打通的存储器形态。它最大的特征不是存储规模,而是通信效率:单颗堆栈的带宽可以做到每秒数TB,比传统DDR快出一个数量级。
![]()
在大模型时代,Transformer结构有两个“吃内存”的大坑。训练时要计算所有token之间的关系,显存占用随序列长度二次增长。推理时为了支持长上下文,又要把键值缓存(KV Cache)留在显存里,token越多,线性吃掉的HBM越多。
结果就是因为通信不畅,GPU算力跑不满,在实际工作中限制了吞吐。这也是为什么英伟达一代又一代GPU的架构升级,在同样的架构tick-tock节奏下,第二次迭代往往不是算力翻番,而是HBM容量的倍数增长。
H100到H200,是在同构架下把HBM堆栈做大;B200到B300,同样是HBM容量+带宽的扩张;再往后的Rubin到Rubin Ultra,更是通过增加HBM数量和规格,大幅摧毁“内存墙”。
Vera Rubin时代,HBM4更加激进也更加重要,单堆栈通道数从8条翻到16条,引脚速率从个位数提升到每秒11Gb以上,单堆栈总带宽直接冲到3TB/s。某种意义上,HBM4几乎是整个系统性能差异化的主导因素之一。
英伟达给HBM4供应商下的指标,明显高于AMD等竞品体系所需的水准,它需要顶级配置,而SK海力士在去年末的新闻中,被曝获得了2026年55%以上的HBM供应份额,三星和美光都在倾力追赶。
HBM因此在存储赛道实现了“一人得道,鸡犬升天”的景象,它完全不像一个孤立品种,而是牵动了存储行业的走向。
2024年,全球存储芯片市场规模约1655亿美元,其中DRAM接近千亿美元,占到六成左右。中国一年光消耗DRAM就约250亿美元,是当之无愧的全球最大单一市场。DRAM市场中,三星、SK海力士、美光合计市占超过九成;NAND这三家加上铠侠、西数,合起来拿走60%以上。
![]()
AI导致行业的“极化”越发严重。从机构给出的预估情况看,2024—2028年全球HBM出货的复合增速有望超过50%,远远快于传统DRAM本身的增长;与此同时,高端服务器和AI训练集群对通用DRAM和企业级SSD的需求被“乘数”式放大。
于是,涨价潮出现了。仅在HBM上,三星的新一代HBM4报价传出接近700美元一颗,比HBM3E阶段贵30%左右,单颗的营业利润率有机会冲击50%—60%。
在这轮涨价周期里,原厂明显比上一轮更克制,不再是价格一涨就拼命扩产,而是在资本开支上向高毛利产品倾斜,优先给HBM和高端DRAM留产能;同时在产能节奏上保持默契,避免重演先暴涨后崩塌的老剧本。
极度集中的需求+极度集中的供给+主动有序的扩产,内存重新定价的权力结构暗藏其中。而这也是二级市场一浪接一浪的根源:虽然我们的潜龙依然“在渊”,但存储市场如此广阔,总会有同步从各个方面分到利润的角色出现。
从原厂到封测,国产分散的机会
从价值分布看,存储行业上游是设备和材料,中游是设计+制造+封测,下游是模组和终端应用。三星、SK海力士、美光这类企业自己做设计、自己建晶圆厂、自己掌控核心封装,大头利润自然集中在它们手上。
![]()
只做设计的轻资产存储厂更多活在细分赛道,比如特种存储、接口芯片、利基DRAM、车规存储。只做模组的企业则从组装差价中寻找生意机会,有明显的周期性。而封测环节长期被视作“薄利工种”,整体毛利在10%—20%之间。
但在HBM和3D NAND这类需要先进封装的品种上,故事有回旋余地。因为TSV打孔、硅贯通、高密度堆叠,这些都不是传统打线封装,一旦赌对方向,附加值可以明显增长。
举个例子,二级市场最受关注的几家封测企业之一,长电科技,拥有二十多年封装经验,多层堆叠做到32层闪存、高密度3D封装也在量产,且早早打通了2.5D/3D封装的工艺链条——硅中介层和TSV是HBM封装的地基。
同行业的通富微电通过和AMD的“合资+绑定”,在高端CPU/GPU封测上积累了大量经验,自建2.5D/3D产线,做过十几颗芯片集成的超大封装MCM,从工艺视角看,和HBM具备相似性。
此外还有深科技,旗下深圳沛顿、合肥沛顿一南一北布局内存封测线,前者已经贡献了数十亿元存储收入,后者虽然还在爬坡,却明确把多层堆叠工艺作为主攻方向。深科技曾在两年前否认涉及HBM业务。
如果假设未来几年全球HBM市场规模增长,如机构预期一般达到200亿—300亿美元,封测环节有望获得三分之一左右的规模。其中还有一个变量是国产存储企业——长江和长鑫的发展,这一点留待后文再议。但无论如何,国产HBM的未来并非空话。
向上游看,设备和材料方面,在TSV电镀方向,盛美上海凭借三维电镀设备,已经做到能在高宽深比超过10:1的深孔里实现无空洞铜填充,解决的是HBM垂直“电梯井”是否通畅的问题。在减薄、键合、CMP抛光这些工艺上,华海清科提供了一整套“打磨—减薄—清洗”的设备组合,直接对标HBM堆叠过程中的关键步骤。
还有存储芯片材料+光刻胶双龙头雅克科技,被调侃“值得看好是因为涨得最少”的计算、存储、模拟芯片厂商北京君正,都在被一双又一双眼睛牢牢盯住。由于技术原因,存储赛道的投资哲学更多是预期打满,你可以听到各种各样的故事。
![]()
CMP抛光液、电镀添加剂等特种化学品领域,国产厂商也在逐步渗透,虽然和日本、欧美巨头相比,整体国产化率仍偏低,但一些核心环节已经出现可选项。
原厂、封测、设备、材料,它们的收益链很清晰,只不过国产玩家相对小而散,这是历史和产业积累的原因。存储原厂必然在这一轮涨价周期里“吃肉”,设备、材料、封测则有望跟着“喝汤”,未来三年的业绩有保障。至于真正能改写行业历史的原厂玩家,现在即将登上舞台。
HBM替代的未来故事
“两长”在前,设备材料在后,三道难关,这是存储赛道火热行情中属于国内产业链的未来叙事。长鑫存储和长江存储,几乎快做到家喻户晓的地步了。
从通用存储视角看,长鑫在DRAM的全球市占率进入前四,成为除韩美三巨头之外唯一有规模的DRAM原厂;长江在NAND上的份额接近13%,可以和铠侠、美光并列第二梯队,在层数、成本和良率上,部分产品已经与国际巨头并肩,甚至局部超车。而且,后者家传的Xtacking技术,与HBM的TSV和混合键合技术相通,有打破壁垒的可能性。
当然,HBM技术路线总体十分陡峭,此前长鑫在传统DRAM上的演进路线,大致是从DDR3/DDR4起步,逐步量产1y、1z nm节点的DDR5。外部拆解证实,它在存储密度上已经追平了2021年前后的国际水准,只是良率还在爬坡。
所以HBM方向,它在2024年打造出HBM2芯片,进入送样和小批量阶段。根据公开信息,它正在全力推进HBM3,希望在未来一两年内完成量产,随后再冲刺HBM3E——如果节奏顺利,这意味着和国际一线的代差能够缩短一半。
这条路背后,是极高的资本开支和极重的资产负担。长鑫此前在招股书中披露的信息显示,它在两年多时间里资产总额几乎翻番,接近3000亿元,资产负债率维持在50%以上,典型的“高杠杆+高投入”状态。同期收入从80多亿元涨到200亿元上方,亏损额逐步收窄。
![]()
这显然不是管理不善,而是存储赛道的物理属性使然。新建一座DRAM晶圆厂,动辄就是百亿美元级别,工艺迭代会导致研发、厂房和设备成本持续增长。它背后的大基金尤为关注设备、材料、先进封装和AI存储,为之长期布局,现在正是攻关的关键时刻。
远期来看,我们的HBM补课仍有三大要点需要关注。
一是设备能力的短板。截至2025年,国内光刻机、EUV装备问题已老生常谈,刻蚀、沉积等环节虽然有中微、北方华创等企业突围,但在最先进节点上的份额仍有限。
DRAM和HBM要往1α nm及更先进的工艺节点迈进,没有EUV确实很难。好在美光曾经在无EUV条件下做出过1α nm DRAM,或多或少能提供一些思路。只是这条路需要更复杂的工艺设计和极致的过程控制,对设备和材料的要求更严苛。
二是良率和规模效应。存储芯片这轮涨价潮其实间接展示了它隐藏的大宗商品属性,长期一定会出现价格战。如果在高端节点上,国产方案的良率不达预期,那么单位成本将高于国际巨头,所以必须形成有效的规模效应。
当前,在对性能极致敏感、对成本不太敏感的本土场景里(比如内生安全要求极高的AI集群和特定体系、自主可控云平台),国产HBM/DRAM有确定的应用空间。而在完全开放竞争的商用市场里,国产HBM以可接受的成本和可靠性参与竞争,一边迭代一边扩大市场份额。
最后一个问题则是材料和底层化学体系。一颗HBM芯片背后,是一整套极其复杂的材料系统:硅片、光刻胶、掺杂气体、铜互连、绝缘介质、CMP抛光液、电镀液……目前高端制程用的电子特气国产化率不到5%,EUV光刻胶等关键产品还处于进口依赖阶段。
目前,已有厂商已经在部分品种实现突破,例如CMP抛光液领域有企业开始进入国际大厂认证名单,特种气体和硅片替代,在HBM紧贴的减薄、键合、铜互连环节,有国产支撑。而要把这些零散突破拼成一条足够可靠、规模化的国产供应链,需要在有外部约束和变动的情况下进行长期投入,这将是最大的挑战。
就在2月21日,OpenAI被曝大幅下调算力支出目标,从之前山姆·奥特曼吹出的1.4万亿美元“大饼”变成了6000亿美元。AI和算力带起来的存储风暴究竟会走向何方?此刻,故事悬而未决。
(来源:钛媒体)
