NEW AI算力需求涌向模型推理 国产芯片站上竞技台

2025年05月28日,16时48分42秒 机构观点 阅读 9 views 次

刚刚结束的COMPUTEX电脑展上,英伟达CEO黄仁勋笑着对听众说,“你(芯片)买得越多,赚得越多。”引来一阵笑声。

这句话的背景是,全球科技厂商在AI热潮下继续重金投入建设数据中心或算力中心。黄仁勋在演示文档上写着,英伟达正在驱动全球万亿美元级别的企业AI IT投资

数据中心建设热潮下,现在看来,AI算力需求的变化与年初一些业内人士预计的不太一样。DeepSeek对训练算力资源的节约,并未让整体算力需求减少。

不过,还有一个变化发生了,随着DeepSeek推动AI走向应用,用于推理的AI芯片占比正在升高。

市场研究机构IDC中国副总裁周震刚告诉第一财经记者,2024年中国数据中心加速卡中已有半数以上是推理卡,DeepSeek出现后,今年推理芯片占比预计还会增加。

这种芯片结构变化,可能会对AI芯片市场造成深远影响,特别是在中国市场。推理环节对AI芯片性能等的要求较低,国产AI芯片也可以使用,在英伟达出口受到限制的情况下,可能促成国内AI芯片的组成发生变化。

周震刚透露,去年国内数据中心加速卡市场中,国产算力占比大约三成,预计今年上半年占比应该会超四成。

第一财经记者了解到,这波数据中心或算力中心建设潮中,需求方来自高校、企业等,AI应用十分多元。而面向算力需求的变化,已有算力中心在计划调整芯片,使芯片组成更加多元、向模型推理倾斜。

算力需求来自哪里

数据中心或算力中心建设还在进行。IDC数据显示,中国加速计算服务器市场出货量2024年同比增长97.3%,预计2025年增长52.9%。

在中国招标投标公共服务平台,第一财经记者以智算中心为关键词搜索中标信息发现,截至今年5月26日,今年国内智算中心中标信息123条,是去年前5个月的2.2倍。这些信息围绕智算服务器设备采购、运维服务、电力模块采购、勘探、基建供配电工程施工等。

从中标信息数量看,国内智算中心建设提速是持续的过程。2023年国内智算中心中标信息53条,2024年猛增至213条。2024年上半年中标信息71条,下半年增加至142条,显示当年建设项目也在增多。

记者了解到,一些企业和高校有了更多算力需求,部分高校自购算力卡,部分购买云算力或超算中心算力。

香港科技大学冯诺依曼研究院院长贾佳亚告诉第一财经记者,学校此前购买了一批英伟达H800计算卡,香港只有香港科技大学有相对较多的H800,这是能将该研究院做成较大规模的背景。即便如此,有算力提供方告诉记者,该校在训练大模型,需求比较大,自己的算力不够,也需要其他算力来源。

近日华东理工大学则与腾讯云合作,推动AI与学科融合及科学研究降本增效等。该校副校长王慧锋告诉记者,高校科研对AI算力的需求增长是必然,该校也在探索AI+科学研究,例如有化学老师将AI算法用于锂电池催化设计,并将设计理念提炼出来做成智能体知识库,用于实践教学。目前学校采用混合云架构,部分算力本地化部署,另有大量计算放到云上,上云而不是完全自建机房的做法成本更优。王慧锋告诉记者,考虑到需求和数据安全等,目前高校采用私有和混合架构的模式是主流。

去年12月,香港规模最大的数码港人工智能超算中心投入服务,香港为申请使用者提供资助。记者了解到,申请使用该超算中心首阶段算力的主体就包括大学和科研机构。

数码港行政总裁郑松岩告诉记者,该超算中心目前有1300PFLOPS算力,第二阶段规划算力是1700PFLOPS,今年10月该超算中心算力将提升到3000PFLOPS。目前已审批通过10个申请,这些申请来自大学、科研机构、企业,用途包括学术研究、生物医疗、材料分析、大模型应用等,到本月底,第一阶段的算力使用率将超95%,预计接下来的申请会越来越多。

“一些大学在做教学相关项目,一些在研究可商业化的项目。有的大学在研究生物科学相关领域,也需要比较大的算力。目前不少大学是以开发项目为主来申请,个别大学会捆绑几个小项目一起申请,让学生做一些研究。现在有算力基本是先到先得。” 郑松岩表示。

(来源:天天基金网)



用户登录