500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式 2025年02月26日,14时14分29秒 OpenAI 阅读 55 views 次 部署 DeepSeek 系列模型,尤其是推理模型 DeepSeek-R1,已经成为一股不可忽视的潮流。 不只是 AI 和云服务商在部署 DeepSeek 系列模型以提供 AI 服务,很多企业和组织也在部署它们来助力自家的业务,比如为自己的员工提供支持,或者让自己的服务变得更加强大。甚至很多学校也在部署自己的 DeepSeek-R1 以辅助教育和助力「学生建立正确使用 AI 价值观」,包括中国人民大学、北京交通大学、浙江大学、上海交通大学等等,其中一些甚至采用了本地部署「满血版」DeepSeek-R1 的做法。 本地部署自己的 DeepSeek-R1 固然是一种选择,但对绝大多数(尤其是规模较小的)企业和组织来说,这个选择并非最优,因为本地部署往往需要在技术、安全和运维等方面投入大量资金和人力资源。 作为替代,基于云的部署或许是一种更合理选择。事实上,现在已有不少云服务商在争夺这方面的业务,其中包括国内所有主要的云服务商,如腾讯云、阿里云和火山引擎;这些云服务商为了争夺市场份额,纷纷推出了各种优惠措施,力图在这后 DeepSeek-R1 时代初期占据更大的市场份额。 而要说哪家云服务商最有可能夺得这场竞赛的头筹,相信很多人都会不假思索地给出一个答案:火山引擎。并且,原因不仅仅是火山引擎的性价比最高,更在于其能提供高速、可靠和安全的服务,保证企业能够稳健地在云上部署自己的 AI 模型和服务。就连 DeepSeek-R1 模型也非常认可火山引擎在 AI 模型部署上的优势。 DeepSeek-R1 分析在火山引擎部署 AI 模型的优势 不管是速度还是性能,火山引擎的强劲表现已经得到了 SuperCLUE 和基调听云等多个第三方评测平台的认可,比如基调听云便在《大模型服务性能评测 DeepSeek-R1 API 版》中写到:「火山引擎在平均速度、推理速度、生成速度上表现最优,且可用性高达 99.83%,在 API 接入上首选推荐。」 图源:基调听云 前段时间,火山引擎更是领先全网将每位用户的初始 TPM(每分钟 token 数)上调到了 500 万!一时之间吸引了无数眼球。此外,火山引擎也已经成功将 TPOT(输出每个 Token 的时间)稳定地降低到了约 20 ms,成为了国内延迟最低的大规模 AI 模型推理服务 —— 要知道 DeepSeek-R1 在思考时往往会生成大量 token,单 token 输出降低几毫秒时间就足以大幅加速输出过程。 物美价廉,火山引擎为什么能成为后发先至的云服务商?主要是得益于其为 AI 时代的云服务率先总结出了自己的方法论:AI 云原生。 AI 云原生:下一个十年的云计算新范式 对于熟悉云计算的读者而言,「云原生」这一概念应该并不陌生。简单来说,云原生(Cloud-Native)是指围绕云计算开发和部署应用的方法论,其核心目标是让应用更好地适应云环境的特性,实现高可伸缩性、弹性、可用性和自动化管理等优势。同时,由于云原生可通过云架构带来弹性存算分离、服务化等特性,企业能够非常高效地去构建自己的大规模业务系统。云原生架构被广泛认为是过去十年计算技术发展的关键范式之一,它为现代应用的可扩展性、灵活性和高效性打下了坚实的基础。 基于这一发展背景,「AI 云原生」则是将云原生理念应用到人工智能(AI)领域,专注于 AI 工作负载的云端构建和部署。2024 年 12 月,火山引擎成为了国内首个提出并实践「AI 云原生」的厂商。当时,火山引擎总裁谭待在 2024 冬季火山引擎 FORCE 原动力大会上表示:「我们认为下一个十年非常重要的事是计算范式从云原生的,尽管本地部署能给一些大规模组织提供可定制的灵活性,但对于多数企业而言,成本、技术、运维等层面的挑战往往让本地部署变得不可承受。 在这样的背景下,基于云的解决方案显得尤为重要。火山引擎凭借「AI 云原生」的理念,展现出了与时俱进的技术优势。从「以 GPU 为核心」到「以模型为核心」,通过对存储和网络架构的重新设计,以及在性能、稳定性、安全性等多方面的卓越表现,火山引擎 AI 云原生不仅仅是技术的创新,更是未来十年内推动 AI 应用蓬勃发展的基础。而这次展示的 DeepSeek 系列模型四步部署方法论正是火山引擎为企业大模型部署打造的 AI 云原生样板间。 后 DeepSeek-R1 时代,AI 发展的脚步不会停歇,火山引擎作为强大的后盾,将成为推动 AI 应用大爆发的关键力量。从加速 AI 模型的部署到实现更广泛的行业落地,火山引擎无疑将在未来的 AI 生态中占据重要席位,助力各行各业进入更加智能化的时代。 关联资讯: 荐 假冒账号太多,DeepSeek发声明 02月06日 DoNews2月6日消息,据DeepSeek官方公众号通知,近期,部分与 DeepSeek 有关的仿冒... 荐 曝 DeepSeek 考虑首次从外部融资 02月20日 据 The Information 报道,DeepSeek 正考虑首次从外部融资。 DeepSeek 一直没有... 荐 DeepSeek:从未发行任何虚拟货币,请大家注意甄别 02月06日 IT之家 2 月 6 日消息,深度求索公司今日发布“关于 DeepSeek 官方信息发布及服务渠... 荐 阿里云百炼上线全尺寸DeepSeek模型,1元最高可享受200万tokens 02月09日 IT之家 2 月 9 日消息,阿里云宣布百炼平台全面上线 DeepSeek-V3、DeepSeek-R1、De... 荐 中文在线:已在部分内部AI网文创作流程中部署DeepSeek-R1 02月05日 IT之家 2 月 5 日消息,中文在线今日宣布,目前,公司已在部分内部 AI 网文创作流... 荐 七牛云(02567)DeepSeek系列模型全面上线 全参版满血体验、蒸馏版一键部署 02月11日 智通财经APP获悉,2月11日,知名音视频服务平台七牛云(02567)宣布上线 DeepSeek-R1...
荐 阿里云百炼上线全尺寸DeepSeek模型,1元最高可享受200万tokens 02月09日 IT之家 2 月 9 日消息,阿里云宣布百炼平台全面上线 DeepSeek-V3、DeepSeek-R1、De...
荐 七牛云(02567)DeepSeek系列模型全面上线 全参版满血体验、蒸馏版一键部署 02月11日 智通财经APP获悉,2月11日,知名音视频服务平台七牛云(02567)宣布上线 DeepSeek-R1...