字节跳动在春节点亮自己的ChatGPT时刻

2026年02月17日,12时06分20秒 科技新知 阅读 2 views 次

字节跳动在春节点亮自己的ChatGPT时刻

文丨陈然

2026 年 2 月初,中国的两大互联网公司腾讯阿里巴巴率先打响了新一年的 AI 大战——腾讯的元宝端出 10 亿元现金激励,并上线新的 AI 社交功能 “元宝派”;阿里的千问拿出 30 亿元的福利,鼓励用户在 App 里点外卖

尽管字节跳动在这之前已经靠火山引擎夺得了这一年央视春晚的总冠名,但在红包与补贴的喧嚣中,它并未成为舆论主角。直到农历春节前一周,视频生成模型 Seedance 2.0 问世,在创作者圈与行业讨论中迅速发酵,把它重新推回了讨论中心。2 月 14 日,字节跳动陆续上线了豆包大模型 2.0 与图像创作模型 Seedream 5.0 Lite。

除夕当晚,字节跳动又带着火山引擎、豆包 App,以及 Seed 系列大模型来到了春晚舞台上。从舞美视效、机器人说话到播出保障,AI 第一次如此全面地渗透进了春晚这场全民狂欢之中。

就连互动玩法也被重新设计:观众需要调用豆包里的大模型生成图片或文字才能获得红包福利。红包里不只有现金,还有 3D 打印机、汽车、无人机、机器人等科技产品。

这是字节的春节战役。

一位字节跳动人士告诉我们,相比许多公司把春节当作单纯的增长机遇,他们更希望在这个节点,创造关于 AI 和科技的集体记忆;也试图告诉外界,做 AI 不是只做一、两款应用,而是要服务各个产业。据了解,春晚上送出去的科技产品都是豆包大模型的客户。

官方数据显示,除夕当天豆包的 AI 总互动 19 亿。除夕前,备受国内外关注的视频生成模型 Seedance 2.0 和最新的豆包大模型 2.0Pro 也接连第一时间接入豆包(『专家』模式),让先进的模型能力第一时间落到产品触达用户。

无论是与新春等生活场景的贴合,还是模型能力上限的提升,可以说,豆包都已具备国民级 AI 产品的特征。

在过去几年的科技行业,最有说服力的增长故事从来不是借补贴堆出来的。2022 年 11 月,ChatGPT 掀起全球 AI 热潮后,靠着模型迭代成为了一个周活跃用户数达 8 亿的超级产品;两年多后走红的 DeepSeek 在没有任何广告投放、没有多模态能力的情况下,稳定维持着超过 3000 万的日活跃用户数。

字节跳动 CEO 梁汝波在年初的员工大会上将公司 2026 年的关键词设定为了 “勇攀高峰”。他提到,AI 时代存在很多重要的机会,字节要追求其中最重要的,去攀登最高的高峰。

“真正的 AI 攻势,是坚决把自己变成一家科技企业。” 上述字节跳动人士说。2026 年春节,这家公司正试图点亮自己的 ChatGPT 时刻。

从水墨舞台、机器人到算力洪峰,不一样的春节战役

作为少有的全民级晚会平台,春晚在过去十年里一直是各互联网公司重要的新用户增长渠道,它与一众互联网产品之间的合作也几乎与 “红包” 绑定。从 2015 年开始,微信、支付宝、淘宝、京东、抖音、拼多多、快手等知名互联网产品均在春晚上发放过红包福利。

但在今年春晚,冠名方火山引擎接到的第一个任务却是与舞台视觉相关的。

一位字节跳动人士告诉我们,今年春晚导演组一直在探索将最新科技和传统文化艺术相结合。因此作为独家 AI 云伙伴,火山引擎及其背后的字节跳动不仅要以赞助方身份参与冠名,还要把 AI 与云计算能力嵌入到春晚节目的创作与制作流程中。

在《驭风歌》这个节目里,歌手身后出现了一幅国宝级的骏马水墨画。节目筹备时,导演组并不满足于将其当作一个静态背景,而是希望让这些马匹在舞台空间里动起来,并与歌手互动。

为了达成这个效果,他们最初试过一些海外模型,但大多抓不住水墨画的气韵;国内模型也同样受限,水墨风格的高质量训练语料稀缺,生成出来的画作风格容易跑偏。更棘手的是运动一致性:马要跑得流畅,却又必须在每一帧都贴合原画的笔触与结构、不变形;马匹的数量、每匹马之间的动作都要始终保持一致。

转折来自字节跳动团队带来的 Seedance 2.0。这个全新的视频生成模型不仅能更好地遵循物理规律,让马的步态更接近真实,关节衔接自然、动作连贯;还能很好地遵循导演的要求,实现像 “跑慢一点”“鬃毛飘动轻一点” 这类带副词的细微调度指令。它还有另一个重要的突破——模型不再是只能学单张图的风格,而是能同时学习大量不同风格的多模态素材。

一位字节春晚项目组人士告诉我们,他们把导演组画的草图、水墨画作,还有许多关于马的影像素材一起喂给模型,通过参考生成的方式,实现画风与动作能稳定地在同一个标准之下生成。他们还绕开了直接写提示词的方式,改用 Seedance 2.0 与图像生成模型 Seedream 协作:先由 Seedream 生成每一帧关键帧,再由 Seedance 在关键帧约束下生成动态视频,实现了风格的一致性和运动的连贯性。

把理想中的效果表现出来只是第一步。春晚的每个节目迭代频率都极高,因此字节团队常遇到的情况是,刚交付一版满意的画面,导演组马上提出:“能不能再往前走一步”。这些节目还需要经历反复过审与验收,这也意味着他们每次都必须拿出更好的版本。“整体节奏基本得按 ‘周’ 来迭代推进。” 上述字节春晚项目组人士说。

很快新的难题又出现了。虽然《大闹天宫》《小蝌蚪找妈妈》等上美影经典作代表了手绘全动画的巅峰,但在 AI 数字化生成的语境下,如何在高帧率、高分辨率的现代广播标准中,让水墨这种 ‘无边界’ 的艺术形式在高速大运动下不闪烁、不崩坏,是行业公认的难题。

考虑到主流视频生成模型通常输出 720p 或 1080p 分辨率、24 帧/秒的视频,字节团队将突破点放在后处理链路,借助火山引擎视频点播的画质增强能力升级画质:先通过超分技术,在不改变画面内容的前提下将较小尺寸的画面放大至 6K 或 8K;再通过插帧技术将帧率从 24FPS 提升至 50FPS。这套处理也非一刀切的通用算法,而是能根据每一帧画面的画质与内容特点做专属优化。最终他们顺利解决了这个难题。

除了舞美,字节团队还将 AI 能力带入了春晚的多个环节。舞台上出现的机器人接入了豆包的视觉大模型、文本大模型和语音识别模型,语音侧采用了豆包的合成与复刻模型。模型让它们不仅有了 “大脑”,还装上了 “嘴巴” 和 “耳朵”。

他们还提前收集了舞蹈演员的 3D 素材,再利用了空间视频技术,将舞蹈演员制作成 3D 数字分身,在舞台上实现真人 3D 克隆效果让观众难辨真假。最后又加上了字节自研的 4D 高斯算法、豆包大模型优化光影效果。

豆包 App 是今年春晚与观众互动的核心载体。与往年常见的在互联网产品上摇红包、抢红包不同,今年互动流程改为,用户需先在豆包上用大模型生成头像或新春祝福,再抢红包。这样的变化极大抬高了成本——以往红包互动形式的主要开销集中在网络、IO 和实时连接,现在则在原有基础上叠加了庞大的算力请求与算力支出。

调控算力资源的难题也在大幅上升。一位字节的春晚项目组人士保守测算,用户生成一条新春祝福或一张图片,一次请求就需要完成 10 TOPS(每秒 10 万亿次操作)的计算量。而以往类似互动请求的计算量仅约 1/100000 TOPS,两者在算力需求上相差了整整 100 万倍。与此同时,他们在除夕当晚还要应对抖音、今日头条等产品春节活动带来的大模型调用。

由于时间紧迫,字节没办法靠临时堆机器顶住算力洪峰。好在火山方舟顶了上来,这是字节统一调度算力的总控台,长期在字节和外部客户的各类高并发场景中沉淀了资源调度能力。火山方舟的一个特点是将推理、训练和离线任务放进同一资源池统一统筹,因此在春节算力与流量峰值来临时,系统能把可延迟的负载错峰挪开,为各类春节活动腾出更多资源。

这不是件容易做到的事情。它涉及到海量场景、多个机房、多种机型和多类模型,还要持续动态分配资源。一位火山引擎人士把这个过程形容为 “装箱”:一方面,不同流量的延迟要求不同、对异构硬件的依赖不同,约束极多、解空间巨大;另一方面,大模型推理不像传统 CPU 服务那样资源类型相对统一,同一个推理服务里也可能混用多种硬件。更麻烦的是,GPU 的迁移不是单点动作,存储、网络、上游负载均衡等配套资源也要协同迁移,否则算力挪过去也接不住流量。

“冠名春晚对字节来说,不再是一场简单的增长活动,它更像一次真正的技术试炼。” 一位字节跳动人士说。

AI 时代,靠红包换增长的模式失灵了

字节跳动今年与春晚合作方式的变化,似乎再一次说明:AI 时代的增长逻辑正在改写。

移动互联网时代,巨头崛起不是靠时刻引领创新,而是靠在有人验证了某个需求后,成体系地做出同款产品,以更高效率大量拉来用户,再根据用户反馈快速迭代改进体验。更好的体验带来更多的收入,这些收入又被拿来投放,获得更多用户,如此循环。撒钱则是最直接的增长手段。

“核心是极速增长、极速迭代、极速变现的飞轮。” 一位互联网公司的产品经理说。

对互联网产品而言,越快拉新,产品体验越快提升。“多数情况下,推荐算法是发现你和另一个用户偏好相似,然后把他喜欢的东西展示给你。” 一名推荐产品经理说。用户增加,可供算法学习、发现关联的数据随之增加。这既适用于推荐视频、小说,也适用于推荐商品卡、带货直播间。微信支付的崛起是另一个例子,它用红包把支付变成了社交的一部分,想参与就得绑卡、能转账。人越多,越常用,久而久之就成了默认的支付工具。

交易型产品同样受益于此。一个打车平台会同时补两端:一边补司机提高供给,一边补乘客拉动需求。司机密度上来后,乘客等待时间缩短;订单密了,司机空驶更少,平台的履约成本也会随之下降,用户体验也更好。

互联网产品的成本也不会随着用户增加而线性上涨;新增开销主要在带宽、存储和机器资源上,它还会随着用户规模的提升而被摊薄。

但 AI 产品几乎是互联网产品的另一面。

2025 年初,字节跳动 CEO 梁汝波曾在集团全员会上提到,豆包没显出 “越多人用越好用” 的互联网产品特性。这部分因为 chatbot 产品不是社交网络或平台。

用户数量增长带来的新数据也有限。一个短视频产品,只要用户还在上下刷,就会产生一组组数据供推荐算法优化;但 chatbot 类产品生成一段回复,只有极糟时,用户才有动力多点下按钮反馈。能收集来数据,也不保证它们能让底层模型更聪明。“多数用户的问题高度重合,又没什么深度,没办法提高模型能力。” 一位互联网公司的 AI 产品经理说。“比如代码方向,公司就会在内部找程序员写案例。”

大模型的专业能力早已超过大多数人类,它们不能通过收集普通人的数据改善自己,就像 AlphaGo 不需要和普通人对弈来提升技艺——它后来的变种 AlphaGo Zero 甚至连世界冠军的数据都不用,只是机器训练机器就能赢过所有人。即便 ChatGPT 应用的月活跃用户量比 Claude 高出 100 多倍,但这没有让 OpenAI 的模型比 Claude 好用哪怕一倍。

AI 还无法像互联网产品那样,靠用户量摊薄成本。一位深入研究 AI 的二级市场人士曾测算,目前的主流 AI 产品如果服务 1 亿日活用户,每天的模型推理成本就要几千万元。这个计算还没有考虑新的 Agent 产品,如果类似 Manus 的产品开始流行,单个用户每天需要的算力可能还会再翻几倍。

最关键的是商业化难题。在海外,ChatGPT、Gemini、Claude 砸下了巨额投资以满足复杂计算,用户也必须付钱,低一档 17-20 美元/月,高一档可以到数百美元/月。但愿意为软件服务支付这般费用的中国用户很少,字节和阿里等公司更多是靠云服务赚回在 AI 上投入的钱——把模型能力做成云上的 API/托管服务与行业解决方案,企业按调用量、并发、存储与算力时长付费。

根据官方数据,2025 年 12 月,火山引擎上的豆包大模型日均 Token 处理量超过 50 万亿,半年增长超 200%。增长的动力不只来自字节旗下豆包、即梦等 AI 应用快速发展,还有一批外部客户在深入使用大模型:累计使用上万亿 Token 的超过 100 家,比全球云计算巨头 AWS 还多了一倍。

当下,AI 产品体验提升几乎全部来自底层模型能力提升。AI 代码编辑器 Cursor 能出圈,前提是它接入了 Claude 系列模型代码能力大幅提升。OpenAI 的 Deep Research 体验惊艳,也是靠底层模型学会了长链思考、分步解题。

如果大模型能持续进步,许多精心调教后的产品能力成为庞大模型的一部分,用户直接说几句话就能实现想要的效果,那大模型本身就是终极产品。ChatGPT 与 DeepSeek 的成功都在说明,靠投流、补贴去搬运用户的老办法越来越吃力,真正能拉开差距的,还是模型与产品体验的硬实力。

唯一的解法:更坚定地成为一家科技公司

2017 年的一次 CEO 面对面上,有字节跳动的员工问算法技术负责人杨震原:公司在人工智能上与 BAT 的差距在哪里?杨震原回答说,“今日头条本来就是一家人工智能公司。” 他进一步解释,做信息分发就是需要人工智能,今日头条想通过机器和人结合的方式提升创作、分发、讨论等每个环节的效率。

当时,AI 在字节跳动的产品中已经有一些应用,比如推荐、内容创作、抖音的 AR 效果、 内容审核、广告系统、头条号自动生成封面、时光相册和东方 IC 对图片的筛选功能等等。

2022 年底,ChatGPT 横空出世带来了新的 AI 热潮。字节跳动是这一轮里投入最大的中国科技巨头之一。它迅速订购了大量 GPU、组建全新的 AI 部门,从 infra、数据、模型、产品到人才全方位追赶硅谷公司。两年后,字节的模型数量、迭代速度和表现明显提升。

技术的跃升很少一蹴而就,背后需要坚定的长期投入。一位字节跳动人士回忆,Seedance 1.5 推出时,外界对它的评价并不高:人物在运动中容易崩坏,细节也不够稳定。后来 Seedance 2.0 的效果明显提升,有人猜测这是团队调整了 Benchmark,把更影响用户体验的指标排在了更前面。

“其实大家都忽略了基础工作的重要性。” 上述人士说。以运动崩坏为例,团队需要反复验证不同方案,找到更有效的路径,这类工作很耗时,却是必须补齐的基础能力。“就像一个很聪明的小朋友,未来也许能解大学题,但如果基础知识没学完,现在硬让他做,结果肯定不会好。”

另一个例子是豆包的语音合成模型(Seed TTS)。2024 年,团队在做 Seed TTS 1.0 时的目标是让模型能自然流畅地复刻说话者特征,尤其在跨语种时也能保持相似度与韵律。当 1.0 达到可用水平后,新的问题又暴露出来了:模型的语气表达太平淡。但这个难题在当时无法快速解决,于是他们在研发 2.0 版本时,把重点放在了将理解与思考能力融入端到端语音链路上。直到 2025 年中 Seed TTS 2.0 发布,模型才具备了更强的情感表达能力。

字节也是少有愿意在基础研究上投入资源的中国科技公司。一位接近字节高层的人士曾告诉我们,字节目前的 infra (工程化能力)已经比国内任何一家公司都要强。但和全球比,最大的问题是缺少 OpenAI 里那种能提出方向、能做前沿探索的人,比如 GPT 4o、Sora。

“中国过去没有真正的企业研究院是因为民营企业盈利能力有限,现在终于可以试一试了。” 上述人士说。

2025 年 1 月下旬,字节正式设立了代号为 “Seed Edge” 的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。该计划设定了更宽松的考核机制:字节本来每半年考核一次绩效,而 Seed Edge 则在项目取得突破进展后,再做最终评估。

字节在考察 AI 项目时,ROI 依然重要,但周期更长了。一位字节 AI 产品团队人士告诉我们,字节现在会以 AI 产品一定周期后的单用户价值作为考核系数,以测算未来收益,不同产品的考核周期不同,长的甚至可以到 5 年;但字节也没对这种考核方式做强制要求。

商业和科技史上无数次验证过了,想要拿下用户、市场,或者是更大的机会,靠的永远是技术的跃迁与产品的硬实力。

二十多年前,Google 因担心微软杀入搜索市场,在内部制定了 “芬兰计划”。这套计划的核心不是守城,而是逼自己持续做出更有创造力、把体验打到极致的产品——哪怕在 Windows 这 样的主场上,也要做出比微软自带工具更好用的浏览器。最终,在没有产品迭代优势、没有网络效应的背景之下,Google 硬是靠着出色的工程技术能力做出了 Chrome 并赢得了战争的胜利。

在与微软的竞争中,Google 还锻造出一套强大的商业化系统 AdSense,把源源不断的现金流与生态网络牢牢绑定在自己身上,并在此后多年逐步沉淀为难以撼动的壁垒。

2024 年,OpenAI 联合创始人、前首席科学家伊尔亚·苏茨克维 (Ilya Sutskever) 曾提到,“2010 年代是扩大规模的时代,现在我们再次回到了需要奇迹和新发现的时代。” 对字节跳动来说,它用 13 年长成中国最大的互联网公司;如今又遇到一场上限足够高的新游戏,需要用真正的技术与产品去再次证明自己——这样的机会,它不会错过。

(来源:新浪科技)



用户登录