字节AI聚掌成拳，“可灵们”挡得住吗？

2025年06月10日,18时26分50秒科技新知阅读 91 views 次

文 | 新识研究所

字节AI应用正进入加速时刻。

4月份，字节AI部门Flow旗下发生人事变动，并将一些业务重合的应用进行整合。AI社交应用猫箱原负责人梁琛奇离职，由原AI生图应用星绘负责人西原（花名）接任，且星绘团队计划并入豆包，由豆包APP端负责人陆游（花名）一起管理。

同一时间，AI应用开发平台「扣子空间」正式启动内测，依托字节生态，办公场景的结构化任务执行效率更高，一上线便受到玩家追捧，被誉为字节跳动版“Manus”。

5月份，剪映推出了新一代AI营销内容创作平台「Pippit AI」，悄悄登上周榜第一。又在国内上线了两款AI产品，一款是搭载火山引擎的豆包大模型，可以利用AI一键剪辑的「剪小映」，可以理解为剪映的“傻瓜版”。

另一款「小云雀」则是一款面向短视频创作者、电商营销人员以及普通用户的AI视频和图片创作助手，内容创作能力会更强，更专业。

自2023年发布文生图AIGC工具「即梦」以来，剪映曾一度沉寂，而近一个月内突发3款AI创作工具，作为字节AI战略的重要一环，到底是适时的“秀肌肉”还是被对手“逼急了”？

AI工具三连发，字节能让普通人有手就会吗？

经过新识研究所的实测，上述几款AI工具都有自己的强项和可取之处，但需要改进的问题也不少。

「剪小映」的功能非常简单，用户手机的本地相册内只需有拍好的照片和视频，就能根据这些素材智能成片，生成的视频可直接导出文件保存在APP里，或者一键分享至抖音、小红书、微信等。

创作界面内，虽然是自由选择素材，但至少要选择3个以上的素材才能获得理想效果的视频，AI会对这些图片进行智能分析，制定出最适合的成片思路，包括模板推荐以及视频主题等，如果不合适，也可以自行提供思路。

像用了三张美食照片的“日常分享”模板，得到的就是很常规的抖音vlog风，配以优美抒情的文字和音乐，每次看到AI分析得头头是道，但是成品并没有太惊艳的效果，而且给的方案风格依赖预设模版，成品间不会有太大差异。

若选择的是不同类型的照片或视频，去硬凑成一个视频，剪小映也能实现，我们选取了风景图、艺术照和日常水果，AI给出的思路就是城市生活多样之美，也算符合要求，但是图片间的关联度越少，生成的主题也会越缺乏逻辑。

不过目前剪小映不支持拍摄功能，仅能处理本地素材，无法修改字幕、配乐、画幅等，无法覆盖用户从拍摄到二次创作的全流程，更像是“短视频”速成工具，适合普通小白分享日常生活。

如果说剪小映是入门选手，小云雀就是专业选手。

与传统AI工具单一通用输入框不同，「小云雀」会让用户先选定场景，分为智能成片、数字人视频、AI设计、AI背景四个核心功能，防止生成内容偏离需求。

整个流程分为“创作想法-理解分析-创意脚本-剪辑成片”四个步骤，可以直接输入提示词，设置相应参数，让小云雀AI自己匹配素材，也可以上传本地图片素材，根据你的图片和提示词要求生成。

期间会放出AI的思考和决策过程，提供4个相关的方案，用户可以在任意环节进行修改，也可以直达最后产出阶段。

产出的海报风格统一，文案生动，视觉效果专业，比较适配电商素材和vlog视频，完全可以直接用于商业推广。

其中最具创设性当然是“数字人AI”，不仅可以用真人素材，也可以完全由AI生成。我们以“面霜广告”为主题，要AI生产一段推广视频，最终得到一段有情绪起伏、前后反差、直击用户痛点的16面视频，数字人表情自然，语音清晰，内容条理分明，个别片段真有些“以假乱真”。

不过它也存在明显的缺点，有时候视频中的文字会乱码，生成的字幕风格比较像营销号，水印也不太好去除，还会生成一些不符合客观事实的物体和人物，加上提示词有字数限制，想详细描述场景时比较难。

总的来说，「小云雀」在商业侧强调决策效率，让创作者能够快速将创意转化为成品，在体验侧追求简洁直观，降低了技术门槛，对于电商和视频的从业者提供了一个十分高效的创作工具。

而「扣子空间」更是十项全能，不管是制作PPT、视频、音频、写代码、生成网页APP都信手拈来，目前分成了探索、规划和自由三种模式，探索模式更偏向信息整理，规划模式更偏向执行任务，自由模式则是交给AI自己去判断用户需求。

且扣子的内容创作并不是死板的提取信息，它还会自己进行理解并把晦涩难懂的信息用更生动的方式表达出来，提供下载和分享链接。

除此之外，扣子也支持MCP协议，并接入了GitHub、MySQL数据库、云文档、天气、地图等一系列MCP应用，进一步简化大模型调用外部服务的流程。

尽管扣子空间降低了操作门槛，但要准确地定义任务需求，依然考验着用户的AI水平，需要投入足够的时间去熟悉和掌握各项功能与使用技巧，才能真正将其潜力充分发挥出来。

可以看出，字节的AI工具从面向个人日常到商用设计都有涉猎，争取做到“有手便行”的傻瓜式操作，对于C端用户的争夺可以说势在必得。

字节AI战线收缩，好钢用在刀刃上

浙商证券一份报告指出，2024年字节AI资本开支达800亿元，接近百度、阿里、腾讯三家总和，其2025年预算再翻倍至1600亿元，其中900亿用于GPU采购。这一投入强度远超国内同行，甚至超过不少欧美科技巨头年度AI预算。

AI助手类产品，是当下竞争最激烈，也最能体现基础大模型能力的赛道，国内主要产品有豆包、DeepSeek、元宝、Kimi等产品，海外有ChatGPT、Google Gemini等产品。AI产品榜数据显示，今年4月份，豆包APP月活1.07亿，位列国内同类产品第二，DeepSeek、腾讯元宝紧随其后，月活分别为9688万和4143万。

字节跳动一直以来奉行“饱和式覆盖”的策略，在AI领域推出了众多产品，涉及聊天机器人、AI搜索、AI浏览器、Agent平台、AI陪伴社交、AI教育等大部分主流应用方向，但尚未在单一产品方向上形成碾压性优势。

其AI社交产品“猫箱”与同类产品“星野”之间难分伯仲，AI视频产品“即梦”与快手旗下“可灵”在内容创作和商业生态上走向分野，即便是用户数据表现最突出的“豆包”，也被DeepSeek、腾讯元宝、KIMI几大强敌环绕，时不时日活被其他竞品超越。

因此，字节开始整合旗下AI部门，提高资源利用率，助其找到AI战略的突破口。

今年2月份，原Google DeepMind副总裁吴永辉入职字节，成为Seed基础研究负责人，后面字节AI Lab全部收归Seed团队之下，Seed大语言模型（LLM）之下的三个团队Pre-train（预训练）、Post-train（后训练）和 Horizon 也转为直接向吴永辉汇报。

其后对Flow部门旗下产品进行了资源整合，无论是人员变动、战略重心转移，还是内部的精简流程、聚焦主线，字节都在加速向一个以模型为核心、以组织能力为支点的转型方向迈进。

字节此前的综合产品体系，虽然凭借自身技术储备在规模上迅速扩张，但始终无法在细分赛道建立绝对优势，反而容易导致内部资源的分散。于是将自身有限资源聚焦，专注提升基础模型能力，并向豆包、即梦这类表现优异的产品倾斜，是当下字节AI发展的策略，这也有助于其找到AI战略的突破口。

随着字节AI在视觉生成产品上的突飞猛进，高喊要All in AI的快手恐成最大输家。

长期以来，快手希望可灵扮演“破壁人”的角色，通过技术和产品在专业领域的应用示范，吸引并激发PUGC和UGC创作者加入AI生产、消费与互动，实现快手内容生态和商业化场景的维度拓展。

不过从结果来看成效不明，今年一季度，快手线上营销服务的收入为180亿元，同比增幅仅为8%，平均日活与月活用户数分别为4.08亿和7.12亿，同比增速分别为3.6%和2.1%，虽有进一步放缓迹象，但依旧高于行业的平均值。

可灵虽为公司贡献营收达到1.5亿元，以此计算基本上稳超全年4.5亿收入目标，但与头部公司相比杯水车薪，特别是剪映和CapCut一年近百亿的总收入。

值得庆幸的是，目前可灵AI在推理层面已经实现了边际利润转正。随着业务规模的持续扩大，即便未来进一步增加对推理算力的投入，对集团整体利润的影响也将相对有限。同时随着技术迭代，可灵AI推理成本也会进一步走低。

总体而言，“可灵”目前仍主要依赖C端用户作为收入来源，B端应用尚处于起步阶段。对于视频生成这类尚未大规模落地和普及的AI应用来说，“可灵”当前所取得的发展成果已属难能可贵。

对快手而言，若希望将人工智能技术打造成推动公司增长的新引擎，一方面要实现收入的持续快速增长，另一方面则需在增长过程中保持健康的盈利水平。

目前，“可灵”在技术和行业布局上展现出一定先发优势，未来如何在业务扩张的同时实现可持续盈利，仍是快手亟需破解的课题。

好在一个视频生成模型，显然是无法满足国内海量用户的创作需求的，无论抖音还是快手，虽然业务处境不同，最终都能寻得自己的一方生态位。

(来源：钛媒体)

2026年 2月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

AI工具三连发，字节能让普通人有手就会吗？

字节AI战线收缩，好钢用在刀刃上

关联资讯:

用户登录