字节AI聚掌成拳,“可灵们”挡得住吗?
文 | 新识研究所
字节AI应用正进入加速时刻。
4月份,字节AI部门Flow旗下发生人事变动,并将一些业务重合的应用进行整合。AI社交应用猫箱原负责人梁琛奇离职,由原AI生图应用星绘负责人西原(花名)接任,且星绘团队计划并入豆包,由豆包APP端负责人陆游(花名)一起管理。
同一时间,AI应用开发平台「扣子空间」正式启动内测,依托字节生态,办公场景的结构化任务执行效率更高,一上线便受到玩家追捧,被誉为字节跳动版“Manus”。
5月份,剪映推出了新一代AI营销内容创作平台「Pippit AI」,悄悄登上周榜第一。又在国内上线了两款AI产品,一款是搭载火山引擎的豆包大模型,可以利用AI一键剪辑的「剪小映」,可以理解为剪映的“傻瓜版”。
另一款「小云雀」则是一款面向短视频创作者、电商营销人员以及普通用户的AI视频和图片创作助手,内容创作能力会更强,更专业。
自2023年发布文生图AIGC工具「即梦」以来,剪映曾一度沉寂,而近一个月内突发3款AI创作工具,作为字节AI战略的重要一环,到底是适时的“秀肌肉”还是被对手“逼急了”?
AI工具三连发,字节能让普通人有手就会吗?
经过新识研究所的实测,上述几款AI工具都有自己的强项和可取之处,但需要改进的问题也不少。
「剪小映」的功能非常简单,用户手机的本地相册内只需有拍好的照片和视频,就能根据这些素材智能成片,生成的视频可直接导出文件保存在APP里,或者一键分享至抖音、小红书、微信等。
创作界面内,虽然是自由选择素材,但至少要选择3个以上的素材才能获得理想效果的视频,AI会对这些图片进行智能分析,制定出最适合的成片思路,包括模板推荐以及视频主题等,如果不合适,也可以自行提供思路。
像用了三张美食照片的“日常分享”模板,得到的就是很常规的抖音vlog风,配以优美抒情的文字和音乐,每次看到AI分析得头头是道,但是成品并没有太惊艳的效果,而且给的方案风格依赖预设模版,成品间不会有太大差异。
若选择的是不同类型的照片或视频,去硬凑成一个视频,剪小映也能实现,我们选取了风景图、艺术照和日常水果,AI给出的思路就是城市生活多样之美,也算符合要求,但是图片间的关联度越少,生成的主题也会越缺乏逻辑。
不过目前剪小映不支持拍摄功能,仅能处理本地素材,无法修改字幕、配乐、画幅等,无法覆盖用户从拍摄到二次创作的全流程,更像是“短视频”速成工具,适合普通小白分享日常生活。
如果说剪小映是入门选手,小云雀就是专业选手。
与传统AI工具单一通用输入框不同,「小云雀」会让用户先选定场景,分为智能成片、数字人视频、AI设计、AI背景四个核心功能,防止生成内容偏离需求。
整个流程分为“创作想法-理解分析-创意脚本-剪辑成片”四个步骤,可以直接输入提示词,设置相应参数,让小云雀AI自己匹配素材,也可以上传本地图片素材,根据你的图片和提示词要求生成。
期间会放出AI的思考和决策过程,提供4个相关的方案,用户可以在任意环节进行修改,也可以直达最后产出阶段。
产出的海报风格统一,文案生动,视觉效果专业,比较适配电商素材和vlog视频,完全可以直接用于商业推广。
其中最具创设性当然是“数字人AI”,不仅可以用真人素材,也可以完全由AI生成。我们以“面霜广告”为主题,要AI生产一段推广视频,最终得到一段有情绪起伏、前后反差、直击用户痛点的16面视频,数字人表情自然,语音清晰,内容条理分明,个别片段真有些“以假乱真”。
不过它也存在明显的缺点,有时候视频中的文字会乱码,生成的字幕风格比较像营销号,水印也不太好去除,还会生成一些不符合客观事实的物体和人物,加上提示词有字数限制,想详细描述场景时比较难。
总的来说,「小云雀」在商业侧强调决策效率,让创作者能够快速将创意转化为成品,在体验侧追求简洁直观,降低了技术门槛,对于电商和视频的从业者提供了一个十分高效的创作工具。
而「扣子空间」更是十项全能,不管是制作PPT、视频、音频、写代码、生成网页APP都信手拈来,目前分成了探索、规划和自由三种模式,探索模式更偏向信息整理,规划模式更偏向执行任务,自由模式则是交给AI自己去判断用户需求。
且扣子的内容创作并不是死板的提取信息,它还会自己进行理解并把晦涩难懂的信息用更生动的方式表达出来,提供下载和分享链接。
除此之外,扣子也支持MCP协议,并接入了GitHub、MySQL数据库、云文档、天气、地图等一系列MCP应用,进一步简化大模型调用外部服务的流程。
尽管扣子空间降低了操作门槛,但要准确地定义任务需求,依然考验着用户的AI水平,需要投入足够的时间去熟悉和掌握各项功能与使用技巧,才能真正将其潜力充分发挥出来。
可以看出,字节的AI工具从面向个人日常到商用设计都有涉猎,争取做到“有手便行”的傻瓜式操作,对于C端用户的争夺可以说势在必得。
字节AI战线收缩,好钢用在刀刃上
浙商证券一份报告指出,2024年字节AI资本开支达800亿元,接近百度、阿里、腾讯三家总和,其2025年预算再翻倍至1600亿元,其中900亿用于GPU采购。这一投入强度远超国内同行,甚至超过不少欧美科技巨头年度AI预算。
AI助手类产品,是当下竞争最激烈,也最能体现基础大模型能力的赛道,国内主要产品有豆包、DeepSeek、元宝、Kimi等产品,海外有ChatGPT、Google Gemini等产品。AI产品榜数据显示,今年4月份,豆包APP月活1.07亿,位列国内同类产品第二,DeepSeek、腾讯元宝紧随其后,月活分别为9688万和4143万。
字节跳动一直以来奉行“饱和式覆盖”的策略,在AI领域推出了众多产品,涉及聊天机器人、AI搜索、AI浏览器、Agent平台、AI陪伴社交、AI教育等大部分主流应用方向,但尚未在单一产品方向上形成碾压性优势。
其AI社交产品“猫箱”与同类产品“星野”之间难分伯仲,AI视频产品“即梦”与快手旗下“可灵”在内容创作和商业生态上走向分野,即便是用户数据表现最突出的“豆包”,也被DeepSeek、腾讯元宝、KIMI几大强敌环绕,时不时日活被其他竞品超越。
因此,字节开始整合旗下AI部门,提高资源利用率,助其找到AI战略的突破口。
今年2月份,原Google DeepMind副总裁吴永辉入职字节,成为Seed基础研究负责人,后面字节AI Lab全部收归Seed团队之下,Seed大语言模型(LLM)之下的三个团队Pre-train(预训练)、Post-train(后训练) 和 Horizon 也转为直接向吴永辉汇报。
其后对Flow部门旗下产品进行了资源整合,无论是人员变动、战略重心转移,还是内部的精简流程、聚焦主线,字节都在加速向一个以模型为核心、以组织能力为支点的转型方向迈进。
字节此前的综合产品体系,虽然凭借自身技术储备在规模上迅速扩张,但始终无法在细分赛道建立绝对优势,反而容易导致内部资源的分散。于是将自身有限资源聚焦,专注提升基础模型能力,并向豆包、即梦这类表现优异的产品倾斜,是当下字节AI发展的策略,这也有助于其找到AI战略的突破口。
随着字节AI在视觉生成产品上的突飞猛进,高喊要All in AI的快手恐成最大输家。
长期以来,快手希望可灵扮演“破壁人”的角色,通过技术和产品在专业领域的应用示范,吸引并激发PUGC和UGC创作者加入AI生产、消费与互动,实现快手内容生态和商业化场景的维度拓展。
不过从结果来看成效不明,今年一季度,快手线上营销服务的收入为180亿元,同比增幅仅为8%,平均日活与月活用户数分别为4.08亿和7.12亿,同比增速分别为3.6%和2.1%,虽有进一步放缓迹象,但依旧高于行业的平均值。
可灵虽为公司贡献营收达到1.5亿元,以此计算基本上稳超全年4.5亿收入目标,但与头部公司相比杯水车薪,特别是剪映和CapCut一年近百亿的总收入。
值得庆幸的是,目前可灵AI在推理层面已经实现了边际利润转正。随着业务规模的持续扩大,即便未来进一步增加对推理算力的投入,对集团整体利润的影响也将相对有限。同时随着技术迭代,可灵AI推理成本也会进一步走低。
总体而言,“可灵”目前仍主要依赖C端用户作为收入来源,B端应用尚处于起步阶段。对于视频生成这类尚未大规模落地和普及的AI应用来说,“可灵”当前所取得的发展成果已属难能可贵。
对快手而言,若希望将人工智能技术打造成推动公司增长的新引擎,一方面要实现收入的持续快速增长,另一方面则需在增长过程中保持健康的盈利水平。
目前,“可灵”在技术和行业布局上展现出一定先发优势,未来如何在业务扩张的同时实现可持续盈利,仍是快手亟需破解的课题。
好在一个视频生成模型,显然是无法满足国内海量用户的创作需求的,无论抖音还是快手,虽然业务处境不同,最终都能寻得自己的一方生态位。
(来源:钛媒体)