声明:本文来自于微信公众号新莓daybreak(ID:new-daybreak),作者:李欢,授权Soraor转载发布。
张一鸣把抖音最重要的两个人物,都放在AI相关的核心位置。
今年2月,OpenAI发布视频生成模型Sora过去9天后,张楠放下抖音CEO的位置,聚焦剪映。看上去这是一个舍大取小的举动,甚至有被流放之嫌。事实是,和陈林当初负责教育业务一样,张楠在为字节攻克新高地。
一位剪映内部人士告诉新莓daybreak,其实张楠一直在负责剪映,只是现在全人力投入,在组织架构层面做出了不小的调整,包括精简组织,高管调动。
差不多三个月后,朱骏现身豆包大模型发布会。他跟张楠的轨迹类似,都是创立的公司被字节收购,本人加入,而且俩人都是抖音和TikTok崛起的关键人物,现在又都投身大模型。朱骏现在是字节AI主力部门Flow的产品线负责人。
其实今年4月份,字节还晋升了一位重要人物朱文佳,他曾担任过今日头条CEO,现在直接向CEO梁汝波汇报,常年base在新加坡。朱文佳领导的AI团队在内部被称为「Seed」,社交平台曝出来的组织架构中,他还是Flow的业务负责人。
一目了然。字节正在把曾经「打赢过硬仗」的核心高管,以重火力的形式布局在AI。
张一鸣应该很早就预感到这场生产力变革的冲击波。
AI生成视频的探测早已开始,作为全球短视频最大平台,字节最具危机意识。梁汝波在内部信中警觉所有人,「AI技术对于内容创作会有很大的颠覆,甚至会产生新的创作平台」。
字节可能不是反应最早的,但现在看来是押注最多的。
字节需要自己的Sora。也许这是从0起步的新产品,比如新推出的「即梦」;也可能是快速响应趋势,给出理想解决方案的剪映。
但是,假如AI 生成视频新的创作平台不是出自字节……这会是个麻烦,而且是大麻烦。
「Sora杀死剪映」是流量时代的吸睛说法,却可能讲出了一些人的期望。那些摩拳擦掌的大模型公司,觊觎这样的视频发布入口,静静等待形势剧变的机会,一击而中。
抖音与剪映深度绑定
理解字节AI变革的承载是在剪映,需要先厘清剪映与抖音之间的关系。
国内中短视频平台都有自己的视频编辑工具。抖音对应的是剪映,快手推出快影,微信有秒剪,B站则是必剪。
这些剪辑工具基本功能大同小异,如果是出于运营一个账号的动机和想法,这些低门槛、傻瓜式工具足矣。专业级选手在编辑大制作的时候,也许会需要PR或是Final cut。
为什么各家平台都要推出自己的剪辑工具?这有降低视频创作门槛的动机,贡献灵感,增加普通用户的「投稿率」,最重要的是跟各个平台运营机制有强关联性。
比如必剪的内容素材,各方面会更贴近适配B站社区用户的喜好。最近大火的猫meme就是典型例证。
对剪映而言,它存在的意义和价值,也是更多服务抖音的内容生态。
晚点LatePost援引一位字节跳动人士曾说,没有剪映,抖音里的作品更多地会偏向 PGC (专业机构生产的内容),剪映提升了用户创作的视频的整体质量,让 UGC (用户生产的内容) 更统一、美观。
剪映天生具备AIGC的场景优势,尤其特效功能,跟抖音内容生态运营深度绑定。
前不久抖音遍地「掉入莫奈花园」的特效视频,本质上就是AI创作的一种。剪映底部tab「剪同款」一键操作产生类似效果,大大降低普通用户创作视频的门槛,全民效仿,海量同款视频充斥抖音,形成爆款效应。
抖音特效团队前研发负责人王国晖在作客潘乱播客时解释,字节内部,很长一段时把特效叫做道具。这种创作工具是抖音、TikTok的重要抓手,帮助普通人克服心理障碍,放松表达自己,此外特效也具备更强的跟拍和示范效应,而抖音是很强调跟拍心智的。
与此同时,字节有强大的团队支撑,做精细化运营。在一些重大节日关键节点,涉及到用户增长需求的时候,产品和运营团队会前置参与到特效功能的设计,吸引用户参与创作,增加投稿率,更多人被看见,被激发,参与跟拍,以此形成正循环。
但是假如,这个AI特效不是出自剪映,而是其他创作平台呢?并且这样的事情一而再再而三的发生呢?
后果是,抖音就会失去视频创作入口。久而久之,更是可能失去发布入口。
这个路径字节太熟悉了。TikTok在海外起步的时候,在众多创作者眼中,就是一款好用的编辑视频软件。活跃在Instagram的网红,一开始被TikTok眼花缭乱又傻瓜式的特效吸引,先是剪辑编辑完成,上传到Ins或Youtube,后来慢慢就留存在TikTok。
字节能做到,理论上其他人也能做到。大模型狂飙,Sora横空出世,这个变数就大大增加了。
一位剪映内部人士告诉新莓daybreak,「公司从战略层面肯定重视,而且不仅限于AI一键成片,包括AI处理素材、AI提效编辑这类功能也在发力。」他的观点是,毕竟距离AI一键生成的实际落地还有很长路要走,就像GPT也没从根本层面改变文字工作者的从业现状。
火山引擎CEO谭待在接受媒体采访时,针对字节在文生视频领域是否有布局实现弯道超车的问题时回答,「没有弯道超车,模型训练要一步步技术扎实,如果基础都做不好,那文生图就是一个『人工智障』——因为它连文字都不能理解,视频能好到哪儿去?」
张楠的新使命
张巧是一家媒体视频业务的负责人,有一天他们准备发布一个新闻热点的分析视频,但是负责配音的同事临时有事,没法及时响应。
她有留意到剪映之前推出过一些AI功能,尝试找一下解决办法。确实有款「克隆音色」的功能,只要真人输入几段话,AI就能仿真输出。她试了一下,只要把速度调快,效果似乎不错,气口不如真人自然,但比预期要好。
但是在她把成片分享给同事后,大部分人反馈,没有什么情感,AI味道还是很重。最后只好放弃。
张巧告诉新莓daybreak,「最后那位同事花了一个多小时才录好,文稿不是她写的,需要时间熟悉。AI生成就很快,文字丢进去就好,我看重的就是效率。」
她甚至期望更早使用AI生成视频,现在她团队内人工剪辑一条2分钟的视频要耗费4个小时,还不算前期素材收集整理,单人一天最多剪辑两条。限制产出的核心因素就在人工。
张楠必然了解这些创作者的心理。在全身心投入剪映之前,她曾花几个月时间做大量用户访谈,听到了期待和不满的声音。带着历史包袱的剪映,转型压力更大。
这个2019年由字节收购公司脸萌团队做出的产品,已经是国内用户规模最大的视频编辑工具。虽然各个中短视频平台都有自己的剪辑工具,但剪映的使用率最高。最后一次公开数据显示,2021年剪映月活为1亿。
与TikTok相匹配的CapCut,上线近4年,调研机构data.ai的报告显示,2023年1月,这款产品的月活超过了2亿,一度超越Instagram和YouTube成为美国下载次数最多的免费App。
林洋日常制作的短视频,会投放到淘宝的短视频专区——逛逛,也会发布在抖音和B站。刚开始,他会使用pr,后来改用剪映,因为效率高。他告诉新莓daybreak,「如果对短视频质量要求不高,更看重数量,剪映很适合,每天能有产出10个左右」。
甚至新媒体从业者也在广泛使用这款编辑工具。张巧说,她熟悉的一些官媒朋友都在使用剪映。
梁汝波在字节内部信中对张楠的描述是,她从0到1推出了抖音、剪映等备受用户喜欢的产品。是的,从一开始张楠就是剪映的核心领导人物。而且据说,剪映从立项到上线,只花了三个月时间。抖音对剪映用户的快速增长,也做出了巨大贡献。
2019年,字节在收购FaceU的基础上,建立了影像中台,包括相机特效中台等。有段时间这是张楠关注的重心之一。剪映就是从影像中台演化出来的一个独立业务。郭列曾经的副手刘佳彬做过影像中台的负责人。
后来,这个中台孵化出包括剪映的轻颜、醒图等产品和业务,他们与抖音、TikTok、西瓜视频、今日头条等字节系生态深度绑定。
张楠重掌剪映,剪映对于字节的重要性又拔高了一个层次。在张楠职务变动的正式消息公布前后,一些变化已经显现。
2023年年底,剪映开始测试一个名为「Dreamina」的文成图AIGC工具。5月9日,这款产品被更名为「即梦」,功能不再局限于文生图。
目前来看,字节并未对这款产品过多曝光,产品也只有网页版,并未出现在手机应用商店。
新莓daybreak登录网页版试用后发现,这款产品有图片生视频和文本生视频两个功能。最长可生成6秒的短视频。我们输入一段文字,产出一段3秒的视频大概所需2-3分钟,但视频显示的人物细节还与Sora差距较大。
除此之外,剪映也在做着AI主题的各种小动作——智能字幕、文字成片、视频翻译、音色克隆等功能。
这是对外用户感知到的变化。对内她更是雷厉风行的做出诸多调整。
精简组织的同时,人员调整,北京和深圳的团队往来频繁。有媒体引用一位剪映员工的表述,过去一年,他的直系领导更换了5个,负责的业务也不断调整。张楠注重战略工作,也关注竞争对手的动态,要求团队「甚至比竞争对手自己还要了解产品」,包括但不限于核心功能、盈利点以及具体到某月某日发生的更新等。
字节赶场AGI竞赛
剪映不是字节的唯一一张牌。前不久豆包大模型发布会,超过2600万月活跃用户的应用豆包,也可能承载文生视频的使命。
朱骏在现场讲解,如果你是一个自媒体的从业者,可以在豆包桌面版本上点击「文案创作」这个「AI技能按钮」,选择「抖音文案」,然后填入主题「介绍建筑师安藤忠雄」,一个分镜头的抖音视频脚本就生成好了。
按照官方讲述,豆包Pro模型能广泛应用在问答、总结、创作、对话、分类等诸多场景。我们理解为,视频创作应该不会被排除在外。这分明就是内部赛马的节奏。
现场谭待披露,过去一年,字节内部50多个业务开始大量使用豆包大模型嫁接AI,包括抖音、头条、番茄小说等。不过在他的对外讲述中,这个名单没有提及剪映。
实际上,字节这个成绩单似乎交得有点晚。
今日头条是国内最早的人工智能信息分发平台,字节熟稔于算法、智能分发。但在去年,GPT爆发,公司高层批评对此敏感度不够,AI由此被提升至字节战略高点。
梁汝波在年初内部会议上反思,公司层面直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司,都是在2018年至2021年创立的。
张一鸣也释放出很多高度关注ChatGPT的信息。
去年4月,他在公开信中表示,「字节跳动无法错过AGI。如同任何中国互联网公司都无法错过AGI。AGI可以解决组织的第二曲线增长困境。」公开信发布后的一个月,《中国企业家》杂志报道,张一鸣正在废寝忘食地研读OpenAI的系列论文。
早年间,字节在AI上倾注了大量心血,2016年成立的AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。遗憾的是,AI lab并未坚持到最后,大概四年后核心人员离职,研究也放缓了脚步。
直到2023年ChatGPT问世,字节开始全力追赶AI。当年2月,字节部署了代号为「Seed」的团队,专注于模型层,由朱文佳带队。年底,又正式组建了一个新的AI部门——Flow部门,专注于AI大模型的应用研发层。字节产品与战略副总裁朱骏和字节技术副总裁洪定坤,二人分别负责部门的产品线和技术线。
到了今年,字节还在不断抽调体系内优秀高管人才至Flow部门。3月,有消息称,飞书产品副总裁齐俊元也调至Flow部门,主要负责豆包的PC端业务。
最近,凤凰网科技采访到豆包的产品人士提到,今年以来,字节的AI业务,尤其是Flow,可以说是整个字节内部强度最大的部门,「基本上都是单休,但有几个产品的数据表现还不错,特别是豆包,内部士气正旺」。
这一轮AGI竞赛,字节虽然也在基础大模型、面向开发者的中间连接层有产品响应,但外界更关注,或者决定字节命脉的还在于应用层。
去年中旬,字节在海内外分别推出豆包和Cici两款AI对话产品。数据显示,目前豆包/Cici的全球总DAU在300万左右。今年4月,Flow部门又上线了一款名为「星绘」的AI相机类APP,在国外也有一款功能相似的APP「Picpic」上线。
受益于豆包模型的剪映正在加速AI转型。比如,在视频内容的智能分析、自动标注、剪辑建议等方面,豆包大模型的算法能力可以极大提升剪映的智能化水平;又或者,在视频编辑过程中,豆包大模型可以提供智能剪辑、自动配乐、特效生成等功能,帮助用户更高效地完成视频创作。
在所有字节系产品中,剪映被视为是字节当下最有希望承接AI大模型落地的产品。
界面新闻曾报道一位知情人士分析称,剪映是一个视频创作工具,处于内容创作的上游,往AI方向走即文生视频。此外,剪映创作的视频内容有抖音承接,创作者后续使用字节系的文生视频、多模态数字人产品创作内容,都有较大的想象空间。
文生视频的挑战是颠覆性的,即使手握生态、数据和用户,对于挑战,字节仍需做足准备。
(应采访对象要求,文中林洋,张巧为化名)