声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权Soraor转载发布。
就在刚刚,PixVerse的v4版本上线了。
他们AI视频的模型能力,又一次迎来了飞跃。
网址在这:https://app.pixverse.ai/home
2025年后的第一波AI视频的开卷来得比想象中要快,前脚OmniHuman-1刚出,紧接着PixVerse就迎来了新模型的更新。
而我5天前就拿到了体验资格,整体测下来,我的评价是:不管是文生图生还是新玩法都肉眼可见的进步不少,底层模型能力有了质的飞跃。
话不多说,直接上我测试的一些case。
文生:
- 提示词:龙卷风,高速移动,紧张刺激,城市公路上一辆80年代的橙色复古跑车高速前进、漂移。灾难电影氛围。
2.提示词:空灵的雄鹿,身体由银色的雾气构成,在月光下闪烁着微弱的光芒。它的鹿角上装饰着浮动的光球,行动悄无声息,身后留下闪闪发光的雾迹。
3.提示词:时空扭曲跃迁序列:应用爱因斯坦场方程模拟时空弯曲,相机沿克尔黑洞视界面运动,激活时间膨胀视觉效果。在跃迁点设置时空奇点,引入彭罗斯图解算法计算光锥变形(扭曲系数145%)
而且这波PixVerse v4对于科幻硬核物理效果的支持,我只能说,太帅了。
还有一个我的好朋友@齐马橙 做的视频case,也超帅。
这个视频的Prompt是这样的:超球面维度跃迁镜头:11维空间投影运镜,使用黎曼流形轨迹算法,在维度坍缩时激活拓扑缺陷视觉预警系统。
虽然里面出现了文字,但是在我的测试下发现,文字的生成并不是特别可控。文生视频能出现,但是图生视频不太行,并且目前只支持英文。
再看图生:
- prompt:大风天气,女人凝视镜头,远处的田野火焰蔓延。镜头推近,Zoom in。女人露出诡异的微笑。
2.prompt:机械女武士用手捂住眼睛。放下手,眼睛变成红色。站起来直视镜头。科幻电影风格。镜头拉远,Zoom Out。
语义理解和人物一致性强的没话说。
PixVerse的对物理规律理解的表现进步也很大。
真实感非常强。
比如这个《某种物质》里面的经典镜头。
融合过程自然,也没有出现不合理的形变。
镜面的反光也能轻松拿捏,强的离谱。
prompt:宇航员躺在花田里,抬起手臂。然后坐起来。
除了这些,最直观的感受就是生成速度巨快,极速版在5s左右就能出来,效率拉满真的很爽。
整体效果测下来,V4比V3.5各个方面都强了不止一个维度,新版本的V4基模绝对是AI视频目前稳稳的T1梯队,非常非常强。
说实话,我觉得PixVerse的路走的是对的,即使他们现在靠着特效模板这个功能,破了N次圈,在各种中东土豪国家的AppStore榜单上登顶,但是他们从来没有让模型的进化速度变慢,而是迭代的速度越来越快。
V1版本的上线时间是24年1月15日,V2版本是7月24,V2.5是8月22,V3是10月29,V3.5是12月29,如今V4,是2月24。
DeepSeek爆火之后,基本整个AI圈都有了一个统一的共识:
“AI唯一的应用是智能本身”
模型能力是一切的基石,你应用上的所有功能、体验的优化,都是让用户更低门槛使用“智能”的手段,它更像一个乘以模型的系数,模型能力本身是10分,叠加特效模板这种有趣的功能,乘以10就能得到一个100分的应用。
但是如果模型能力只有1分,即使你做出来了30分的牛逼到爆的功能,最后你得到的也只是一个30分的垃圾。
AI视频领域目前我觉得最典型的就是Runway,牛逼功能确实不少,比如Act-One、超级运镜等等,但是吧,半年了模型几乎就没咋大动过了,在AI时代的尺度上,半年是一个啥样的周期,懂得都懂。。。
而PixVerse我觉得就融合得很好,保持着模型的超快速度的迭代,提升模型的基础能力之后,你的其他能力才有意义。
比如说V4这次一个非常亮眼的新功能:sound。
如果细心的朋友可能会发先,我前面大部分的Case都是视频,这次没用gif,是因为里面,都是带有非常自然的音效的。(之所以文生那趴不是视频是因为公众号最多一篇文章传10个视频。。。)
你只需要把Sound打开,就可以自动跟你的视频匹配音效。
当然,你也可以自己描述,比如我写的一段:sound prompt:宁静的花园,清脆的鸟鸣。
而且效果我觉得非常自然,问了一下这个音效模式居然是PixVerse自己做的,我觉得比11Labs那个AI音效效果要好。
他们还有一些别的功能,什么speech(对口型)、restyle(上传一段视频,迁移成自己喜欢的风格)等等,大家可以自己试试看,我就不一一列举了。
还是那句话,底层模型牛逼了,其他叠加上的效果才有用武之地。
最后我们再看看PixVerse的看家本领,特效模板。
他们作为这个功能的开创者,这玩意是不得不聊的,得益于V4模型能力的加持,模板效果感觉都比以前的要好了。
我觉得这个打架是最好玩的。。。
比如当鲜虾包骂我文章骂的太狠,我想要报复,但现实中打人是违法的,我就打开kungfu特效,上传我俩的合影,暴打他一顿。
要是实在打不过他,我就可以用Holy Wings特效直接升仙,给他来个降维打击。
真的,太抽象了。
在天庭上还遇到了哪吒和傲丙,想起有群友对他俩嗑生嗑死,于是转手把他俩的动漫合影放到了kiss特效里。(高能提醒+叠甲:不磕的兄弟姐妹们请温柔划走,我怕被打)
他两居然还知道闭眼,好好好,这细节无敌了。
特效模板我写过了N次了,这个功能是我非常看好的,而它在PixVerse V4的加持下,质感和动作又上升了一个新台阶。
说到底,模型能力才是根本。
有把“智能”本身推到更高的层次,才能让那些特效、音效、风格迁移等功能真正爆发出魔力。
卷吧。
真的很幸运,亲身参与这个大AI时代。