“ 动动嘴就能PS的时代真的来了,这将极大的冲击设计行业,同时也让很多普通人只通过聊天就能轻松的修改和编辑任意图像内容。”
Google 这几天更新的Gemini 2.0 Flash Experimental模型火遍外网 ,该模型,可以真正实现“动动嘴就能PS”的能力,只需要和AI进行自然的正常聊天对话就能生成、编辑和修改任意图像。
相当于你可以随意指挥设计师,任意改图,对方还没有怨言
它支持:
✅ 文本生成图片 → 通过聊天说出你的需求就能生成高质量图像
✅ 图片编辑 → 通过聊天自动修改 & 增强现有图片
✅ 交互式对话修改 → 而且可以反复要求AI不停的修改,它都能完成
✅ 多种风格支持 →支持各种图像风格,如现实、艺术、动漫等风格
这个能力让设计师全都瑟瑟发抖。
但是问题来了,这个东西国内的朋友体验不到,那么有没有平替呢?
答案是:有!而且还很强!
这就是字节的 SeedEdit 模型,该模型已经可以在字节的即梦和豆包两款产品中免费使用。
先放个视频展示下其能力
我们来对比看看,两者谁更强
先试试即梦AI的效果
材质更换:将原图像里面的物体材质变为其他材质
提问:请把材质变成针织的玩偶材质
提问:变成毛线针织材质,玩具挂件
我们看到即梦在文本遵循上面非常好,能精准理解你的需求并准确的生成和编辑图像
主体更换:将原图像里面的物体对象变更为其他物体或者对象
提问:请把图中的汉堡面包变为切片面包
很强,在修改主体的情况下,图片原有的图层层级也保留了!即梦在中文的识别性上更强,Gemini则偏向英文。
垫图神用:根据原图风格生成全新图像并保持原图风格
提问:保持风格不变,场景内容换成物流场景,全部换掉
一句话就是能风格迁移,完成场景内容的转换,效果来看Gemini理解更到位
图像上色:给图像进行上色和色彩填充
提问:给这个图片上色,参考梵高的睡莲色彩
Gemini在物体识别性上略胜一筹,人物和建筑的丰富度上更完善,但是即梦更接近提示词的要求。
下面我们换成在豆包APP进行测试
去水印能力:去掉图像中的所有文字水印
两者都很好的完成了,但是豆包的有一些改动了原图,当然Gemini也改动了,但是对原图的保持相对完整。(比如植物和牙齿)
描述图像并生成:描述这张图像,并根据你的描述再生成一张和这个图一样的图像。
描述的都基本没什么问题,Gemini 更详细,但是生成的时候豆包没有生成和原图类似的风格。
风格迁移:给它一张图像,让它模仿该图像风格生成其他图像
提问:解释这张图片并生成
提问:基于这个风格,生成西瓜
这两个我感觉豆包的更好,领会到了原图的风格,并很好的生成了
多图生成:可以连续生成多张图像
提问:根据这张图分别生成类似的西瓜、芒果、牛油果,单独返回结果
Gemini 具备多图生成能力,可以一次只出一张,连续输出,这种能力可以让你生成故事分镜和连续的故事动画等,豆包暂时不具备这个能力。
替换物品
提问:把手机换成红色的
豆包似乎把手机搞错了,Gemini手机对了,但是也有点瑕疵
移除物品
提问:移除图像中的墨镜
移除的效果都不错,但是Gemini似乎更遵循原图,豆包感觉是重绘了一副
提问:移除女孩头发发带
都完成的不错,不过豆包似乎对人物进行了美颜,更好看了
修改对象:修改图像中的特定对象
继续追问:将女孩头发颜色改为蓝色
这个豆包理解的很好,是常见的头发颜色,而Gemini就有点太非主流
更换背景
提问:小狗主体不变,背景换成赛里木湖
提问:背景换成草地
豆包的遵循能力更强,能很好的遵循原图的结构和提示的内容
表情包
提问:基于这个形象,制作开心的表情包
多轮追问:换成生气的
2D转3D
提问:形象设计,3D,盲盒手办,3D渲染,卡通风格版本,白色背景
多轮追问:把衣服换成红色
继续追问:把衣服换成旗袍
角色一致性展示
这轮豆包胜,在角色一致性和遵循原图效果和文本描述上都很完美。
图像扩展:根据原图像,扩展图像的边界范围
豆包没能完成,Gemini扩展了图像并补充了剩余的图像部分
来一点高难度的,给豆包上点强度
总结
总体来看,字节SeedEdit模型和Gemini 2.0模型不分上下,各自在一些特定项目上都各有各的优势和不足。Gemini可能略微占有上风,在文本遵循和图像遵循上有优势。
可能我是通过中文进行的提问,所以存在一定差异。
Gemini在在多图生成的连续性上有独有之出,就是它可以根据一个指定的要求连续生成上下文连贯的图像,不停的连续输出,适合影视分镜制作和动画插图的生成,这是一个独特的功能。
不过在“换主体”、“改妆造”、“换风格”的效果SeedEdit优势较为突出。
在局部修改,擦除方面(精准控制)SeedEdit 优于Gemini,可以精准的控制特定区域的修改。
总结就是目前在国内模型的多模态领域,SeedEdit还是很强大的,和Gemini2.0有的一拼!
如何体验
那么在哪里可以体验呢?
两个地方
一个是即梦AI:https://jimeng.jianying.com/ai-tool/home「图片生成-智能参考」
一个是豆包APP和网页版:https://www.doubao.com/chat