信息差

Midjourney震撼推出V1视频模型：AI一键生成5-20秒高清视频

Midjourney 正式推出了首款 AI 视频生成模型 —— V1 Video Model，现已面向订阅用户开放使用。支持将单张图像生成5秒钟的视频动画，用户可选择是否添加提示词（prompt），并借助动画效果呈现图像“动起来”的视觉体验。

从静态图像生成视频：用户可上传自己的图或使用 Midjourney 生成的图像，一键生成四个 5 秒短片
可扩展至 20–21 秒：初始 5 秒后，可在每段视频上追加最多四次 4 秒，最长可达 20（或 21）秒
动画控制：支持两种 motion 模式：
- 低动感（Low Motion）：适合静态场景中的细微动效，
- 高动感（High Motion）：用于较大范围的摄像机或角色移动。
- 可选择自动动画或通过文本提示调整画面动效。

Midjourney表示，其 AI 视频模型的目标远不止为好莱坞电影生成 B-roll 素材或为广告行业制作商业广告。Midjourney 首席执行官 David Holz 称，该 AI 视频模型是公司迈向最终目标的下一步，即创建“能够实时开放世界模拟”的 AI 模型。

Midjourney 长期目标是构建一个实时生成的开放世界模拟系统：

用户可以在3D空间中自由移动；
场景与角色具有动态性与交互性；
AI系统能够以实时速度生成图像并响应用户操作。

为实现这一愿景，Midjourney将逐步构建以下关键技术模块：

图像模型（已完成）
视频模型（现在推出）
3D空间交互模型（即将开始）
实时性能优化模型（未来目标）

核心功能与特点

图像到视频生成：
- 用户可以通过 Midjourney 平台生成一张静态图像（或上传外部图像），然后使用“Animate”按钮将其转换为视频。这一工作流程与 Midjourney 的图像生成生态无缝衔接，支持从文本直接生成视频。
- 提供两种主要模式：
  - 自动运动合成：由 AI 自动生成运动效果。
  - 自定义运动提示：用户可通过文本描述控制场景中元素的运动方式，例如指定镜头移动或物体动态。
视频时长与扩展：
- 当前模型生成的视频长度较短，最大为 20秒。
- 支持视频延长功能，每次可额外增加 4秒，为用户提供一定灵活性。
高低动态选项：
- 提供“高动态”和“低动态”开关，分别用于生成节奏较快或较慢的视频，适应不同创作需求。
成本与可访问性：
- 定价为 10美元/月，性价比高，定位为“面向所有人”的视频生成工具。
- 据用户反馈，生成20个4秒视频（共80秒）大约消耗一个“fast hour”，成本约为 4美元，相较于竞争对手如 Google 的 Veo 3 更具价格优势。
画质与风格：
- 视频继承了 Midjourney 在图像生成中的高品质和艺术风格，每一帧都具有类似画作的美感，动态画面仿佛经过导演调教。
- 强调高保真视觉效果，但目前视频分辨率和细节可能与顶级竞争对手（如 Luma Labs 的 Dream Machine 或 MiniMax 的 Hailuo 02）相当，未显著领先。

局限性

无音频生成：
- 与 Google Veo 3 或 Luma Labs 的 Dream Machine 不同，Midjourney 的视频模型暂不支持生成音频轨道或环境音效，用户需在后期手动添加音轨。
时长与编辑限制：
- 视频时长限制在20秒，且不支持时间轴编辑、场景过渡或跨片段的连续性，功能较为初级。
生成速度：
- 渲染时间可能较慢，与一些竞争对手相比（如 MiniMax 的 Hailuo 02），在处理复杂运动或电影化镜头时效率稍逊。

与竞争对手的比较

Midjourney 进入了一个竞争激烈的 AI 视频生成市场，面临 Runway、Luma Labs、Google Veo 3、MiniMax Hailuo 02 等对手的挑战：

优势：Midjourney 依托其成熟的图像生成技术和用户友好界面，提供无缝的图到视频工作流，成本较低，适合短视频实验和创意探索。
劣势：缺乏音频生成、较短的视频时长和有限的编辑功能使其在功能全面性上稍逊于 Runway 或 Luma Labs 的产品。

如何生成视频

使用Midjourney已生成的图像

在图库中打开图像后，点击 “Animate Image” 按钮即可：
- Auto：自动使用原图生成视频；
- Manual：允许在生成前编辑提示词；
图像生成时所使用的原始参数会被自动移除，不影响视频生成；
鼠标悬停在“Create”页面中的图像上也会显示快捷入口按钮。

使用用户上传的图像

通过 “Imagine”输入栏中的图片图标 上传图像或选择现有图像；
拖动图像至“Starting Frame”区域，即可作为起始帧；
锁定图像可重复使用多个提示词；
仅限以图像作为“起始帧”的使用方式，其他引用方式如“Style Reference”“Image Prompt”等不支持视频生成。

📐 输出分辨率与视频尺寸

生成的视频分辨率固定为 480p（标准清晰度），实际尺寸受起始图像的宽高比影响：

⚙️ 视频设置

点击“Imagine”栏中的设置图标可进入：

默认 运动模式设置；
GPU使用速度控制；
Stealth Mode（隐匿模式）；

注意：仅Pro与Mega计划用户支持Relax Mode下生成视频。

🔁 视频播放与扩展

播放控制

在“Create”页面鼠标悬停自动播放；
可通过 Ctrl/Command + 鼠标移动 实现视频进度控制（scrubbing）。

延长视频（最多延至21秒）

每次可延长 4秒，可延长最多 4次，共 21秒。

Extend Auto：自动使用原提示词继续；
Extend Manual：可在延伸前编辑提示词。

🎥 视频运动模式说明

--motion low（默认）：轻微动作、静态场景、慢动作、微小角色移动；
--motion high：大幅相机移动、明显角色动作（可能带来不自然或失真现象）；
--raw：关闭系统风格优化，更精确地响应提示词控制。

⚖️ 使用上传图像的规定（合规性）

上传图像需拥有合法使用权；
禁止生成侮辱性、色情化或煽动性视频，特别是针对真实人物；
系统会自动过滤违规内容，被拦截的视频不会扣除GPU时间；
如不同意规定，建议不要使用外部图像生成视频。

官方指南：https://docs.midjourney.com/hc/en-us/articles/37460773864589-Video

如果觉得文章对你有用，请随意赞赏

快讯

Midjourney震撼推出V1视频模型：AI一键生成5-20秒高清视频

https://soraor.com/archives/ai-today_20250619142610

作者

破晓

发布于

2025-06-19

更新于

2025-06-19

许可协议

CC BY 4.0