中文模型能力介绍Veo 3.1 (视频)

Veo 3.1 模型

概览

Veo 3.1 是 Google DeepMind 推出的视频生成模型,我们在 StoryFlow 中集成了 Veo 3.1 Fast 版本。

能力

  • 极速生成:相比 Sora,Veo Fast 能够更快地交付结果。
  • 首尾帧控制 (Interpolation):独有的能力。您可以同时指定视频的 第一帧最后一帧,Veo 会自动生成中间的过渡动画!

输入

  • 文本 (Prompt): 视频内容描述。
  • 参考图 (Reference Image):
    • 支持上传 1-2 张图片。
    • 上传 1 张:作为首帧。
    • 上传 2 张:分别作为首帧和尾帧(即使相差很大的画面也能平滑过渡)。

参数

参数类型默认值可选值说明
generationModestringFIRST_LAST_FRAMESFIRST_LAST_FRAMES, REFERENCE_2_VIDEO控制参考图的使用方式:FIRST_LAST_FRAMES 将 1–2 张图作为首/尾帧;REFERENCE_2_VIDEO 将 1–3 张图作为参考图生成。
aspectRatiostring16:916:9, 9:16输出视频长宽比。
resolutionstring720p720p, 1080p输出分辨率。1080p 仅在 16:9 下可用。

使用与限制

  • 首尾帧:连接 1–2 张图片控制起点/终点;选择 16:9 可支持 1080p
  • 参考模式:仅 veo3_fast 支持;需要 16:9,并提供 1–3 张参考图。
  • 1080p 获取:渲染时间更长;若上游触发降级,可能最终返回 720p