Skip to content
EN

首帧生成视频接口

方法: POST路径: /qwen/api/v1/services/aigc/video-generation/video-synthesis

官方api 文档 通义万相-图生视频模型根据首帧图像和文本提示词,生成一段流畅的视频。支持的能力包括:

基础能力:支持选择视频时长(3-10秒)、指定视频分辨率(480P/720P/1080P)、智能改写prompt、添加水印。

音频能力:支持自动配音,或传入自定义音频文件,实现音画同步。(仅wan2.5支持)

视频特效:部分模型内置“魔法悬浮”、“气球膨胀”等特效模板,可直接调用。

请求参数

Header 参数

text
X-DashScope-Async
string
必需
示例:
enable
Content-Type
string
必需
示例:
application/json
Authorization
string
可选
默认值:
Bearer {{YOUR_API_KEY}}

Body 参数 application/json 必填

text
model
string
必需
input
object
必需
prompt
string
可选
文本提示词。用来描述生成图像中期望包含的元素和视觉特点。
支持中英文,每个汉字/字母占一个字符,超过部分会自动截断。长度限制因模型版本而异:
wan2.5-i2v-preview:长度不超过2000个字符。
wan2.2及以下版本模型:长度不超过800个字符。
当使用视频特效参数(即template不为空)时,prompt参数无效,无需填写。
示例值:一只小猫在草地上奔跑。
negative_prompt
string
可选
反向提示词,用来描述不希望在视频画面中看到的内容,可以对视频画面进行限制。
支持中英文,长度不超过500个字符,超过部分会自动截断。
示例值:低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良等。
img_url
string
必需
首帧图像的URL或 Base64 编码数据。
图像限制:
图像格式:JPEG、JPG、PNG(不支持透明通道)、BMP、WEBP。
图像分辨率:图像的宽度和高度范围为[360, 2000],单位为像素。
文件大小:不超过10MB。
输入图像说明:
使用公网可访问URL
支持 HTTP 或 HTTPS 协议。本地文件可通过上传文件获取临时URL。
示例值:
https://cdn.translate.alibaba.com/r/wanx-demo-1.png。
传入 Base64 编码图像后的字符串
数据格式:data:{MIME_type};base64,{base64_data}。
示例值:data:image/png;base64,GDU7MtCZzEbTbmRZ......。(编码字符串过长,仅展示片段)
更多内容请参见输入图像。
audio_url
string
可选
仅 wan2.5-i2v-preview 支持。音频文件的 URL,模型将使用该音频生成视频。使用方式参见音频设置。
支持 HTTP 或 HTTPS 协议。本地文件可通过上传文件获取临时URL。
音频限制:
格式:wav、mp3。
时长:3~30s。
文件大小:不超过15MB。
超限处理:若音频长度超过 duration 值(5秒或10秒),自动截取前5秒或10秒,其余部分丢弃。若音频长度不足视频时长,超出音频长度部分为无声视频。例如,音频为3秒,视频时长为5秒,输出视频前3秒有声,后2秒无声。
示例值:
https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/ozwpvi/rap.mp3。
template
string
可选
视频特效模板的名称。若未填写,表示不使用任何视频特效。
不同模型支持不同的特效模板。调用前请查阅视频特效列表,以免调用失败。
示例值:flying,表示使用“魔法悬浮”特效。
parameters
object
可选
resolution
string
可选
指定生成的视频分辨率档位,用于调整视频的清晰度(总像素)。模型根据选择的分辨率档位,自动缩放至相近总像素,视频宽高比将尽量与输入图像 img_url 的宽高比保持一致,更多说明详见常见问题。
此参数的默认值和可用枚举值依赖于 model 参数,规则如下:
wan2.5-i2v-preview :可选值:480P、720P、1080P。默认值为1080P。
wan2.2-i2v-flash:可选值:480P、720P、1080P。默认值为720P。
wan2.2-i2v-plus:可选值:480P、1080P。默认值为1080P。
wanx2.1-i2v-turbo:可选值:480P、720P。默认值为720P。
wanx2.1-i2v-plus:可选值:720P。默认值为720P。
示例值:1080P。
prompt_extend
boolean
可选
是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写。对于较短的prompt生成效果提升明显,但会增加耗时。
true:默认值,开启智能改写。
false:不开启智能改写。
示例值:true。
duration
integer
可选
生成视频的时长,单位为秒。该参数的取值依赖于 model参数:
wan2.5-i2v-preview:可选值为5、10。默认值为5。
wan2.2-i2v-plus:固定为5秒,且不支持修改。
wan2.2-i2v-flash:固定为5秒,且不支持修改。
wanx2.1-i2v-plus:固定为5秒,且不支持修改。
wanx2.1-i2v-turbo:可选值为3、4或5。默认值为5。
示例值:5。
watermark
boolean
可选
是否添加水印标识,水印位于视频右下角,文案固定为“AI生成”。
false:默认值,不添加水印。
true:添加水印。
示例值:false。
audio
boolean
可选
仅 wan2.5-i2v-preview 支持。 用于控制是否添加音频。
参数优先级:audio_url > audio,仅在 audio_url为空时生效。使用方式参见音频设置。
true:默认值,自动为视频添加音频。
false:不添加音频,输出无声视频。
示例值:true。
seed
integer
可选
随机数种子,取值范围为[0, 2147483647]。
未指定时,系统自动生成随机种子。若需提升生成结果的可复现性,建议固定seed值。
请注意,由于模型生成具有概率性,即使使用相同 seed,也不能保证每次生成结果完全一致。
示例值:12345。
示例
{
"model"
:
"wan2.5-i2v-preview"
,
"input"
:
{
"prompt"
:
"一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。"
,
"img_url"
:
"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/wpimhv/rap.png"
}
,
"parameters"
:
{
"resolution"
:
"480P"
,
"prompt_extend"
:
true
,
"duration"
:
10
,
"audio"
:
true
}
}

请求示例代码

Shell

bash
curl --location --request POST '/qwen/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header 'Authorization: Bearer {{YOUR_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "wan2.5-i2v-preview",
    "input": {
        "prompt": "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。",
        "img_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/wpimhv/rap.png"
    },
    "parameters": {
        "resolution": "480P",
        "prompt_extend": true,
        "duration": 10,
        "audio": true
    }
}'

返回响应

🟢 200 成功

内容类型: application/json

响应结构

text
object

示例

json
{}