Skip to content
EN

VideoRetalk 视频生成

方法: POST路径: /qwen/api/v1/services/aigc/image2video/video-synthesis/

官方api 文档

声动人像VideoRetalk是一个人物视频生成模型,可基于人物视频和人声音频,生成人物讲话口型与输入音频相匹配的新视频。本文档介绍了该模型提供的视频生成能力的API调用方法。

请求参数

Header 参数

text
X-DashScope-Async
string
必需
示例:
enable
Content-Type
string
必需
示例:
application/json
Authorization
string
可选
默认值:
Bearer {{YOUR_API_KEY}}

Body 参数 application/json 必填

text
model
string
必需
input
object
必需
video_url
string
必需
用户上传的视频文件 URL。
URL 需为公网可访问的地址,并支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。
视频文件要求:
大小:文件≤300MB
格式:mp4、avi、mov
时长:2秒<时长<120秒
帧率:15fps≤帧率≤60fps
编码:推荐采用H.264或H.265编码
边长:640≤边长≤2048
内容:人物正面出镜的近景画面,避免大角度侧脸或人脸过小。如果视频的画面中人脸拍不全、没有人,请参考常见问题进行处理。
audio_url
string
必需
用户上传的音频文件 URL。
URL 需为公网可访问的地址,并支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。
音频文件要求:
大小:文件≤30MB
格式:wav、mp3、aac
时长:2秒<时长<120秒,如果视频和音频的时长不一致,请参考常见问题进行处理
内容:音频中需包含清晰、响亮的人声语音,并去除了环境噪音、背景音乐等声音干扰信息。
ref_image_url
string
可选
用户上传的人脸参考图 URL。
URL 需为公网可访问的地址,并支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。
当输入视频中存在多张人脸时,您可以通过该参数指定用于口型匹配的人脸。如果视频中仅有一张人脸,则无需进行指定。
若不输入人脸参考图,默认将选择视频中第一个有人脸的画面中,人脸占比最大的人物为目标。
图像文件要求:
内容:需包含一张清晰的人物正脸,且为视频中出现的人物
文件大小:文件≤10MB
图像大小:长宽比小于等于2,最大边长小于等4096
格式:jpeg、jpg、png、bmp、webp
parameters
object
必需
video_extension
boolean
可选
当输入的音频时长大于视频时长时,是否扩展视频长度。默认值为false,可设置为true或false。
值为true时,使用原视频画面“倒放-正放”交替模式扩展视频时长,直至与音频相同。
值为false时,不扩展画面长度,生成视频时长将与原视频相同,音频将被截断。
示例
{
"model"
:
"videoretalk"
,
"input"
:
{
"video_url"
:
"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/pvegot/input_video_01.mp4"
,
"audio_url"
:
"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/aumwir/stella2-%E6%9C%89%E5%A3%B0%E4%B9%A67.wav"
,
"ref_image_url"
:
""
}
,
"parameters"
:
{
"video_extension"
:
false
}
}

请求示例代码

Shell

bash
curl --location --request POST '/qwen/api/v1/services/aigc/image2video/video-synthesis/' \
--header 'X-DashScope-Async: enable' \
--header 'Authorization: Bearer {{YOUR_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "videoretalk",
    "input": {
        "video_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/pvegot/input_video_01.mp4",
        "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/aumwir/stella2-%E6%9C%89%E5%A3%B0%E4%B9%A67.wav",
        "ref_image_url": ""
     },
    "parameters": {
        "video_extension": false
    }
  }'

返回响应

🟢 200 成功

内容类型: application/json

响应结构

text
object

示例

json
{}