VideoRetalk 视频生成

方法: POST路径: /qwen/api/v1/services/aigc/image2video/video-synthesis/

声动人像VideoRetalk是一个人物视频生成模型，可基于人物视频和人声音频，生成人物讲话口型与输入音频相匹配的新视频。本文档介绍了该模型提供的视频生成能力的API调用方法。

请求参数

text

X-DashScope-Async
string
必需
示例:
enable
Content-Type
string
必需
示例:
application/json
Authorization
string
可选
默认值:
Bearer {{YOUR_API_KEY}}

Body 参数 application/json 必填

text

model
string
必需
input
object
必需
video_url
string
必需
用户上传的视频文件 URL。
URL 需为公网可访问的地址，并支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。
视频文件要求：
大小：文件≤300MB
格式：mp4、avi、mov
时长：2秒＜时长＜120秒
帧率：15fps≤帧率≤60fps
编码：推荐采用H.264或H.265编码
边长：640≤边长≤2048
内容：人物正面出镜的近景画面，避免大角度侧脸或人脸过小。如果视频的画面中人脸拍不全、没有人，请参考常见问题进行处理。
audio_url
string
必需
用户上传的音频文件 URL。
URL 需为公网可访问的地址，并支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。
音频文件要求：
大小：文件≤30MB
格式：wav、mp3、aac
时长：2秒＜时长＜120秒，如果视频和音频的时长不一致，请参考常见问题进行处理
内容：音频中需包含清晰、响亮的人声语音，并去除了环境噪音、背景音乐等声音干扰信息。
ref_image_url
string
可选
用户上传的人脸参考图 URL。
URL 需为公网可访问的地址，并支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。
当输入视频中存在多张人脸时，您可以通过该参数指定用于口型匹配的人脸。如果视频中仅有一张人脸，则无需进行指定。
若不输入人脸参考图，默认将选择视频中第一个有人脸的画面中，人脸占比最大的人物为目标。
图像文件要求：
内容：需包含一张清晰的人物正脸，且为视频中出现的人物
文件大小：文件≤10MB
图像大小：长宽比小于等于2，最大边长小于等4096
格式：jpeg、jpg、png、bmp、webp
parameters
object
必需
video_extension
boolean
可选
当输入的音频时长大于视频时长时，是否扩展视频长度。默认值为false，可设置为true或false。
值为true时，使用原视频画面“倒放-正放”交替模式扩展视频时长，直至与音频相同。
值为false时，不扩展画面长度，生成视频时长将与原视频相同，音频将被截断。
示例
{
"model"
:
"videoretalk"
,
"input"
:
{
"video_url"
:
"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/pvegot/input_video_01.mp4"
,
"audio_url"
:
"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/aumwir/stella2-%E6%9C%89%E5%A3%B0%E4%B9%A67.wav"
,
"ref_image_url"
:
""
}
,
"parameters"
:
{
"video_extension"
:
false
}
}

请求示例代码

Shell

bash

curl --location --request POST '/qwen/api/v1/services/aigc/image2video/video-synthesis/' \
--header 'X-DashScope-Async: enable' \
--header 'Authorization: Bearer {{YOUR_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "videoretalk",
    "input": {
        "video_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/pvegot/input_video_01.mp4",
        "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250717/aumwir/stella2-%E6%9C%89%E5%A3%B0%E4%B9%A67.wav",
        "ref_image_url": ""
     },
    "parameters": {
        "video_extension": false
    }
  }'

返回响应

🟢 200 成功

内容类型: application/json

响应结构

text

object

示例

json

{}

Google-Veo

阿里Wan(万相视频

Grok 视频

Seedance(即梦视频

简单版

官方接口格式

任务查询

GoAmzAI格式(兼容版，开发接入请勿对接

官方格式

简单版(goamz/rocket

通用版

统一格式

换脸任务提交

任务提交

任务查询(免费

即梦4

OpenAI Chat 格式

OpenAI Dalle 格式

Replicate 官方格式

Bfl 官方格式

VideoRetalk 视频生成

请求参数

Header 参数

Body 参数 application/json 必填

请求示例代码

Shell

返回响应

🟢 200 成功

响应结构

示例

任务查询

VideoRetalk 视频生成 ​

请求参数 ​

Header 参数 ​

Body 参数 application/json 必填 ​

请求示例代码 ​

Shell ​

返回响应 ​

🟢 200 成功 ​

响应结构 ​

示例 ​

VideoRetalk 视频生成

请求参数

Header 参数

Body 参数 application/json 必填

请求示例代码

Shell

返回响应

🟢 200 成功

响应结构

示例