EMO 视频生成 API
方法: POST路径: /qwen/api/v1/services/aigc/image2video/video-synthesis
EMO模型可基于人物肖像图片和人声音频,生成人脸动态视频。
请求参数
Header 参数
text
X-DashScope-Async
string
必需
示例:
enable
Content-Type
string
必需
示例:
application/json
Authorization
string
可选
默认值:
Bearer {{YOUR_API_KEY}}Body 参数 application/json 必填
text
model
string
必需
input
object
必需
image_url
string
必需
用户上传的图片 URL。模型将根据EMO图像检测API返回的 ext_bbox 参数,对原始图片进行裁剪。裁剪后区域的宽高比直接决定了输出视频的画幅比例与分辨率。
若 ext_bbox 宽高比为1:1,则生成512×512的头像视频;若为3:4,则生成512×704的半身像视频。
图像要求最小边长 ≥ 400像素,最大边长 ≤ 7000像素。
格式支持:jpg,jpeg,png,bmp,webp。
示例值:
https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250911/yhdvfg/emo-%E5%9B%BE%E7%89%87.png。
上传文件支持HTTP或HTTPS链接方式,不支持本地链接方式。您也可在此获取临时公网URL。
audio_url
string
必需
用户上传的音频文件 URL, 用于EMO模型推理的输入。
需包含清晰人声,并尽可能去除环境噪音、背景音乐等干扰。
文件大小 ≤ 15 MB,时长 ≤ 60 s。
格式支持:wav、mp3。
示例值:
https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/aejgyj/input_audio.mp3。
上传文件支持HTTP或HTTPS链接方式,不支持本地链接方式。您也可在此获取临时公网URL。
face_bbox
array
[integer]
必需
图片中人脸区域bbox的像素坐标,应输入EMO图像检测API出参中同名字段的值。坐标格式[x1,y1,x2,y2],分别对应左上和右下两个点的坐标。示例值:[302,286,610,593]。
图像左上角为坐标原点(0,0),x轴向右为正,y轴向下为正。
ext_bbox
array
[integer]
必需
图片中动态区域bbox的像素坐标,应输入EMO图像检测API出参中同名字段的值。该区域的宽高比为1:1或3:4。坐标格式[x1,y1,x2,y2],分别对应左上和右下两个点的坐标。示例值:[71,9,840,778]。
parameters
object
可选
style_level
string
可选
style_level string (可选)默认值:normal
可选择动作风格强度控制人物的运动姿态和幅度,当前支持3种:normal、calm、active,分别对应人物动作风格适中、平静、活泼。默认为normal。
示例
{
"model"
:
"emo-v1"
,
"input"
:
{
"image_url"
:
"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250911/yhdvfg/emo-%E5%9B%BE%E7%89%87.png"
,
"audio_url"
:
"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/aejgyj/input_audio.mp3"
,
"face_bbox"
:
[
302
,
286
,
610
,
593
]
,
"ext_bbox"
:
[
71
,
9
,
840
,
778
]
}
,
"parameters"
:
{
"style_level"
:
"normal"
}
}请求示例代码
Shell
bash
curl --location --request POST '/qwen/api/v1/services/aigc/image2video/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header 'Authorization: Bearer {{YOUR_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"model": "emo-v1",
"input": {
"image_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250911/yhdvfg/emo-%E5%9B%BE%E7%89%87.png",
"audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/aejgyj/input_audio.mp3",
"face_bbox":[302,286,610,593],
"ext_bbox":[71,9,840,778]
},
"parameters": {
"style_level": "normal"
}
}'返回响应
🟢 200 成功
内容类型: application/json
响应结构
text
object示例
json
{}