Dalle 格式介绍
1. Generations 通用 (图生图 & 文生图)
用途:用文字或文字+图片来生成一张全新的图片。
场景:
单纯输入文本 Prompt → 生成图片(文生图)。
上传一张参考图 + 文本 Prompt → 按照描述生成新的变体或带风格的图片(图生图)。
关键点: 1.通常是文生图,以及没有局部 Mask 修改 2.传递文件链接
2. Edits 通用 (图像编辑)
用途:对已有图片进行编辑或局部修改。
场景:
上传图片 + 蒙版(mask)+ 文本 Prompt → 指定区域被替换/修改。
例如:去掉背景、换衣服颜色、在空白处加物体。
关键点: 1.官方 gpt-image-1 模型支持 “编辑”,需要传 mask(或透明区域) 2.传递文件流
3. Chat 通用 (对话格式)
用途:快速在客户端支持绘图模型
场景:仅支持对话的客户端,可以快速体验
dalle 接口 model 枚举值
gpt-image-1 gpt-4o-image gpt-4o-image-vip sora_image-vip sora_image flux-kontext-pro\max\dev flux -* nano-banana nano-banana-hd dall-e-3 recraftv3 qwen-image qwen-image-edit doubao-seedream-4-0-250828 doubao-seededit-3-0-i2i-250628 doubao-seedream-3-0-t2i-250415
说明 支持所有 flux-kontext 系列,flux-kontext-dev 必须有参考图 支持所有flux 系列