AI Router 文档AI Router 文档
首页
快速开始
使用指南
模型接入
API 文档
售后支持
首页
快速开始
使用指南
模型接入
API 文档
售后支持
  • API 接口

    • API 接口
    • 聊天补全接口
    • 文本补全接口
    • 文本嵌入接口
    • 图像生成接口

图像生成接口

根据文本描述生成图像。

接口信息

  • 接口地址: POST /v1/images/generations
  • 认证方式: Bearer Token
  • Content-Type: application/json

请求参数

必填参数

参数类型说明
promptstring图像描述

可选参数

参数类型默认值说明
modelstring"dall-e-2"图像生成模型
ninteger1生成数量,1-10
qualitystring"standard"图像质量,"standard" 或 "hd"
response_formatstring"url"响应格式,"url" 或 "b64_json"
sizestring"1024x1024"图像尺寸
stylestring"vivid"图像风格,"vivid" 或 "natural"
userstringnull用户标识

支持的模型

模型说明
dall-e-2第二代图像生成模型
dall-e-3第三代图像生成模型,更高质量

支持的尺寸

DALL-E 2:

  • 256x256
  • 512x512
  • 1024x1024

DALL-E 3:

  • 1024x1024
  • 1792x1024
  • 1024x1792

请求示例

基础请求

curl https://aigc.aochengcloud.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
  -d '{
    "model": "dall-e-3",
    "prompt": "一只可爱的橘猫在阳光下打盹",
    "n": 1,
    "size": "1024x1024"
  }'

高质量请求

curl https://aigc.aochengcloud.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
  -d '{
    "model": "dall-e-3",
    "prompt": "一个未来城市的夜景,霓虹灯闪烁,飞行汽车穿梭",
    "quality": "hd",
    "size": "1792x1024",
    "style": "vivid"
  }'

返回 base64 格式

curl https://aigc.aochengcloud.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
  -d '{
    "model": "dall-e-3",
    "prompt": "一朵盛开的莲花",
    "response_format": "b64_json"
  }'

响应格式

URL 格式响应

{
  "created": 1704067200,
  "data": [
    {
      "url": "https://example.com/images/generated.png",
      "revised_prompt": "一只可爱的橘猫慵懒地躺在阳光斑驳的窗台上打盹..."
    }
  ]
}

base64 格式响应

{
  "created": 1704067200,
  "data": [
    {
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."
    }
  ]
}

响应字段说明

字段类型说明
createdinteger创建时间戳
dataarray生成的图像列表

data 字段

字段类型说明
urlstring图像 URL(当 response_format 为 "url" 时)
b64_jsonstringbase64 编码的图像(当 response_format 为 "b64_json" 时)
revised_promptstring修订后的提示(DALL-E 3)

SDK 示例

Python

import openai

client = openai.OpenAI(
    api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
    base_url="https://aigc.aochengcloud.com/v1"
)

# 生成图像
response = client.images.generate(
    model="dall-e-3",
    prompt="一只可爱的橘猫在阳光下打盹",
    size="1024x1024",
    quality="standard",
    n=1
)

# 获取图像 URL
image_url = response.data[0].url
print(f"图像 URL: {image_url}")

# 获取修订后的提示
if hasattr(response.data[0], 'revised_prompt'):
    print(f"修订后的提示: {response.data[0].revised_prompt}")

Node.js

import OpenAI from 'openai';

const openai = new OpenAI({
  apiKey: 'sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx',
  baseURL: 'https://aigc.aochengcloud.com/v1'
});

// 生成图像
const response = await openai.images.generate({
  model: 'dall-e-3',
  prompt: '一只可爱的橘猫在阳光下打盹',
  size: '1024x1024',
  quality: 'standard',
  n: 1
});

console.log(`图像 URL: ${response.data[0].url}`);

保存图像

import requests
from PIL import Image
from io import BytesIO

# 获取图像 URL
image_url = response.data[0].url

# 下载图像
image_response = requests.get(image_url)
image = Image.open(BytesIO(image_response.content))

# 保存图像
image.save("generated_image.png")

base64 解码保存

import base64

# 获取 base64 数据
b64_data = response.data[0].b64_json

# 解码并保存
image_data = base64.b64decode(b64_data)
with open("generated_image.png", "wb") as f:
    f.write(image_data)

使用场景

创意设计

# 生成 Logo
response = client.images.generate(
    model="dall-e-3",
    prompt="一个简洁现代的科技公司 Logo,蓝色调,包含 AI 元素",
    size="1024x1024",
    quality="hd"
)

产品图片

# 生成产品展示图
response = client.images.generate(
    model="dall-e-3",
    prompt="一款高端无线耳机的产品展示图,白色背景,专业摄影风格",
    size="1024x1024",
    quality="hd"
)

插画创作

# 生成儿童绘本插画
response = client.images.generate(
    model="dall-e-3",
    prompt="一只小兔子在森林里采蘑菇,卡通风格,色彩明亮",
    size="1024x1024",
    style="natural"
)

概念设计

# 生成建筑概念图
response = client.images.generate(
    model="dall-e-3",
    prompt="未来主义风格的摩天大楼,流线型设计,绿色植物覆盖",
    size="1792x1024",
    quality="hd",
    style="vivid"
)

提示工程

好的提示

一只可爱的橘猫慵懒地躺在阳光斑驳的窗台上打盹,
温暖的光线照在它柔软的毛发上,背景是温馨的室内环境,
摄影风格,高清细节

提示要素

  1. 主体 - 明确描述主要对象
  2. 动作 - 描述对象的动作或状态
  3. 环境 - 描述背景或场景
  4. 风格 - 指定艺术风格或摄影风格
  5. 细节 - 添加光照、颜色等细节

避免的内容

  • 模糊或抽象的描述
  • 过于复杂的场景
  • 版权内容
  • 不当内容

DALL-E 2 vs DALL-E 3

特性DALL-E 2DALL-E 3
图像质量标准更高
文字渲染较差更好
提示理解一般更准确
生成速度较快较慢
价格较低较高
可用尺寸3种3种

错误处理

错误码说明处理方式
400请求参数错误检查参数格式
401认证失败检查 API Key
429请求频率超限降低请求频率
500服务器错误稍后重试

常见问题

Q: 生成的图像不符合预期?

A: 尝试以下方法:

  1. 优化提示词,添加更多细节
  2. 使用 DALL-E 3 模型
  3. 调整 style 参数

Q: 生成速度慢?

A: 可能的原因:

  1. 使用 DALL-E 3 模型较慢
  2. 高清图像生成较慢
  3. 服务器负载高

价格说明

模型质量1024x10241024x1792/1792x1024
DALL-E 3standard$0.040$0.080
DALL-E 3hd$0.080$0.120
DALL-E 2standard$0.020-
最后更新:
Prev
文本嵌入接口