OpenAI图像生成技能Skill openai-image-gen

这个技能使用Python脚本通过OpenAI Images API批量生成图像,支持多种AI模型如GPT图像模型和DALL-E,可自定义参数如提示、大小、质量和样式,并自动生成图库文件。适用于内容创作、设计和AI应用开发。关键词:OpenAI, 图像生成, AI, API, 批量处理, Python脚本, 图库, AIGC, 人工智能。

AIGC 0 次安装 0 次浏览 更新于 3/24/2026

name: openai-image-gen description: 通过OpenAI Images API批量生成图像。随机提示采样器 + index.html 画廊。 homepage: https://platform.openai.com/docs/api-reference/images metadata: { “otto”: { “emoji”: “🖼️”, “requires”: { “bins”: [“python3”], “env”: [“OPENAI_API_KEY”] }, “primaryEnv”: “OPENAI_API_KEY”, “install”: [ { “id”: “python-brew”, “kind”: “brew”, “formula”: “python”, “bins”: [“python3”], “label”: “安装Python (brew)”, }, ], }, }

OpenAI图像生成

生成一些“随机但结构化”的提示并通过OpenAI Images API渲染它们。

运行

python3 {baseDir}/scripts/gen.py
open ~/Projects/tmp/openai-image-gen-*/index.html  # 如果 ~/Projects/tmp 存在;否则 ./tmp/...

有用标志:

# GPT图像模型的各种选项
python3 {baseDir}/scripts/gen.py --count 16 --model gpt-image-1
python3 {baseDir}/scripts/gen.py --prompt "超详细工作室照片的未来城市景观" --count 4
python3 {baseDir}/scripts/gen.py --size 1536x1024 --quality high --out-dir ./out/images
python3 {baseDir}/scripts/gen.py --model gpt-image-1.5 --background transparent --output-format webp

# DALL-E 3(注意:计数自动限制为1)
python3 {baseDir}/scripts/gen.py --model dall-e-3 --quality hd --size 1792x1024 --style vivid
python3 {baseDir}/scripts/gen.py --model dall-e-3 --style natural --prompt "宁静的山地景观"

# DALL-E 2
python3 {baseDir}/scripts/gen.py --model dall-e-2 --size 512x512 --count 4

模型特定参数

不同模型支持不同的参数值。脚本根据模型自动选择适当的默认值。

大小

  • GPT图像模型 (gpt-image-1, gpt-image-1-mini, gpt-image-1.5): 1024x1024, 1536x1024 (横屏), 1024x1536 (竖屏), 或 auto
    • 默认: 1024x1024
  • dall-e-3: 1024x1024, 1792x1024, 或 1024x1792
    • 默认: 1024x1024
  • dall-e-2: 256x256, 512x512, 或 1024x1024
    • 默认: 1024x1024

质量

  • GPT图像模型: auto, high, medium, 或 low
    • 默认: high
  • dall-e-3: hdstandard
    • 默认: standard
  • dall-e-2: 仅 standard
    • 默认: standard

其他显著差异

  • dall-e-3 仅支持一次生成1张图像 (n=1)。使用此模型时,脚本自动将计数限制为1。
  • GPT图像模型 支持额外参数:
    • --background: transparent, opaque, 或 auto (默认)
    • --output-format: png (默认), jpeg, 或 webp
    • 注意: streammoderation 在API中可用,但尚未在此脚本中实现
  • dall-e-3 有一个 --style 参数: vivid (超真实, 戏剧化) 或 natural (更自然外观)

输出

  • *.png, *.jpeg, 或 *.webp 图像 (输出格式取决于模型 + --output-format)
  • prompts.json (提示 → 文件映射)
  • index.html (缩略图画廊)