图像生成Skill image-generation

这是一个图像生成技能,用于通过结构化提示和参考图像生成高质量视觉内容,支持角色设计、场景构建和产品可视化等多种应用场景。关键词:图像生成、AI生成内容、视觉创作、结构化提示、参考图像、AIGC、人工智能视觉。

AIGC 0 次安装 0 次浏览 更新于 3/17/2026

name: 图像生成 description: 使用此技能当用户请求生成、创建、想象或可视化图像,包括角色、场景、产品或任何视觉内容。支持结构化提示和参考图像以指导生成。

图像生成技能

概述

此技能使用结构化提示和Python脚本生成高质量图像。工作流程包括创建JSON格式提示和通过可选参考图像执行图像生成。

核心能力

  • 为AIGC图像生成创建结构化JSON提示
  • 支持多个参考图像以指导样式和构图
  • 通过自动化Python脚本执行生成图像
  • 处理多种图像生成场景(角色设计、场景、产品等)

工作流程

步骤1:理解需求

当用户请求图像生成时,识别:

  • 主题/内容:图像中应包含什么
  • 样式偏好:艺术风格、情绪、调色板
  • 技术规格:宽高比、构图、光照
  • 参考图像:任何指导生成的图像
  • 您无需检查 /mnt/user-data 下的文件夹

步骤2:创建结构化提示

/mnt/user-data/workspace/ 中生成结构化JSON文件,命名模式:{描述性名称}.json

步骤3:执行生成

调用Python脚本:

python /mnt/skills/public/image-generation/scripts/generate.py \
  --prompt-file /mnt/user-data/workspace/prompt-file.json \
  --reference-images /path/to/ref1.jpg /path/to/ref2.png \
  --output-file /mnt/user-data/outputs/generated-image.jpg
  --aspect-ratio 16:9

参数:

  • --prompt-file:JSON提示文件的绝对路径(必需)
  • --reference-images:参考图像的绝对路径(可选,空格分隔)
  • --output-file:输出图像文件的绝对路径(必需)
  • --aspect-ratio:生成图像的宽高比(可选,默认:16:9)

[!注意] 请勿读取Python文件,仅使用参数调用它。

角色生成示例

用户请求:“创建一个1990年代东京街头风格女性角色”

创建提示文件:/mnt/user-data/workspace/asian-woman.json

{
  "characters": [{
    "gender": "女性",
    "age": "20多岁",
    "ethnicity": "日本人",
    "body_type": "苗条、优雅",
    "facial_features": "精致五官、富有表情的眼睛、淡妆强调嘴唇、长发因雨部分湿润",
    "clothing": "时尚风衣、设计师手袋、高跟鞋、当代东京街头时尚",
    "accessories": "简约珠宝、突出耳环、皮革手袋",
    "era": "1990年代"
  }],
  "negative_prompt": "模糊脸、变形、低质量、过度锐利的数字外观、过饱和色彩、人工光照、工作室设置、摆拍、自拍角度",
  "style": "徕卡M11街头摄影美学、胶片感渲染、自然调色板略带温暖、背景虚化模糊、模拟摄影感",
  "composition": "中景、三分法则、主题略微偏离中心、东京街头的环境背景可见、浅景深隔离主题",
  "lighting": "霓虹灯从招牌和店面发出、湿路面反射、柔和的城市环境光、自然街头光照、背景霓虹灯的边缘光照",
  "color_palette": "柔和自然色调、温暖肤色、冷蓝色和品红色霓虹点缀、相比数字摄影去饱和、胶片颗粒纹理"
}

执行生成:

python /mnt/skills/public/image-generation/scripts/generate.py \
  --prompt-file /mnt/user-data/workspace/cyberpunk-hacker.json \
  --output-file /mnt/user-data/outputs/cyberpunk-hacker-01.jpg \
  --aspect-ratio 2:3

带参考图像:

{
  "characters": [{
    "gender": "基于[图像1]",
    "age": "基于[图像1]",
    "ethnicity": "来自[图像1]的人类适应星球大战宇宙",
    "body_type": "基于[图像1]",
    "facial_features": "匹配[图像1]略带太空旅行磨损感",
    "clothing": "星球大战风格服装 – 磨损皮夹克带实用背心、战术口袋工装裤、磨痕靴子、带枪套腰带",
    "accessories": "臀部爆能枪、手腕通讯器、推上额头护目镜、补给背包、基于[图像2]的个人载具",
    "era": "星球大战宇宙、帝国后时代"
  }],
  "prompt": "角色灵感来自[图像1]站在灵感来自[图像2]的载具旁,在星球大战宇宙美学的繁华外星街道上。角色穿着磨损皮夹克带实用背心、战术口袋工装裤、磨痕靴子、带爆能枪腰带。载具适应星球大战美学,带磨损金属板、反重力引擎、沙漠灰尘覆盖、停在街上。异星市场街道带多层建筑、风化金属结构、悬挂市场摊位带彩色遮阳篷、外星物种作为背景角色走过。双太阳投射温暖金色光、大气中灰尘粒子、远处可见湿度蒸气器。粗粝生活感星球大战美学、实用特效外观、胶片颗粒纹理、电影构图。",
  "negative_prompt": "干净未来感、无菌环境、过度CGI外观、幻想中世纪元素、地球建筑、现代城市",
  "style": "星球大战原三部曲美学、生活感宇宙、实用特效灵感、电影感外观、略带去饱和带温暖色调",
  "composition": "中宽景、角色在前景外星街道延伸至背景、环境叙事、三分法则",
  "lighting": "双太阳温暖金色光、角色边缘光照、大气雾霭、市场摊位实用光源",
  "color_palette": "温暖沙色调、赭石和褐红色、尘蓝、风化金属、柔和大地色带异星市场色彩点缀",
  "technical": {
    "aspect_ratio": "9:16",
    "quality": "高",
    "detail_level": "高细节带胶片感纹理"
  }
}
python /mnt/skills/public/image-generation/scripts/generate.py \
  --prompt-file /mnt/user-data/workspace/star-wars-scene.json \
  --reference-images /mnt/user-data/uploads/character-ref.jpg /mnt/user-data/uploads/vehicle-ref.jpg \
  --output-file /mnt/user-data/outputs/star-wars-scene-01.jpg \
  --aspect-ratio 16:9

常见场景

为不同场景使用不同JSON模式。

角色设计

  • 物理属性(性别、年龄、种族、体型)
  • 面部特征和表情
  • 服装和配件
  • 历史时代或设置
  • 姿势和上下文

场景生成

  • 环境描述
  • 时间、天气
  • 情绪和氛围
  • 焦点和构图

产品可视化

  • 产品细节和材料
  • 光照设置
  • 背景和上下文
  • 展示角度

特定模板

仅当匹配用户请求时读取以下模板文件。

输出处理

生成后:

  • 图像通常保存在 /mnt/user-data/outputs/
  • 使用present_files工具与用户分享生成图像
  • 提供生成结果的简要描述
  • 如果需要调整,提供迭代

提示:通过参考图像增强生成

对于视觉准确性关键的场景,首先使用 image_search 工具在生成前找到参考图像。

推荐使用image_search工具的场景

  • 角色/肖像生成:搜索类似姿势、表情或样式以指导面部特征和身体比例
  • 特定物体或产品:找到真实物体参考图像以确保准确表示
  • 建筑或环境场景:搜索位置参考以捕捉真实细节
  • 时尚和服装:找到样式参考以确保准确服装细节和造型

示例工作流程

  1. 调用 image_search 工具找到合适参考图像:
    image_search(query="日本女性街头摄影1990年代", size="大")
    
  2. 将返回的图像URL下载到本地文件
  3. 使用下载图像作为生成脚本的 --reference-images 参数

这种方法通过为模型提供具体视觉指导而非仅依赖文本描述,显著提高生成质量。

注意

  • 无论用户语言如何,始终使用英语进行提示
  • JSON格式确保结构化、可解析提示
  • 参考图像显著提高生成质量
  • 迭代优化以获得最佳结果正常
  • 对于角色生成,包括详细角色对象和合并的提示字段