name: 图像生成 description: 使用此技能当用户请求生成、创建、想象或可视化图像,包括角色、场景、产品或任何视觉内容。支持结构化提示和参考图像以指导生成。
图像生成技能
概述
此技能使用结构化提示和Python脚本生成高质量图像。工作流程包括创建JSON格式提示和通过可选参考图像执行图像生成。
核心能力
- 为AIGC图像生成创建结构化JSON提示
- 支持多个参考图像以指导样式和构图
- 通过自动化Python脚本执行生成图像
- 处理多种图像生成场景(角色设计、场景、产品等)
工作流程
步骤1:理解需求
当用户请求图像生成时,识别:
- 主题/内容:图像中应包含什么
- 样式偏好:艺术风格、情绪、调色板
- 技术规格:宽高比、构图、光照
- 参考图像:任何指导生成的图像
- 您无需检查
/mnt/user-data下的文件夹
步骤2:创建结构化提示
在 /mnt/user-data/workspace/ 中生成结构化JSON文件,命名模式:{描述性名称}.json
步骤3:执行生成
调用Python脚本:
python /mnt/skills/public/image-generation/scripts/generate.py \
--prompt-file /mnt/user-data/workspace/prompt-file.json \
--reference-images /path/to/ref1.jpg /path/to/ref2.png \
--output-file /mnt/user-data/outputs/generated-image.jpg
--aspect-ratio 16:9
参数:
--prompt-file:JSON提示文件的绝对路径(必需)--reference-images:参考图像的绝对路径(可选,空格分隔)--output-file:输出图像文件的绝对路径(必需)--aspect-ratio:生成图像的宽高比(可选,默认:16:9)
[!注意] 请勿读取Python文件,仅使用参数调用它。
角色生成示例
用户请求:“创建一个1990年代东京街头风格女性角色”
创建提示文件:/mnt/user-data/workspace/asian-woman.json
{
"characters": [{
"gender": "女性",
"age": "20多岁",
"ethnicity": "日本人",
"body_type": "苗条、优雅",
"facial_features": "精致五官、富有表情的眼睛、淡妆强调嘴唇、长发因雨部分湿润",
"clothing": "时尚风衣、设计师手袋、高跟鞋、当代东京街头时尚",
"accessories": "简约珠宝、突出耳环、皮革手袋",
"era": "1990年代"
}],
"negative_prompt": "模糊脸、变形、低质量、过度锐利的数字外观、过饱和色彩、人工光照、工作室设置、摆拍、自拍角度",
"style": "徕卡M11街头摄影美学、胶片感渲染、自然调色板略带温暖、背景虚化模糊、模拟摄影感",
"composition": "中景、三分法则、主题略微偏离中心、东京街头的环境背景可见、浅景深隔离主题",
"lighting": "霓虹灯从招牌和店面发出、湿路面反射、柔和的城市环境光、自然街头光照、背景霓虹灯的边缘光照",
"color_palette": "柔和自然色调、温暖肤色、冷蓝色和品红色霓虹点缀、相比数字摄影去饱和、胶片颗粒纹理"
}
执行生成:
python /mnt/skills/public/image-generation/scripts/generate.py \
--prompt-file /mnt/user-data/workspace/cyberpunk-hacker.json \
--output-file /mnt/user-data/outputs/cyberpunk-hacker-01.jpg \
--aspect-ratio 2:3
带参考图像:
{
"characters": [{
"gender": "基于[图像1]",
"age": "基于[图像1]",
"ethnicity": "来自[图像1]的人类适应星球大战宇宙",
"body_type": "基于[图像1]",
"facial_features": "匹配[图像1]略带太空旅行磨损感",
"clothing": "星球大战风格服装 – 磨损皮夹克带实用背心、战术口袋工装裤、磨痕靴子、带枪套腰带",
"accessories": "臀部爆能枪、手腕通讯器、推上额头护目镜、补给背包、基于[图像2]的个人载具",
"era": "星球大战宇宙、帝国后时代"
}],
"prompt": "角色灵感来自[图像1]站在灵感来自[图像2]的载具旁,在星球大战宇宙美学的繁华外星街道上。角色穿着磨损皮夹克带实用背心、战术口袋工装裤、磨痕靴子、带爆能枪腰带。载具适应星球大战美学,带磨损金属板、反重力引擎、沙漠灰尘覆盖、停在街上。异星市场街道带多层建筑、风化金属结构、悬挂市场摊位带彩色遮阳篷、外星物种作为背景角色走过。双太阳投射温暖金色光、大气中灰尘粒子、远处可见湿度蒸气器。粗粝生活感星球大战美学、实用特效外观、胶片颗粒纹理、电影构图。",
"negative_prompt": "干净未来感、无菌环境、过度CGI外观、幻想中世纪元素、地球建筑、现代城市",
"style": "星球大战原三部曲美学、生活感宇宙、实用特效灵感、电影感外观、略带去饱和带温暖色调",
"composition": "中宽景、角色在前景外星街道延伸至背景、环境叙事、三分法则",
"lighting": "双太阳温暖金色光、角色边缘光照、大气雾霭、市场摊位实用光源",
"color_palette": "温暖沙色调、赭石和褐红色、尘蓝、风化金属、柔和大地色带异星市场色彩点缀",
"technical": {
"aspect_ratio": "9:16",
"quality": "高",
"detail_level": "高细节带胶片感纹理"
}
}
python /mnt/skills/public/image-generation/scripts/generate.py \
--prompt-file /mnt/user-data/workspace/star-wars-scene.json \
--reference-images /mnt/user-data/uploads/character-ref.jpg /mnt/user-data/uploads/vehicle-ref.jpg \
--output-file /mnt/user-data/outputs/star-wars-scene-01.jpg \
--aspect-ratio 16:9
常见场景
为不同场景使用不同JSON模式。
角色设计:
- 物理属性(性别、年龄、种族、体型)
- 面部特征和表情
- 服装和配件
- 历史时代或设置
- 姿势和上下文
场景生成:
- 环境描述
- 时间、天气
- 情绪和氛围
- 焦点和构图
产品可视化:
- 产品细节和材料
- 光照设置
- 背景和上下文
- 展示角度
特定模板
仅当匹配用户请求时读取以下模板文件。
输出处理
生成后:
- 图像通常保存在
/mnt/user-data/outputs/ - 使用present_files工具与用户分享生成图像
- 提供生成结果的简要描述
- 如果需要调整,提供迭代
提示:通过参考图像增强生成
对于视觉准确性关键的场景,首先使用 image_search 工具在生成前找到参考图像。
推荐使用image_search工具的场景:
- 角色/肖像生成:搜索类似姿势、表情或样式以指导面部特征和身体比例
- 特定物体或产品:找到真实物体参考图像以确保准确表示
- 建筑或环境场景:搜索位置参考以捕捉真实细节
- 时尚和服装:找到样式参考以确保准确服装细节和造型
示例工作流程:
- 调用
image_search工具找到合适参考图像:image_search(query="日本女性街头摄影1990年代", size="大") - 将返回的图像URL下载到本地文件
- 使用下载图像作为生成脚本的
--reference-images参数
这种方法通过为模型提供具体视觉指导而非仅依赖文本描述,显著提高生成质量。
注意
- 无论用户语言如何,始终使用英语进行提示
- JSON格式确保结构化、可解析提示
- 参考图像显著提高生成质量
- 迭代优化以获得最佳结果正常
- 对于角色生成,包括详细角色对象和合并的提示字段