Gemini图像生成Skill gemini-image-gen

Gemini图像生成技能是一种基于Google Gemini API的AI图像生成工具,用于快速创建社交媒体图形、营销材料、信息图表等视觉内容。支持选择快速或高质量模型,易于集成到各种应用中,适用于AIGC、AI应用、图像生成、自动化设计等场景。

AIGC 0 次安装 2 次浏览 更新于 3/18/2026

name: gemini-image-gen description: 使用Google Gemini API进行图像生成。模型:gemini-2.5-flash-image(快速)或gemini-3-pro-image-preview(高质量)。适用于社交媒体图形、营销材料、信息图表。

Gemini图像生成

直接从Claude Code CLI使用Google的Gemini API生成图像。

设置

API密钥: https://aistudio.google.com/apikey 环境变量: GOOGLE_AI_API_KEY 安装: pip install google-genai pillow python-dotenv

基本用法

import os
from google import genai

client = genai.Client(api_key=os.environ.get("GOOGLE_AI_API_KEY"))

response = client.models.generate_content(
    model="gemini-2.5-flash-image",  # 快速
    # model="gemini-3-pro-image-preview",  # 高质量
    contents=["您的图像提示在这里"]
)

# 从响应中提取并保存图像
for part in response.candidates[0].content.parts:
    if hasattr(part, 'inline_data') and part.inline_data:
        with open("output.png", "wb") as f:
            f.write(part.inline_data.data)

模型

模型 速度 质量 使用场景
gemini-2.5-flash-image 快速(约5秒) 良好 草稿、迭代
gemini-3-pro-image-preview 较慢(约15秒) 优秀 最终资产

使用场景

  • 社交媒体图形
  • 营销材料
  • 信息图表
  • Reddit/Discord横幅
  • 演示文稿幻灯片
  • 制造仪表板(OEE仪表、SPC图表)

高级:制造仪表板示例

prompt = """
创建一个专业的制造OEE仪表板,显示:
- 大型OEE仪表,显示85%(绿色区域)
- 下方三个较小的KPI卡片:
  - 可用性:92%
  - 性能:88%
  - 质量:99.2%
- 深色主题,带有蓝色/青色点缀
- 现代、行政风格设计
"""

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=[prompt]
)

PPTX图像压缩

当嵌入到PowerPoint中时,压缩图像以避免静默失败:

from PIL import Image
import io

def compress_image(data: bytes, max_size_kb: int = 200) -> bytes:
    img = Image.open(io.BytesIO(data))
    img = img.convert('RGB')
    img.thumbnail((1280, 720))

    buffer = io.BytesIO()
    img.save(buffer, format='JPEG', quality=75, optimize=True)
    return buffer.getvalue()

实际应用

fabrikIQ.com,Gemini图像生成支持:

  • PPTX导出中的AI生成OEE仪表板视觉效果
  • 执行制造报告的英雄图像
  • LinkedIn帖子的营销材料