OpenAI自动化Skill OpenAIAutomation

OpenAI自动化技能用于自动化OpenAI API操作,支持生成多模态和结构化输出响应、创建文本嵌入、生成图像以及列出可用模型。适用于AI应用开发、RAG应用、大模型集成和自动化工作流,关键词:OpenAI API, 自动化, 多模态响应, 结构化输出, 文本嵌入, 图像生成, AI工作流, RAG应用, 大模型微调。

AI应用 0 次安装 0 次浏览 更新于 3/12/2026

名称: OpenAI自动化 描述: “自动化OpenAI API操作 – 支持多模态和结构化输出生成响应、创建嵌入、生成图像,以及通过Composio MCP集成列出模型。” 要求: mcp: - rube

OpenAI自动化

自动化您的OpenAI API工作流程 – 使用响应API生成文本(包括多模态图像+文本输入和结构化JSON输出)、为搜索和聚类创建嵌入、使用DALL-E和GPT图像模型生成图像,以及列出可用模型。

工具包文档: composio.dev/toolkits/openai


设置

  1. 将Composio MCP服务器添加到您的客户端:https://rube.app/mcp
  2. 在提示时连接您的OpenAI账户(API密钥认证)
  3. 开始使用以下工作流程

核心工作流程

1. 生成响应(文本、多模态、结构化)

使用OPENAI_CREATE_RESPONSE进行一次性模型响应,包括文本、图像分析、OCR和结构化JSON输出。

工具: OPENAI_CREATE_RESPONSE
输入:
  - model: 字符串(必需) -- 例如,"gpt-5"、"gpt-4o"、"o3-mini"
  - input: 字符串 | 数组(必需)
    简单: "解释量子计算"
    多模态: [
      { role: "user", content: [
        { type: "input_text", text: "这张图片里有什么?" },
        { type: "input_image", image_url: { url: "https://..." } }
      ]}
    ]
  - temperature: 数字(0-2,可选 -- 不支持推理模型)
  - max_output_tokens: 整数(可选)
  - reasoning: { effort: "none" | "minimal" | "low" | "medium" | "high" }
  - text: 对象(结构化输出配置)
    - format: { type: "json_schema", name: "...", schema: {...}, strict: true }
  - tools: 数组(函数、代码解释器、文件搜索、网络搜索)
  - tool_choice: "auto" | "none" | "required" | { type: "function", function: { name: "..." } }
  - store: 布尔值(false以选择退出模型蒸馏)
  - stream: 布尔值

结构化输出示例:text.format设置为{ type: "json_schema", name: "person", schema: { type: "object", properties: { name: { type: "string" }, age: { type: "integer" } }, required: ["name", "age"], additionalProperties: false }, strict: true }

2. 创建嵌入

使用OPENAI_CREATE_EMBEDDINGS进行向量搜索、聚类、推荐和RAG管道。

工具: OPENAI_CREATE_EMBEDDINGS
输入:
  - input: 字符串 | 字符串[] | 整数[] | 整数[][](必需) -- 最大8192个令牌,最大2048个项目
  - model: 字符串(必需) -- "text-embedding-3-small"、"text-embedding-3-large"、"text-embedding-ada-002"
  - dimensions: 整数(可选,仅适用于text-embedding-3及更高版本)
  - encoding_format: "float" | "base64"(默认"float")
  - user: 字符串(可选,终端用户ID用于滥用监控)

3. 生成图像

使用OPENAI_CREATE_IMAGE通过文本提示使用GPT图像或DALL-E模型创建图像。

工具: OPENAI_CREATE_IMAGE
输入:
  - model: 字符串(必需) -- "gpt-image-1"、"gpt-image-1.5"、"dall-e-3"、"dall-e-2"
  - prompt: 字符串(必需) -- 最大32000字符(GPT图像)、4000(DALL-E 3)、1000(DALL-E 2)
  - size: "1024x1024" | "1536x1024" | "1024x1536" | "auto" | "256x256" | "512x512" | "1792x1024" | "1024x1792"
  - quality: "standard" | "hd" | "auto" | "high" | "medium" | "low"
  - n: 整数(1-10;DALL-E 3仅支持n=1)
  - background: "transparent" | "opaque" | "auto"(仅限GPT图像模型)
  - style: "vivid" | "natural"(仅限DALL-E 3)
  - user: 字符串(可选)

4. 列出可用模型

使用OPENAI_LIST_MODELS发现您的API密钥可访问的模型。

工具: OPENAI_LIST_MODELS
输入: (无)

已知缺陷

缺陷 详情
DALL-E弃用 DALL-E 2和DALL-E 3已弃用,将在2026年5月12日停止支持。请优先使用GPT图像模型。
DALL-E 3仅支持单图像 OPENAI_CREATE_IMAGE与DALL-E 3仅支持n=1。使用GPT图像模型或DALL-E 2生成多个图像。
嵌入的令牌限制 输入每项不得超过8192个令牌,每批不得超过2048个项目。
推理模型限制 temperaturetop_p不支持推理模型(如o3-mini等)。请使用reasoning.effort
结构化输出严格模式 当json_schema格式中strict: true时,所有模式属性必须列在required数组中。
提示长度因模型而异 图像提示最大长度不同:32000(GPT图像)、4000(DALL-E 3)、1000(DALL-E 2)。

快速参考

工具标识 描述
OPENAI_CREATE_RESPONSE 生成文本/多模态响应,支持结构化输出
OPENAI_CREATE_EMBEDDINGS 为搜索、聚类和RAG创建文本嵌入
OPENAI_CREATE_IMAGE 从文本提示生成图像
OPENAI_LIST_MODELS 列出您的API密钥可用的所有模型

Composio提供支持