名称: OpenAI自动化 描述: “自动化OpenAI API操作 – 支持多模态和结构化输出生成响应、创建嵌入、生成图像,以及通过Composio MCP集成列出模型。” 要求: mcp: - rube
OpenAI自动化
自动化您的OpenAI API工作流程 – 使用响应API生成文本(包括多模态图像+文本输入和结构化JSON输出)、为搜索和聚类创建嵌入、使用DALL-E和GPT图像模型生成图像,以及列出可用模型。
工具包文档: composio.dev/toolkits/openai
设置
- 将Composio MCP服务器添加到您的客户端:
https://rube.app/mcp - 在提示时连接您的OpenAI账户(API密钥认证)
- 开始使用以下工作流程
核心工作流程
1. 生成响应(文本、多模态、结构化)
使用OPENAI_CREATE_RESPONSE进行一次性模型响应,包括文本、图像分析、OCR和结构化JSON输出。
工具: OPENAI_CREATE_RESPONSE
输入:
- model: 字符串(必需) -- 例如,"gpt-5"、"gpt-4o"、"o3-mini"
- input: 字符串 | 数组(必需)
简单: "解释量子计算"
多模态: [
{ role: "user", content: [
{ type: "input_text", text: "这张图片里有什么?" },
{ type: "input_image", image_url: { url: "https://..." } }
]}
]
- temperature: 数字(0-2,可选 -- 不支持推理模型)
- max_output_tokens: 整数(可选)
- reasoning: { effort: "none" | "minimal" | "low" | "medium" | "high" }
- text: 对象(结构化输出配置)
- format: { type: "json_schema", name: "...", schema: {...}, strict: true }
- tools: 数组(函数、代码解释器、文件搜索、网络搜索)
- tool_choice: "auto" | "none" | "required" | { type: "function", function: { name: "..." } }
- store: 布尔值(false以选择退出模型蒸馏)
- stream: 布尔值
结构化输出示例: 将text.format设置为{ type: "json_schema", name: "person", schema: { type: "object", properties: { name: { type: "string" }, age: { type: "integer" } }, required: ["name", "age"], additionalProperties: false }, strict: true }。
2. 创建嵌入
使用OPENAI_CREATE_EMBEDDINGS进行向量搜索、聚类、推荐和RAG管道。
工具: OPENAI_CREATE_EMBEDDINGS
输入:
- input: 字符串 | 字符串[] | 整数[] | 整数[][](必需) -- 最大8192个令牌,最大2048个项目
- model: 字符串(必需) -- "text-embedding-3-small"、"text-embedding-3-large"、"text-embedding-ada-002"
- dimensions: 整数(可选,仅适用于text-embedding-3及更高版本)
- encoding_format: "float" | "base64"(默认"float")
- user: 字符串(可选,终端用户ID用于滥用监控)
3. 生成图像
使用OPENAI_CREATE_IMAGE通过文本提示使用GPT图像或DALL-E模型创建图像。
工具: OPENAI_CREATE_IMAGE
输入:
- model: 字符串(必需) -- "gpt-image-1"、"gpt-image-1.5"、"dall-e-3"、"dall-e-2"
- prompt: 字符串(必需) -- 最大32000字符(GPT图像)、4000(DALL-E 3)、1000(DALL-E 2)
- size: "1024x1024" | "1536x1024" | "1024x1536" | "auto" | "256x256" | "512x512" | "1792x1024" | "1024x1792"
- quality: "standard" | "hd" | "auto" | "high" | "medium" | "low"
- n: 整数(1-10;DALL-E 3仅支持n=1)
- background: "transparent" | "opaque" | "auto"(仅限GPT图像模型)
- style: "vivid" | "natural"(仅限DALL-E 3)
- user: 字符串(可选)
4. 列出可用模型
使用OPENAI_LIST_MODELS发现您的API密钥可访问的模型。
工具: OPENAI_LIST_MODELS
输入: (无)
已知缺陷
| 缺陷 | 详情 |
|---|---|
| DALL-E弃用 | DALL-E 2和DALL-E 3已弃用,将在2026年5月12日停止支持。请优先使用GPT图像模型。 |
| DALL-E 3仅支持单图像 | OPENAI_CREATE_IMAGE与DALL-E 3仅支持n=1。使用GPT图像模型或DALL-E 2生成多个图像。 |
| 嵌入的令牌限制 | 输入每项不得超过8192个令牌,每批不得超过2048个项目。 |
| 推理模型限制 | temperature和top_p不支持推理模型(如o3-mini等)。请使用reasoning.effort。 |
| 结构化输出严格模式 | 当json_schema格式中strict: true时,所有模式属性必须列在required数组中。 |
| 提示长度因模型而异 | 图像提示最大长度不同:32000(GPT图像)、4000(DALL-E 3)、1000(DALL-E 2)。 |
快速参考
| 工具标识 | 描述 |
|---|---|
OPENAI_CREATE_RESPONSE |
生成文本/多模态响应,支持结构化输出 |
OPENAI_CREATE_EMBEDDINGS |
为搜索、聚类和RAG创建文本嵌入 |
OPENAI_CREATE_IMAGE |
从文本提示生成图像 |
OPENAI_LIST_MODELS |
列出您的API密钥可用的所有模型 |
由Composio提供支持