name: ai-models description: 最新AI模型参考 - Claude, OpenAI, Gemini, Eleven Labs, Replicate
AI模型参考技能
载入: base.md + llm-patterns.md
最后更新: 2025年12月
哲学
根据工作选择合适的模型。 大的并不总是更好的 - 根据任务需求匹配模型能力。考虑成本、延迟和准确性的权衡。
模型选择矩阵
| 任务 | 推荐 | 为什么 |
|---|---|---|
| 复杂推理 | Claude Opus 4.5, o3, Gemini 3 Pro | 最高准确度 |
| 快速聊天/完成 | Claude Haiku, GPT-4.1 mini, Gemini Flash | 低延迟,便宜 |
| 代码生成 | Claude Sonnet 4.5, Codestral, GPT-4.1 | 强大的编码能力 |
| 视觉/图像 | Claude Sonnet, GPT-4o, Gemini 3 Pro | 多模态 |
| 嵌入 | text-embedding-3-small, Voyage | 成本效益 |
| 语音合成 | Eleven Labs v3, OpenAI TTS | 自然的声音 |
| 图像生成 | FLUX.2, DALL-E 3, SD 3.5 | 不同的风格 |
Anthropic (Claude)
文档
- API文档: https://docs.anthropic.com
- 模型概览: https://docs.anthropic.com/en/docs/about-claude/models/overview
- 定价: https://www.anthropic.com/pricing
最新模型 (2025年12月)
const CLAUDE_MODELS = {
// 旗舰 - 最高能力
opus: 'claude-opus-4-5-20251101',
// 平衡 - 最适合大多数任务
sonnet: 'claude-sonnet-4-5-20250929',
// 上一代(仍然优秀)
opus4: 'claude-opus-4-20250514',
sonnet4: 'claude-sonnet-4-20250514',
// 快速 & 便宜 - 大量任务
haiku: 'claude-haiku-3-5-20241022',
} as const;
使用
import Anthropic from '@anthropic-ai/sdk';
const anthropic = new Anthropic({
apiKey: process.env.ANTHROPIC_API_KEY,
});
const response = await anthropic.messages.create({
model: 'claude-sonnet-4-5-20250929',
max_tokens: 1024,
messages: [
{ role: 'user', content: 'Hello, Claude!' }
],
});
模型选择
claude-opus-4-5-20251101 (Opus 4.5)
├── 最适合: 复杂分析,研究,细腻写作
├── 上下文: 200K 令牌
├── 成本: $5/$25 每1M 令牌 (输入/输出)
└── 使用时: 最需要准确性时
claude-sonnet-4-5-20250929 (Sonnet 4.5)
├── 最适合: 代码,一般任务,平衡性能
├── 上下文: 200K 令牌
├── 成本: $3/$15 每1M 令牌
└── 使用时: 默认选择,适用于大多数应用
claude-haiku-3-5-20241022 (Haiku 3.5)
├── 最适合: 分类,提取,大量任务
├── 上下文: 200K 令牌
├── 成本: $0.25/$1.25 每1M 令牌
└── 使用时: 速度和成本最重要时
OpenAI
文档
- API文档: https://platform.openai.com/docs
- 模型: https://platform.openai.com/docs/models
- 定价: https://openai.com/pricing
最新模型 (2025年12月)
const OPENAI_MODELS = {
// GPT-5系列(最新)
gpt5: 'gpt-5.2',
gpt5Mini: 'gpt-5-mini',
// GPT-4.1系列(推荐大多数)
gpt41: 'gpt-4.1',
gpt41Mini: 'gpt-4.1-mini',
gpt41Nano: 'gpt-4.1-nano',
// 推理模型(o系列)
o3: 'o3',
o3Pro: 'o3-pro',
o4Mini: 'o4-mini',
// 遗留但仍然有用
gpt4o: 'gpt-4o', // 仍然支持音频
gpt4oMini: 'gpt-4o-mini',
// 嵌入
embeddingSmall: 'text-embedding-3-small',
embeddingLarge: 'text-embedding-3-large',
// 图像生成
dalle3: 'dall-e-3',
gptImage: 'gpt-image-1',
// 音频
tts: 'tts-1',
ttsHd: 'tts-1-hd',
whisper: 'whisper-1',
} as const;
使用
import OpenAI from 'openai';
const openai = new OpenAI({
apiKey: process.env.OPENAI_API_KEY,
});
// 聊天完成
const response = await openai.chat.completions.create({
model: 'gpt-4.1',
messages: [
{ role: 'user', content: 'Hello!' }
],
});
// 带视觉
const visionResponse = await openai.chat.completions.create({
model: 'gpt-4.1',
messages: [
{
role: 'user',
content: [
{ type: 'text', text: 'What is in this image?' },
{ type: 'image_url', image_url: { url: 'https://...' } },
],
},
],
});
// 嵌入
const embedding = await openai.embeddings.create({
model: 'text-embedding-3-small',
input: 'Your text here',
});
模型选择
o3 / o3-pro
├── 最适合: 数学,编码,复杂多步骤推理
├── 上下文: 200K 令牌
├── 成本: 高级定价
└── 使用时: 最难的问题,需要思维链
gpt-4.1
├── 最适合: 一般任务,编码,指令遵循
├── 上下文: 1M 令牌 (!)
├── 成本: 低于GPT-4o
└── 使用时: 默认选择,取代GPT-4o
gpt-4.1-mini / gpt-4.1-nano
├── 最适合: 大量,成本敏感
├── 上下文: 1M 令牌
├── 成本: 非常低
└── 使用时: 简单任务大规模
o4-mini
├── 最适合: 快速推理,低成本
├── 上下文: 200K 令牌
├── 成本: 预算推理
└── 使用时: 需要推理但成本意识
Google (Gemini)
文档
- API文档: https://ai.google.dev/docs
- 模型: https://ai.google.dev/gemini-api/docs/models/gemini
- 定价: https://ai.google.dev/pricing
最新模型 (2025年12月)
const GEMINI_MODELS = {
// Gemini 3 (最新)
gemini3Pro: 'gemini-3-pro-preview',
gemini3ProImage: 'gemini-3-pro-image-preview',
gemini3Flash: 'gemini-3-flash-preview',
// Gemini 2.5 (稳定)
gemini25Pro: 'gemini-2.5-pro',
gemini25Flash: 'gemini-2.5-flash',
gemini25FlashLite: 'gemini-2.5-flash-lite',
// 专业化
gemini25FlashTTS: 'gemini-2.5-flash-preview-tts',
gemini25FlashAudio: 'gemini-2.5-flash-native-audio-preview-12-2025',
// 上一代
gemini2Flash: 'gemini-2.0-flash',
} as const;
使用
import { GoogleGenerativeAI } from '@google/generative-ai';
const genAI = new GoogleGenerativeAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-2.5-flash' });
const result = await model.generateContent('Hello!');
const response = result.response.text();
// 带视觉
const visionModel = genAI.getGenerativeModel({ model: 'gemini-2.5-pro' });
const imagePart = {
inlineData: {
data: base64Image,
mimeType: 'image/jpeg',
},
};
const result = await visionModel.generateContent(['Describe this:', imagePart]);
模型选择
gemini-3-pro-preview
├── 最适合: "世界上最好的多模态模型"
├── 上下文: 2M 令牌
├── 成本: 高级
└── 使用时: 需要绝对最好的质量
gemini-2.5-pro
├── 最适合: 最先进的思考,复杂任务
├── 上下文: 2M 令牌
├── 成本: $1.25/$5 每1M 令牌
└── 使用时: 长上下文,复杂推理
gemini-2.5-flash
├── 最适合: 快速,平衡性能
├── 上下文: 1M 令牌
├── 成本: $0.075/$0.30 每1M 令牌
└── 使用时: 速度和成本重要
gemini-2.5-flash-lite
├── 最适合: 超快速,最低成本
├── 上下文: 1M 令牌
├── 成本: $0.04/$0.15 每1M 令牌
└── 使用时: 大量,简单任务
Eleven Labs (语音)
文档
- API文档: https://elevenlabs.io/docs
- 模型: https://elevenlabs.io/docs/models
- 定价: https://elevenlabs.io/pricing
最新模型 (2025年12月)
const ELEVENLABS_MODELS = {
// 最新 - 最高质量(alpha)
v3: 'eleven_v3',
// 生产就绪
multilingualV2: 'eleven_multilingual_v2',
turboV2_5: 'eleven_turbo_v2_5',
// 超低延迟
flashV2_5: 'eleven_flash_v2_5',
flashV2: 'eleven_flash_v2', // 仅限英语
} as const;
使用
import { ElevenLabsClient } from 'elevenlabs';
const elevenlabs = new ElevenLabsClient({
apiKey: process.env.ELEVENLABS_API_KEY,
});
// 文本到语音
const audio = await elevenlabs.textToSpeech.convert('voice-id', {
text: 'Hello, world!',
model_id: 'eleven_turbo_v2_5',
voice_settings: {
stability: 0.5,
similarity_boost: 0.75,
},
});
// 流式音频(实时)
const audioStream = await elevenlabs.textToSpeech.convertAsStream('voice-id', {
text: 'Streaming audio...',
model_id: 'eleven_flash_v2_5',
});
模型选择
eleven_v3 (Alpha)
├── 最适合: 最高质量,情感范围
├── 延迟: ~1s+ (不适合实时)
├── 语言: 74
└── 使用时: 质量高于速度,预渲染
eleven_turbo_v2_5
├── 最适合: 平衡质量和速度
├── 延迟: ~250-300ms
├── 语言: 32
└── 使用时: 合理延迟下的好质量
eleven_flash_v2_5
├── 最适合: 实时,会话AI
├── 延迟: <75ms
├── 语言: 32
└── 使用时: 现场语音代理,聊天机器人
Replicate
文档
- API文档: https://replicate.com/docs
- 模型: https://replicate.com/explore
- 定价: https://replicate.com/pricing
流行模型 (2025年12月)
const REPLICATE_MODELS = {
// FLUX.2 (最新 - 2025年11月)
flux2Pro: 'black-forest-labs/flux-2-pro',
flux2Flex: 'black-forest-labs/flux-2-flex',
flux2Dev: 'black-forest-labs/flux-2-dev',
// FLUX.1 (仍然优秀)
flux11Pro: 'black-forest-labs/flux-1.1-pro',
fluxKontext: 'black-forest-labs/flux-kontext', // 图像编辑
fluxSchnell: 'black-forest-labs/flux-schnell',
// 视频
stableVideo4D: 'stability-ai/sv4d-2.0',
// 音频
musicgen: 'meta/musicgen',
// LLMs (如果需要在主要提供商之外)
llama: 'meta/llama-3.2-90b-vision',
} as const;
使用
import Replicate from 'replicate';
const replicate = new Replicate({
auth: process.env.REPLICATE_API_TOKEN,
});
// 图像生成与FLUX.2
const output = await replicate.run('black-forest-labs/flux-2-pro', {
input: {
prompt: 'A serene mountain landscape at sunset',
aspect_ratio: '16:9',
output_format: 'webp',
},
});
// 图像编辑与Kontext
const edited = await replicate.run('black-forest-labs/flux-kontext', {
input: {
image: 'https://...',
prompt: 'Change the sky to sunset colors',
},
});
模型选择
flux-2-pro
├── 最适合: 最高质量,高达4MP
├── 速度: ~6s
├── 成本: $0.015 + 每百万像素
└── 使用时: 需要专业质量
flux-2-flex
├── 最适合: 精细细节,排版
├── 速度: ~22s
├── 成本: $0.06 每百万像素
└── 使用时: 需要精确控制
flux-2-dev (开源)
├── 最适合: 快速生成
├── 速度: ~2.5s
├── 成本: $0.012 每百万像素
└── 使用时: 速度优于质量
flux-kontext
├── 最适合: 文本图像编辑
├── 速度: 可变
├── 成本: 每次运行
└── 使用时: 编辑现有图像
Stability AI
文档
- API文档: https://platform.stability.ai/docs/api-reference
- 模型: https://stability.ai/stable-image
- 定价: https://platform.stability.ai/pricing
最新模型 (2025年12月)
const STABILITY_MODELS = {
// 图像生成
sd35Large: 'sd3.5-large',
sd35LargeTurbo: 'sd3.5-large-turbo',
sd3Medium: 'sd3-medium',
// 视频
sv4d: 'sv4d-2.0', // 稳定视频4D 2.0
// 上采样
upscale: 'esrgan-v1-x2plus',
} as const;
使用
const response = await fetch(
'https://api.stability.ai/v2beta/stable-image/generate/sd3',
{
method: 'POST',
headers: {
'Content-Type': 'application/json',
Authorization: `Bearer ${process.env.STABILITY_API_KEY}`,
},
body: JSON.stringify({
prompt: 'A futuristic city at night',
output_format: 'webp',
aspect_ratio: '16:9',
model: 'sd3.5-large',
}),
}
);
Mistral AI
文档
- API文档: https://docs.mistral.ai
- 模型: https://docs.mistral.ai/getting-started/models
- 定价: https://mistral.ai/technology/#pricing
最新模型 (2025年12月)
const MISTRAL_MODELS = {
// 旗舰
large: 'mistral-large-latest', // 指向2411
// 中等级别
medium: 'mistral-medium-2505', // 中等3
// 小型/快速
small: 'mistral-small-2506', // 小型3.2
// 代码专业化
codestral: 'codestral-2508',
devstral: 'devstral-medium-2507',
// 推理 (Magistral)
magistralMedium: 'magistral-medium-2507',
magistralSmall: 'magistral-small-2507',
// 音频
voxtral: 'voxtral-small-2507',
// OCR
ocr: 'mistral-ocr-2505',
} as const;
使用
import MistralClient from '@mistralai/mistralai';
const client = new MistralClient(process.env.MISTRAL_API_KEY);
const response = await client.chat({
model: 'mistral-large-latest',
messages: [{ role: 'user', content: 'Hello!' }],
});
// 代码完成与Codestral
const codeResponse = await client.chat({
model: 'codestral-2508',
messages: [{ role: 'user', content: 'Write a Python function to...' }],
});
模型选择
mistral-large-latest (123B 参数)
├── 最适合: 复杂推理,知识任务
├── 上下文: 128K 令牌
└── 使用时: 需要高能力
codestral-2508
├── 最适合: 代码生成,80+ 语言
├── 速度: 比前代快2.5倍
└── 使用时: 代码专注任务
magistral-medium-2507
├── 最适合: 多步骤推理
├── 专业: 透明的思维链
└── 使用时: 需要推理痕迹
Voyage AI (嵌入)
文档
- API文档: https://docs.voyageai.com
- 模型: https://docs.voyageai.com/docs/embeddings
- 定价: https://www.voyageai.com/pricing
最新模型 (2025年12月)
const VOYAGE_MODELS = {
// 通用
large2: 'voyage-large-2',
large2Instruct: 'voyage-large-2-instruct',
// 代码专业化
code2: 'voyage-code-2',
code3: 'voyage-code-3',
// 多语言
multilingual2: 'voyage-multilingual-2',
// 领域特定
law2: 'voyage-law-2',
finance2: 'voyage-finance-2',
} as const;
使用
const response = await fetch('https://api.voyageai.com/v1/embeddings', {
method: 'POST',
headers: {
'Content-Type': 'application/json',
Authorization: `Bearer ${process.env.VOYAGE_API_KEY}`,
},
body: JSON.stringify({
model: 'voyage-code-3',
input: ['Your code to embed'],
}),
});
const { data } = await response.json();
const embedding = data[0].embedding;
快速参考
成本比较 (每1M令牌,近似)
| 提供商 | 便宜 | 中等 | 高级 |
|---|---|---|---|
| Anthropic | $0.25 (Haiku) | $3 (Sonnet 4.5) | $5 (Opus 4.5) |
| OpenAI | $0.15 (4.1-nano) | $2 (4.1) | $15+ (o3) |
| $0.04 (Flash-lite) | $0.08 (Flash) | $1.25 (Pro) | |
| Mistral | $0.25 (Small) | $2.70 (Medium) | $8 (Large) |
每个任务的最佳选择
推理/分析 → Claude Opus 4.5, o3, Gemini 3 Pro
代码生成 → Claude Sonnet 4.5, Codestral 2508, GPT-4.1
快速响应 → Claude Haiku, GPT-4.1-mini, Gemini Flash
长上下文 → Gemini 2.5 Pro (2M), GPT-4.1 (1M), Claude (200K)
视觉 → GPT-4.1, Claude Sonnet, Gemini 3 Pro
嵌入 → Voyage code-3, text-embedding-3-small
语音合成 → Eleven Labs v3/flash, OpenAI TTS
图像生成 → FLUX.2 Pro, DALL-E 3, SD 3.5
视频生成 → 稳定视频4D 2.0, Runway
图像编辑 → FLUX Kontext, gpt-image-1
环境变量模板
# .env.example (NEVER 提交实际密钥)
# LLMs
ANTHROPIC_API_KEY=sk-ant-...
OPENAI_API_KEY=sk-...
GOOGLE_API_KEY=AI...
MISTRAL_API_KEY=...
# 媒体
ELEVENLABS_API_KEY=...
REPLICATE_API_TOKEN=r8_...
STABILITY_API_KEY=sk-...
# 嵌入
VOYAGE_API_KEY=pa-...
模型更新检查表
当模型更新时:
□ 检查官方更新日志/博客
□ 更新模型ID字符串
□ 用现有提示测试
□ 比较输出质量
□ 检查定价变化
□ 如有更改,更新上下文限制