name: ai-models description: 最新AI模型参考 - Claude, OpenAI, Gemini, Eleven Labs, Replicate

AI模型参考技能

最后更新: 2025年12月

哲学

根据工作选择合适的模型。 大的并不总是更好的 - 根据任务需求匹配模型能力。考虑成本、延迟和准确性的权衡。

模型选择矩阵

任务	推荐	为什么
复杂推理	Claude Opus 4.5, o3, Gemini 3 Pro	最高准确度
快速聊天/完成	Claude Haiku, GPT-4.1 mini, Gemini Flash	低延迟，便宜
代码生成	Claude Sonnet 4.5, Codestral, GPT-4.1	强大的编码能力
视觉/图像	Claude Sonnet, GPT-4o, Gemini 3 Pro	多模态
嵌入	text-embedding-3-small, Voyage	成本效益
语音合成	Eleven Labs v3, OpenAI TTS	自然的声音
图像生成	FLUX.2, DALL-E 3, SD 3.5	不同的风格

Anthropic (Claude)

文档

API文档: https://docs.anthropic.com
模型概览: https://docs.anthropic.com/en/docs/about-claude/models/overview
定价: https://www.anthropic.com/pricing

使用

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Hello, Claude!' }
  ],
});

模型选择

claude-opus-4-5-20251101 (Opus 4.5)
├── 最适合: 复杂分析，研究，细腻写作
├── 上下文: 200K 令牌
├── 成本: $5/$25 每1M 令牌 (输入/输出)
└── 使用时: 最需要准确性时

claude-sonnet-4-5-20250929 (Sonnet 4.5)
├── 最适合: 代码，一般任务，平衡性能
├── 上下文: 200K 令牌
├── 成本: $3/$15 每1M 令牌
└── 使用时: 默认选择，适用于大多数应用

claude-haiku-3-5-20241022 (Haiku 3.5)
├── 最适合: 分类，提取，大量任务
├── 上下文: 200K 令牌
├── 成本: $0.25/$1.25 每1M 令牌
└── 使用时: 速度和成本最重要时

OpenAI

文档

API文档: https://platform.openai.com/docs
模型: https://platform.openai.com/docs/models
定价: https://openai.com/pricing

使用

import OpenAI from 'openai';

const openai = new OpenAI({
  apiKey: process.env.OPENAI_API_KEY,
});

// 聊天完成
const response = await openai.chat.completions.create({
  model: 'gpt-4.1',
  messages: [
    { role: 'user', content: 'Hello!' }
  ],
});

// 带视觉
const visionResponse = await openai.chat.completions.create({
  model: 'gpt-4.1',
  messages: [
    {
      role: 'user',
      content: [
        { type: 'text', text: 'What is in this image?' },
        { type: 'image_url', image_url: { url: 'https://...' } },
      ],
    },
  ],
});

// 嵌入
const embedding = await openai.embeddings.create({
  model: 'text-embedding-3-small',
  input: 'Your text here',
});

模型选择

o3 / o3-pro
├── 最适合: 数学，编码，复杂多步骤推理
├── 上下文: 200K 令牌
├── 成本: 高级定价
└── 使用时: 最难的问题，需要思维链

gpt-4.1
├── 最适合: 一般任务，编码，指令遵循
├── 上下文: 1M 令牌 (!)
├── 成本: 低于GPT-4o
└── 使用时: 默认选择，取代GPT-4o

gpt-4.1-mini / gpt-4.1-nano
├── 最适合: 大量，成本敏感
├── 上下文: 1M 令牌
├── 成本: 非常低
└── 使用时: 简单任务大规模

o4-mini
├── 最适合: 快速推理，低成本
├── 上下文: 200K 令牌
├── 成本: 预算推理
└── 使用时: 需要推理但成本意识

Google (Gemini)

文档

API文档: https://ai.google.dev/docs
模型: https://ai.google.dev/gemini-api/docs/models/gemini
定价: https://ai.google.dev/pricing

使用

import { GoogleGenerativeAI } from '@google/generative-ai';

const genAI = new GoogleGenerativeAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-2.5-flash' });

const result = await model.generateContent('Hello!');
const response = result.response.text();

// 带视觉
const visionModel = genAI.getGenerativeModel({ model: 'gemini-2.5-pro' });
const imagePart = {
  inlineData: {
    data: base64Image,
    mimeType: 'image/jpeg',
  },
};
const result = await visionModel.generateContent(['Describe this:', imagePart]);

模型选择

gemini-3-pro-preview
├── 最适合: "世界上最好的多模态模型"
├── 上下文: 2M 令牌
├── 成本: 高级
└── 使用时: 需要绝对最好的质量

gemini-2.5-pro
├── 最适合: 最先进的思考，复杂任务
├── 上下文: 2M 令牌
├── 成本: $1.25/$5 每1M 令牌
└── 使用时: 长上下文，复杂推理

gemini-2.5-flash
├── 最适合: 快速，平衡性能
├── 上下文: 1M 令牌
├── 成本: $0.075/$0.30 每1M 令牌
└── 使用时: 速度和成本重要

gemini-2.5-flash-lite
├── 最适合: 超快速，最低成本
├── 上下文: 1M 令牌
├── 成本: $0.04/$0.15 每1M 令牌
└── 使用时: 大量，简单任务

Eleven Labs (语音)

文档

使用

import { ElevenLabsClient } from 'elevenlabs';

const elevenlabs = new ElevenLabsClient({
  apiKey: process.env.ELEVENLABS_API_KEY,
});

// 文本到语音
const audio = await elevenlabs.textToSpeech.convert('voice-id', {
  text: 'Hello, world!',
  model_id: 'eleven_turbo_v2_5',
  voice_settings: {
    stability: 0.5,
    similarity_boost: 0.75,
  },
});

// 流式音频（实时）
const audioStream = await elevenlabs.textToSpeech.convertAsStream('voice-id', {
  text: 'Streaming audio...',
  model_id: 'eleven_flash_v2_5',
});

模型选择

eleven_v3 (Alpha)
├── 最适合: 最高质量，情感范围
├── 延迟: ~1s+ （不适合实时）
├── 语言: 74
└── 使用时: 质量高于速度，预渲染

eleven_turbo_v2_5
├── 最适合: 平衡质量和速度
├── 延迟: ~250-300ms
├── 语言: 32
└── 使用时: 合理延迟下的好质量

eleven_flash_v2_5
├── 最适合: 实时，会话AI
├── 延迟: <75ms
├── 语言: 32
└── 使用时: 现场语音代理，聊天机器人

Replicate

文档

流行模型 (2025年12月)

const REPLICATE_MODELS = {
  // FLUX.2 (最新 - 2025年11月)
  flux2Pro: 'black-forest-labs/flux-2-pro',
  flux2Flex: 'black-forest-labs/flux-2-flex',
  flux2Dev: 'black-forest-labs/flux-2-dev',

  // FLUX.1 (仍然优秀)
  flux11Pro: 'black-forest-labs/flux-1.1-pro',
  fluxKontext: 'black-forest-labs/flux-kontext', // 图像编辑
  fluxSchnell: 'black-forest-labs/flux-schnell',

  // 视频
  stableVideo4D: 'stability-ai/sv4d-2.0',

  // 音频
  musicgen: 'meta/musicgen',

  // LLMs （如果需要在主要提供商之外）
  llama: 'meta/llama-3.2-90b-vision',
} as const;

使用

import Replicate from 'replicate';

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

// 图像生成与FLUX.2
const output = await replicate.run('black-forest-labs/flux-2-pro', {
  input: {
    prompt: 'A serene mountain landscape at sunset',
    aspect_ratio: '16:9',
    output_format: 'webp',
  },
});

// 图像编辑与Kontext
const edited = await replicate.run('black-forest-labs/flux-kontext', {
  input: {
    image: 'https://...',
    prompt: 'Change the sky to sunset colors',
  },
});

模型选择

flux-2-pro
├── 最适合: 最高质量，高达4MP
├── 速度: ~6s
├── 成本: $0.015 + 每百万像素
└── 使用时: 需要专业质量

flux-2-flex
├── 最适合: 精细细节，排版
├── 速度: ~22s
├── 成本: $0.06 每百万像素
└── 使用时: 需要精确控制

flux-2-dev (开源)
├── 最适合: 快速生成
├── 速度: ~2.5s
├── 成本: $0.012 每百万像素
└── 使用时: 速度优于质量

flux-kontext
├── 最适合: 文本图像编辑
├── 速度: 可变
├── 成本: 每次运行
└── 使用时: 编辑现有图像

Stability AI

文档

API文档: https://platform.stability.ai/docs/api-reference
模型: https://stability.ai/stable-image
定价: https://platform.stability.ai/pricing

使用

const response = await fetch(
  'https://api.stability.ai/v2beta/stable-image/generate/sd3',
  {
    method: 'POST',
    headers: {
      'Content-Type': 'application/json',
      Authorization: `Bearer ${process.env.STABILITY_API_KEY}`,
    },
    body: JSON.stringify({
      prompt: 'A futuristic city at night',
      output_format: 'webp',
      aspect_ratio: '16:9',
      model: 'sd3.5-large',
    }),
  }
);

Mistral AI

文档

API文档: https://docs.mistral.ai
模型: https://docs.mistral.ai/getting-started/models
定价: https://mistral.ai/technology/#pricing

使用

import MistralClient from '@mistralai/mistralai';

const client = new MistralClient(process.env.MISTRAL_API_KEY);

const response = await client.chat({
  model: 'mistral-large-latest',
  messages: [{ role: 'user', content: 'Hello!' }],
});

// 代码完成与Codestral
const codeResponse = await client.chat({
  model: 'codestral-2508',
  messages: [{ role: 'user', content: 'Write a Python function to...' }],
});

模型选择

mistral-large-latest (123B 参数)
├── 最适合: 复杂推理，知识任务
├── 上下文: 128K 令牌
└── 使用时: 需要高能力

codestral-2508
├── 最适合: 代码生成，80+ 语言
├── 速度: 比前代快2.5倍
└── 使用时: 代码专注任务

magistral-medium-2507
├── 最适合: 多步骤推理
├── 专业: 透明的思维链
└── 使用时: 需要推理痕迹

Voyage AI (嵌入)

文档

API文档: https://docs.voyageai.com
模型: https://docs.voyageai.com/docs/embeddings
定价: https://www.voyageai.com/pricing

使用

const response = await fetch('https://api.voyageai.com/v1/embeddings', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
    Authorization: `Bearer ${process.env.VOYAGE_API_KEY}`,
  },
  body: JSON.stringify({
    model: 'voyage-code-3',
    input: ['Your code to embed'],
  }),
});

const { data } = await response.json();
const embedding = data[0].embedding;

快速参考

成本比较 (每1M令牌，近似)

提供商	便宜	中等	高级
Anthropic	$0.25 (Haiku)	$3 (Sonnet 4.5)	$5 (Opus 4.5)
OpenAI	$0.15 (4.1-nano)	$2 (4.1)	$15+ (o3)
Google	$0.04 (Flash-lite)	$0.08 (Flash)	$1.25 (Pro)
Mistral	$0.25 (Small)	$2.70 (Medium)	$8 (Large)

每个任务的最佳选择

推理/分析    → Claude Opus 4.5, o3, Gemini 3 Pro
代码生成       → Claude Sonnet 4.5, Codestral 2508, GPT-4.1
快速响应        → Claude Haiku, GPT-4.1-mini, Gemini Flash
长上下文          → Gemini 2.5 Pro (2M), GPT-4.1 (1M), Claude (200K)
视觉                → GPT-4.1, Claude Sonnet, Gemini 3 Pro
嵌入            → Voyage code-3, text-embedding-3-small
语音合成       → Eleven Labs v3/flash, OpenAI TTS
图像生成      → FLUX.2 Pro, DALL-E 3, SD 3.5
视频生成      → 稳定视频4D 2.0, Runway
图像编辑         → FLUX Kontext, gpt-image-1

环境变量模板

# .env.example (NEVER 提交实际密钥)

# LLMs
ANTHROPIC_API_KEY=sk-ant-...
OPENAI_API_KEY=sk-...
GOOGLE_API_KEY=AI...
MISTRAL_API_KEY=...

# 媒体
ELEVENLABS_API_KEY=...
REPLICATE_API_TOKEN=r8_...
STABILITY_API_KEY=sk-...

# 嵌入
VOYAGE_API_KEY=pa-...

模型更新检查表

当模型更新时:
□ 检查官方更新日志/博客
□ 更新模型ID字符串
□ 用现有提示测试
□ 比较输出质量
□ 检查定价变化
□ 如有更改，更新上下文限制

name: ai-models description: 最新AI模型参考 - Claude, OpenAI, Gemini, Eleven Labs, Replicate

AI模型参考技能

哲学

模型选择矩阵

Anthropic (Claude)

文档

最新模型 (2025年12月)

使用

模型选择

OpenAI

文档

最新模型 (2025年12月)

使用

模型选择

Google (Gemini)

文档

最新模型 (2025年12月)

使用

模型选择

Eleven Labs (语音)

文档

最新模型 (2025年12月)

使用

模型选择

Replicate

文档

流行模型 (2025年12月)

使用

模型选择

Stability AI

文档

最新模型 (2025年12月)

使用

Mistral AI

文档

最新模型 (2025年12月)

使用

模型选择

Voyage AI (嵌入)

文档

最新模型 (2025年12月)

使用

快速参考

成本比较 (每1M令牌，近似)

每个任务的最佳选择

环境变量模板

模型更新检查表

来源