OpenAIWhisper音频转录APISkill openai-whisper-api

这个技能利用OpenAI的Whisper模型,通过API实现音频文件的自动转录,支持多种音频格式和参数设置,关键词包括OpenAI Whisper、音频转录、语音转文本、API调用、curl脚本。

NLP 0 次安装 0 次浏览 更新于 3/24/2026

name: openai-whisper-api description: 通过OpenAI音频转录API(Whisper)转录音频。 homepage: https://platform.openai.com/docs/guides/speech-to-text metadata: { “otto”: { “emoji”: “☁️”, “requires”: { “bins”: [“curl”], “env”: [“OPENAI_API_KEY”] }, “primaryEnv”: “OPENAI_API_KEY”, }, }

OpenAI Whisper API (curl)

通过OpenAI的/v1/audio/transcriptions端点转录音频文件。

快速开始

{baseDir}/scripts/transcribe.sh /path/to/audio.m4a

默认值:

  • 模型:whisper-1
  • 输出:<input>.txt

有用的标志

{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --model whisper-1 --out /tmp/transcript.txt
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --language en
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --prompt "说话人姓名:Peter, Daniel"
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --json --out /tmp/transcript.json

API密钥

设置OPENAI_API_KEY,或在~/.otto/otto.json中配置:

{
  skills: {
    "openai-whisper-api": {
      apiKey: "OPENAI_KEY_HERE",
    },
  },
}