解释视频制作指南Skill explainer-video-guide

这个技能提供了使用inference.sh命令行工具制作解释视频的完整指南,涵盖从脚本撰写、语音生成、视觉制作到视频组装的各个环节。它包括多种脚本公式如PAS和BAB,节奏控制规则,场景类型规划,以及使用AI工具生成语音、视觉和背景音乐的技巧。适用于产品演示、教程视频、社交解释视频等多种场景,帮助用户高效创建专业视频内容。关键词:解释视频制作、视频脚本、语音合成、视觉动画、视频组装、inference.sh、AIGC、视频生产流水线。

影视后期 1 次安装 4 次浏览 更新于 3/12/2026

名称: 解释视频指南 描述: “解释视频制作指南:脚本撰写、语音旁白、视觉制作、视频组装。涵盖脚本公式、节奏规则、场景规划、多工具流水线。适用于:产品演示、工作原理视频、入门视频、社交解释视频。触发词:解释视频、如何制作解释视频、产品视频、演示视频、视频制作、视频脚本、动画解释视频、产品演示视频、教程视频、入门视频、逐步指导视频、视频流水线” 允许工具: Bash(infsh *)

解释视频指南

通过 inference.sh CLI 从脚本到最终剪辑创建解释视频。

快速开始

curl -fsSL https://cli.inference.sh | sh && infsh login

# 为解释视频生成一个场景
infsh app run google/veo-3-1-fast --input '{
  "prompt": "简洁运动图形风格动画,抽象数据在连接节点间流动,蓝白色系,专业企业美学,平滑过渡"
}'

安装说明: 安装脚本 仅检测您的操作系统/架构,从 dist.inference.sh 下载匹配的二进制文件,并验证其 SHA-256 校验和。无需提升权限或后台进程。手动安装与验证 可用。

脚本公式

问题-煽动-解决 (PAS) — 60 秒

部分 时长 内容 字数
问题 10s 陈述观众面临的痛点 ~25 词
煽动 10s 展示为什么比想象中更糟 ~25 词
解决方案 15s 介绍您的产品/想法 ~35 词
工作原理 20s 展示 3 个关键步骤或功能 ~50 词
行动号召 5s 一个清晰的下一步行动 ~12 词

之前-之后-桥梁 (BAB) — 90 秒

部分 时长 内容
之前 15s 展示当前令人沮丧的状态
之后 15s 展示理想结果
桥梁 40s 解释您的产品如何带他们到达那里
社交证明 10s 快速统计或推荐
行动号召 10s 清晰的下一步

功能聚焦 — 30 秒(社交)

部分 时长 内容
钩子 3s 令人惊讶的事实或问题
功能 15s 展示解决一个问题的功能
结果 7s 结果/益处
行动号召 5s 尝试 / 了解更多

节奏规则

内容类型 每分钟字数 备注
标准旁白 150 wpm 对话式节奏
复杂/技术 120 wpm 允许处理时间
精力充沛/社交 170 wpm 快节奏用于短视频
儿童内容 100 wpm 清晰且慢

关键规则: 每个关键消息一个场景。不要在一个视觉中塞入多个想法。

场景时长指南

  • 建立镜头:3-5 秒
  • 功能演示:5-8 秒
  • 屏幕文字/统计:3-4 秒(必须可读)
  • 过渡:0.5-1 秒
  • 行动号召屏幕:3-5 秒

视觉制作

场景类型

# 产品在上下文中
infsh app run google/veo-3-1-fast --input '{
  "prompt": "干净产品演示视频,手在笔记本电脑上打字显示仪表板界面,明亮现代办公室,柔和自然光线,专业"
}'

# 抽象概念可视化
infsh app run bytedance/seedance-1-5-pro --input '{
  "prompt": "抽象运动图形,多彩数据流连接漂浮几何形状,平滑流体动画,深色背景带发光元素,科技美学"
}'

# 生活方式/结果镜头
infsh app run google/veo-3-1-fast --input '{
  "prompt": "快乐的人放松在沙发上使用笔记本电脑,微笑看着屏幕,明亮通风客厅,温暖午后光线,满意客户感觉,生活方式广告风格"
}'

# 之前/之后对比
infsh app run falai/flux-dev-lora --input '{
  "prompt": "分屏对比,左侧杂乱混乱桌子带文件和压力,右侧干净整齐极简工作空间,戏剧性差异,干净设计"
}'

图像转视频场景

# 先生成静帧
infsh app run falai/flux-dev-lora --input '{
  "prompt": "专业工作空间带发光全息界面,未来感但干净,蓝色强调光线"
}'

# 使其动画化
infsh app run falai/wan-2-5-i2v --input '{
  "prompt": "轻柔相机推进,全息元素轻微漂浮旋转,柔和环境光线变化",
  "image": "path/to/workspace-still.png"
}'

语音旁白制作

脚本撰写技巧

  • 短句子。每句最多 15 个词。
  • 主动语态。“您可以跟踪数据”,而不是“您的数据可以被跟踪。”
  • 对话式语调。大声读出来——如果听起来僵硬,重写。
  • 每句一个想法。每个视觉节拍一个句子。

生成语音旁白

# 使用 Dia TTS 的专业旁白
infsh app run falai/dia-tts --input '{
  "prompt": "[S1] 厌倦了花几个小时在没人读的报告上?有更好的方法。认识 DataFlow。它将原始数据变成视觉故事... 在几秒钟内。只需连接源,选择模板,并分享。今天免费试用 DataFlow。"
}'

TTS 中的节奏控制

技巧 效果 示例
句号 . 中等停顿 “这改变一切。这是如何。”
省略号 ... 长停顿(戏剧性) “而结果… 是难以置信的。”
逗号 , 短停顿 “快速,简单,强大。”
感叹号 ! 强调/精力 “今天开始构建!”
问号 ? 上升语调 “如果有更好的方法呢?”

音乐与音频

背景音乐指南

  • 音量: 比旁白低 20-30%(当语音播放时减少 6-12dB)
  • 风格: 匹配品牌基调(企业=环境电子,初创=欢快独立)
  • 结构: 介绍渐强(前 3 秒)-> 旁白下低调循环 -> 行动号召时渐强
  • 无歌词: 旁白下仅器乐
# 生成背景音乐
infsh app run <music-gen-app> --input '{
  "prompt": "欢快企业背景音乐,现代电子,90 BPM,正面专业,无歌词,适合产品解释视频"
}'

组装流水线

完整生产工作流

# 1. 生成语音旁白
infsh app run falai/dia-tts --input '{
  "prompt": "[S1] 您的脚本这里..."
}'

# 2. 生成场景视觉(并行)
infsh app run google/veo-3-1-fast --input '{"prompt": "场景 1 描述"}' --no-wait
infsh app run google/veo-3-1-fast --input '{"prompt": "场景 2 描述"}' --no-wait
infsh app run google/veo-3-1-fast --input '{"prompt": "场景 3 描述"}' --no-wait

# 3. 合并场景为序列
infsh app run infsh/media-merger --input '{
  "media": ["scene1.mp4", "scene2.mp4", "scene3.mp4"]
}'

# 4. 添加语音旁白到视频
infsh app run infsh/video-audio-merger --input '{
  "video": "merged-scenes.mp4",
  "audio": "voiceover.mp3"
}'

# 5. 添加字幕
infsh app run infsh/caption-videos --input '{
  "video": "final-with-audio.mp4",
  "caption_file": "captions.srt"
}'

视频长度按格式

格式 长度 平台
社交预告 15-30s TikTok,Instagram Reels,YouTube Shorts
产品演示 60-90s 网站,着陆页
功能解释 90-120s YouTube,电子邮件
教程/逐步指导 2-5 分钟 YouTube,帮助中心
投资者推介视频 2-3 分钟 推介演示补充

过渡类型

过渡 何时使用 效果
剪切 相关场景间默认 干净,专业
溶解/交叉淡入淡出 时间流逝,情绪转变 柔和,沉思
划像 新主题或部分 清晰分离
缩放/推进 深入细节 聚焦注意力
匹配剪切 场景间视觉相似性 聪明,难忘

常见错误

错误 问题 修复
脚本太冗长 旁白急促,观众不知所措 减少到最多 150 wpm
前 3 秒无钩子 观众立即离开 以问题或令人惊讶的统计开始
视觉滞后旁白 混淆断开 视觉应匹配或略提前于词语
背景音乐太大声 听不见旁白 降低音乐比语音少 6-12dB
无字幕 85% 社交视频无声观看 始终添加字幕
太多想法 观众什么也记不住 每个视频一个核心消息

相关技能

npx skills add inference-sh/skills@ai-video-generation
npx skills add inference-sh/skills@video-prompting-guide
npx skills add inference-sh/skills@text-to-speech
npx skills add inference-sh/skills@prompt-engineering

浏览所有应用:infsh app list