AI视频生成Skill ai-video-generation

该技能通过 inference.sh CLI 提供 40 多种 AI 视频生成模型,包括文本到视频、图像到视频、唇同步、头像动画、视频放大和声音效果添加。适用于制作社交媒体视频、营销内容、解释视频、产品演示和 AI 头像。关键词:AI视频生成,文本到视频,图像到视频,Veo,唇同步,AI动画,视频生成工具。

AIGC 0 次安装 0 次浏览 更新于 3/12/2026

名称: ai-video-generation 描述: “通过 inference.sh CLI 使用 Google Veo、Seedance、Wan、Grok 和 40+ 模型生成 AI 视频。模型包括:Veo 3.1、Veo 3、Seedance 1.5 Pro、Wan 2.5、Grok Imagine Video、OmniHuman、Fabric、HunyuanVideo。功能:文本到视频、图像到视频、唇同步、头像动画、视频放大、声音效果。适用于:社交媒体视频、营销内容、解释视频、产品演示、AI 头像。触发词:视频生成、ai 视频、文本到视频、图像到视频、veo、动画图像、从图像生成视频、ai 动画、视频生成器、生成视频、t2v、i2v、ai 视频制作器、用 ai 创建视频、runway 替代、pika 替代、sora 替代、kling 替代” 允许工具: Bash(infsh *)

AI 视频生成

通过 inference.sh CLI 使用 40+ AI 模型生成视频。

AI 视频生成

快速开始

# 安装 CLI
curl -fsSL https://cli.inference.sh | sh && infsh login

# 使用 Veo 生成视频
infsh app run google/veo-3-1-fast --input '{"prompt": "drone shot flying over a forest"}'

安装说明: 安装脚本 仅检测您的操作系统/架构,从 dist.inference.sh 下载匹配的二进制文件,并验证其 SHA-256 校验和。无需提升权限或后台进程。手动安装和验证 可用。

可用模型

文本到视频

模型 应用 ID 最佳用途
Veo 3.1 快速 google/veo-3-1-fast 快速,可选音频
Veo 3.1 google/veo-3-1 最佳质量,帧插值
Veo 3 google/veo-3 高质量带音频
Veo 3 快速 google/veo-3-fast 快速带音频
Veo 2 google/veo-2 逼真视频
Grok 视频 xai/grok-imagine-video xAI,可配置时长
Seedance 1.5 Pro bytedance/seedance-1-5-pro 带首帧控制
Seedance 1.0 Pro bytedance/seedance-1-0-pro 最高 1080p

图像到视频

模型 应用 ID 最佳用途
Wan 2.5 falai/wan-2-5 动画任何图像
Wan 2.5 I2V falai/wan-2-5-i2v 高质量 i2v
Seedance Lite bytedance/seedance-1-0-lite 轻量级 720p

头像 / 唇同步

模型 应用 ID 最佳用途
OmniHuman 1.5 bytedance/omnihuman-1-5 多角色
OmniHuman 1.0 bytedance/omnihuman-1-0 单角色
Fabric 1.0 falai/fabric-1-0 带唇同步的图像讲话
PixVerse 唇同步 falai/pixverse-lipsync 逼真唇同步

实用工具

工具 应用 ID 描述
HunyuanVideo Foley infsh/hunyuanvideo-foley 为视频添加音效
Topaz 放大器 falai/topaz-video-upscaler 提升视频质量
媒体合并器 infsh/media-merger 合并视频带过渡效果

浏览所有视频应用

infsh app list --category video

示例

使用 Veo 进行文本到视频

infsh app run google/veo-3-1-fast --input '{
  "prompt": "A timelapse of a flower blooming in a garden"
}'

Grok 视频

infsh app run xai/grok-imagine-video --input '{
  "prompt": "Waves crashing on a beach at sunset",
  "duration": 5
}'

使用 Wan 2.5 进行图像到视频

infsh app run falai/wan-2-5 --input '{
  "image_url": "https://your-image.jpg"
}'

AI 头像 / 讲话头部

infsh app run bytedance/omnihuman-1-5 --input '{
  "image_url": "https://portrait.jpg",
  "audio_url": "https://speech.mp3"
}'

Fabric 唇同步

infsh app run falai/fabric-1-0 --input '{
  "image_url": "https://face.jpg",
  "audio_url": "https://audio.mp3"
}'

PixVerse 唇同步

infsh app run falai/pixverse-lipsync --input '{
  "image_url": "https://portrait.jpg",
  "audio_url": "https://speech.mp3"
}'

视频放大

infsh app run falai/topaz-video-upscaler --input '{"video_url": "https://..."}'

添加音效(Foley)

infsh app run infsh/hunyuanvideo-foley --input '{
  "video_url": "https://silent-video.mp4",
  "prompt": "footsteps on gravel, birds chirping"
}'

合并视频

infsh app run infsh/media-merger --input '{
  "videos": ["https://clip1.mp4", "https://clip2.mp4"],
  "transition": "fade"
}'

相关技能

# 完整平台技能(150+ 应用)
npx skills add inference-sh/skills@inference-sh

# Google Veo 特定
npx skills add inference-sh/skills@google-veo

# AI 头像和唇同步
npx skills add inference-sh/skills@ai-avatar-video

# 文本到语音(用于视频旁白)
npx skills add inference-sh/skills@text-to-speech

# 图像生成(用于图像到视频)
npx skills add inference-sh/skills@ai-image-generation

# Twitter(发布视频)
npx skills add inference-sh/skills@twitter-automation

浏览所有应用:infsh app list

文档