多媒体处理Skill media-processing

多媒体处理技能,使用FFmpeg、ImageMagick和RMBG工具进行视频、音频和图像的编码、转换、编辑和AI背景移除。适用于媒体格式转换、视频编码(如H.264、H.265)、图像处理(调整大小、效果)、批量操作、流媒体输出(HLS/DASH)和优化文件大小。关键词:多媒体处理、FFmpeg、ImageMagick、RMBG、视频编码、图像处理、背景移除、批量处理、流媒体。

其他 0 次安装 0 次浏览 更新于 3/15/2026

name: media-processing description: 使用FFmpeg(视频/音频编码、转换、流媒体、过滤、硬件加速)、ImageMagick(图像处理、格式转换、批处理、效果、合成)和RMBG(AI驱动的背景移除)处理多媒体文件。当转换媒体格式、使用特定编解码器(H.264、H.265、VP9)编码视频、调整图像大小/裁剪、从图像中移除背景、从视频中提取音频、应用过滤器和效果、优化文件大小、创建流媒体清单(HLS/DASH)、生成缩略图、批处理图像、创建合成图像或实现媒体处理管道时使用。支持100多种格式、硬件加速(NVENC、QSV)和复杂过滤器图。 license: MIT

媒体处理技能

使用FFmpeg、ImageMagick和RMBG CLI工具处理视频、音频和图像。

工具选择

任务 工具 原因
视频编码/转换 FFmpeg 原生编解码器支持,流媒体
音频提取/转换 FFmpeg 直接流操作
图像调整大小/效果 ImageMagick 优化用于静态图像
背景移除 RMBG AI驱动,本地处理
批处理图像 ImageMagick mogrify用于原地编辑
视频缩略图 FFmpeg 内置帧提取
GIF创建 FFmpeg/ImageMagick FFmpeg用于视频,ImageMagick用于图像

安装

# macOS
brew install ffmpeg imagemagick
npm install -g rmbg-cli

# Ubuntu/Debian
sudo apt-get install ffmpeg imagemagick
npm install -g rmbg-cli

# 验证
ffmpeg -version && magick -version && rmbg --version

基本命令

# 视频:转换/重新编码
ffmpeg -i input.mkv -c copy output.mp4
ffmpeg -i input.avi -c:v libx264 -crf 22 -c:a aac output.mp4

# 视频:提取音频
ffmpeg -i video.mp4 -vn -c:a copy audio.m4a

# 图像:转换/调整大小
magick input.png output.jpg
magick input.jpg -resize 800x600 output.jpg

# 图像:批处理调整大小
mogrify -resize 800x -quality 85 *.jpg

# 背景移除
rmbg input.jpg                          # 基本(modnet)
rmbg input.jpg -m briaai -o output.png  # 高质量
rmbg input.jpg -m u2netp -o output.png  # 快速

关键参数

FFmpeg:

  • -c:v libx264 - H.264编解码器
  • -crf 22 - 质量(0-51,越低越好)
  • -preset slow - 速度/压缩平衡
  • -c:a aac - 音频编解码器

ImageMagick:

  • 800x600 - 适应范围内(保持宽高比)
  • 800x600^ - 填充(可能裁剪)
  • -quality 85 - JPEG质量
  • -strip - 移除元数据

RMBG:

  • -m briaai - 高质量模型
  • -m u2netp - 快速模型
  • -r 4096 - 最大分辨率

参考

详细指南在references/中:

  • ffmpeg-encoding.md - 编解码器、质量、硬件加速
  • ffmpeg-streaming.md - HLS/DASH、直播流
  • ffmpeg-filters.md - 过滤器、复杂过滤器图
  • imagemagick-editing.md - 效果、转换
  • imagemagick-batch.md - 批处理、并行操作
  • rmbg-background-removal.md - AI模型、CLI使用
  • common-workflows.md - 视频优化、响应式图像、GIF创建
  • troubleshooting.md - 错误修复、性能提示
  • format-compatibility.md - 格式支持、编解码器推荐