name: media-processing description: 使用FFmpeg(视频/音频编码、转换、流媒体、过滤、硬件加速)、ImageMagick(图像处理、格式转换、批处理、效果、合成)和RMBG(AI驱动的背景移除)处理多媒体文件。当转换媒体格式、使用特定编解码器(H.264、H.265、VP9)编码视频、调整图像大小/裁剪、从图像中移除背景、从视频中提取音频、应用过滤器和效果、优化文件大小、创建流媒体清单(HLS/DASH)、生成缩略图、批处理图像、创建合成图像或实现媒体处理管道时使用。支持100多种格式、硬件加速(NVENC、QSV)和复杂过滤器图。 license: MIT
媒体处理技能
使用FFmpeg、ImageMagick和RMBG CLI工具处理视频、音频和图像。
工具选择
| 任务 | 工具 | 原因 |
|---|---|---|
| 视频编码/转换 | FFmpeg | 原生编解码器支持,流媒体 |
| 音频提取/转换 | FFmpeg | 直接流操作 |
| 图像调整大小/效果 | ImageMagick | 优化用于静态图像 |
| 背景移除 | RMBG | AI驱动,本地处理 |
| 批处理图像 | ImageMagick | mogrify用于原地编辑 |
| 视频缩略图 | FFmpeg | 内置帧提取 |
| GIF创建 | FFmpeg/ImageMagick | FFmpeg用于视频,ImageMagick用于图像 |
安装
# macOS
brew install ffmpeg imagemagick
npm install -g rmbg-cli
# Ubuntu/Debian
sudo apt-get install ffmpeg imagemagick
npm install -g rmbg-cli
# 验证
ffmpeg -version && magick -version && rmbg --version
基本命令
# 视频:转换/重新编码
ffmpeg -i input.mkv -c copy output.mp4
ffmpeg -i input.avi -c:v libx264 -crf 22 -c:a aac output.mp4
# 视频:提取音频
ffmpeg -i video.mp4 -vn -c:a copy audio.m4a
# 图像:转换/调整大小
magick input.png output.jpg
magick input.jpg -resize 800x600 output.jpg
# 图像:批处理调整大小
mogrify -resize 800x -quality 85 *.jpg
# 背景移除
rmbg input.jpg # 基本(modnet)
rmbg input.jpg -m briaai -o output.png # 高质量
rmbg input.jpg -m u2netp -o output.png # 快速
关键参数
FFmpeg:
-c:v libx264- H.264编解码器-crf 22- 质量(0-51,越低越好)-preset slow- 速度/压缩平衡-c:a aac- 音频编解码器
ImageMagick:
800x600- 适应范围内(保持宽高比)800x600^- 填充(可能裁剪)-quality 85- JPEG质量-strip- 移除元数据
RMBG:
-m briaai- 高质量模型-m u2netp- 快速模型-r 4096- 最大分辨率
参考
详细指南在references/中:
ffmpeg-encoding.md- 编解码器、质量、硬件加速ffmpeg-streaming.md- HLS/DASH、直播流ffmpeg-filters.md- 过滤器、复杂过滤器图imagemagick-editing.md- 效果、转换imagemagick-batch.md- 批处理、并行操作rmbg-background-removal.md- AI模型、CLI使用common-workflows.md- 视频优化、响应式图像、GIF创建troubleshooting.md- 错误修复、性能提示format-compatibility.md- 格式支持、编解码器推荐