计算机视觉 Skill技能列表
FiftyOne数据集推理工具Skill fiftyone-dataset-inference
FiftyOne数据集推理工具是一个用于计算机视觉任务的端到端解决方案,支持从本地目录创建数据集、导入COCO/YOLO/VOC等标准格式标签、运行深度学习模型推理并存储预测结果。该工具提供完整的ML管道,适用于目标检测、图像分类、语义分割等计算机视觉应用,帮助用户高效管理视觉数据集和模型评估。
背景移除Skill background-removal
这个技能利用BiRefNet AI模型通过inference.sh命令行工具高效移除图像背景,支持产品照片、肖像等多种图像类型,生成透明PNG,适用于电商、营销和设计场景,关键词包括背景移除、图像编辑、AI模型、inference.sh、透明PNG。
高级计算机视觉专家Skill senior-computer-vision
高级计算机视觉专家技能专注于构建和部署生产级视觉AI系统,涵盖图像/视频处理、目标检测、语义分割、3D视觉、实时推理等核心领域。专家精通PyTorch、OpenCV、YOLO、SAM、扩散模型及视觉Transformer等前沿技术栈,擅长设计可扩展的MLOps架构、优化模型性能与部署流程,并确保系统的高可用性、安全合规与成本效益。适用于自动驾驶、安防监控、工业质检、医疗影像、内容生成等场景的AI解决方案开发。 关键词:计算机视觉,目标检测,图像分割,PyTorch,OpenCV,YOLO,SAM,扩散模型,视觉Transformer,AI模型部署,MLOps,实时推理,3D视觉,视频分析,生产级AI系统
OCR文档转换器Skill ocr
OCR文档转换器是一款基于Claude vision技术的智能文件处理工具,专门用于将PDF和图像文件通过OCR光学字符识别转换为可编辑的Markdown格式。支持批量处理、并行转换、自定义提取指令,具备智能表格识别、代码提取、多语言翻译等功能。适用于文档数字化、数据提取、内容归档等场景。关键词:OCR识别、PDF转换、图像转文本、Markdown生成、文档数字化、批量处理、智能提取、表格识别、代码提取、多格式支持。
OCRwithTesseractSkill OCRwithTesseract
使用Tesseract OCR引擎和Python进行光学字符识别(OCR)的综合指南,包括安装、基本用法、多语言支持、图像预处理、OCR配置优化、后处理等。
多模态分析技能Skill multimodal-analysis
多模态分析技能是一种高级人工智能能力,专门用于解读和分析包含视觉元素的复杂媒体文件。该技能能够从PDF文档、图像、技术图表、数据可视化、UI界面等多种格式中,提取结构化信息、理解视觉上下文、识别模式关系,并提供超越简单文本提取的深度见解。核心功能包括文档内容提取、图表解读、数据可视化分析、表格信息抽取和视觉内容理解,适用于文档处理、图像识别、数据分析、技术解读等多种场景。
FiftyOne插件开发Skill fiftyone-develop-plugin
FiftyOne插件开发技能,提供从零开始创建自定义FiftyOne插件的完整指导。涵盖操作符和面板开发、外部API集成、插件测试与迭代。适用于计算机视觉、数据可视化、AI数据管理领域的开发者。关键词:FiftyOne插件开发、计算机视觉工具、数据标注平台、自定义操作符、交互式面板、Python插件、JavaScript面板、Voxel51、AI数据管理、机器学习工作流。
UniversalDatasetImportforFiftyOneSkill fiftyone-dataset-import
FiftyOne数据集导入技能,支持所有媒体类型和标签格式,自动检测和处理多模态数据集,适用于自动驾驶和3D场景数据。
图像增强器Skill image-enhancer
图像增强器技能用于自动提升图像质量,特别擅长处理截图,通过智能算法增强分辨率、锐化细节、减少噪点,适用于博客、文档、社交媒体、演示等多种场景。关键词:图像处理、截图增强、分辨率提升、锐化技术、图像优化工具。
视觉分析师Skill vision
这是一个基于大模型的视觉分析技能,专门用于解读和分析各类图像内容。核心功能包括:识别图像中的UI元素、提取文本信息、解析图表结构、分析布局设计、诊断错误截图。适用于软件开发截图分析、架构图理解、UI设计稿评审、错误排查等场景。关键词:视觉分析,图像识别,UI分析,图表解析,错误诊断,截图解读,AI视觉助手。
数字病理学全幻灯片图像处理技能Skill histolab
Histolab是一个用于数字病理学的Python库,专为全幻灯片图像(WSI)的组织检测、瓦片提取和预处理设计,支持自动化组织分割、多种瓦片提取策略(随机、网格、评分)和图像过滤,适用于深度学习管道、数据集准备和医学图像分析。关键词:数字病理学、WSI、组织检测、瓦片提取、预处理、Python库、深度学习、医学图像、计算机视觉、H&E染色。
图像增强器Skill image-enhancer
这个技能用于自动提升图像质量,通过增强分辨率、锐度和清晰度,特别适用于截图处理。关键词:图像增强、分辨率提升、清晰度改善、截图优化、AI图像处理。