计算机视觉 Skill技能列表

4.5

OCR空间自动化Skill ocrspace-automation

这个技能用于通过Rube MCP自动化OCRspace操作,实现光学字符识别任务的自动化处理。关键词包括OCR、自动化、Rube MCP、Composio、工具发现、工作流管理、计算机视觉、数据处理。

4.5

GLM-4V图像分析工具Skill glm4v-analyze-image

GLM-4V图像分析工具是智谱AI开发的多模态视觉语言模型接口,专用于图像内容识别、视觉问答和细节分析。该工具能对上传的图片进行智能解读,包括物体识别、场景描述、OCR文字提取、情感氛围分析等,支持通过自然语言提示进行交互式图像分析。适用于内容审核、智能客服、教育辅助、数据标注等多种场景,为开发者提供强大的计算机视觉AI能力。关键词:GLM-4V,图像分析,视觉问答,多模态AI,计算机视觉,OCR识别,内容理解,AI图像识别。

4.5

OCRwithPaddleOCRSkill OCRwithPaddleOCR

PaddleOCR是一个强大的开源OCR工具包,支持多语言文本识别、表格识别和文档布局分析,适用于各种文档处理场景。

4.5

YOLO集成Skill YOLOIntegration

本技能提供使用Ultralytics库集成YOLO(You Only Look Once)对象检测模型的全面指南,涵盖YOLOv8和YOLOv9模型的加载、推理、自定义训练、对象检测、实例分割、姿态估计、实时推理、批处理、API集成、性能优化和生产部署。关键词:YOLO, 对象检测, Ultralytics, 计算机视觉, 深度学习, AI集成, 图像处理, 实时分析, 部署优化

4.5

计算机视觉技能Skill ComputerVisionSkill

计算机视觉技能是机器人视觉应用的核心技术,专注于相机标定、特征检测与跟踪、立体视觉和视觉伺服。该技能能够实现高精度的相机内参和外参标定,支持多种特征检测算法(如ORB、SIFT、SuperPoint)和光流跟踪技术(如Lucas-Kanade),并应用于视觉SLAM、物体检测、数字孪生等机器人流程。关键词:计算机视觉,机器人视觉,相机标定,特征检测,视觉跟踪,立体视觉,视觉伺服,OpenCV,SLAM,图像处理。

4.5

图像增强器Skill image-enhancer

图像增强器是一款AI工具,专注于提升图像质量,特别是截图。它能智能分析图像,进行分辨率放大、锐化处理、去噪降噪,并针对不同使用场景(如社交媒体、文档、演示文稿)进行优化。核心功能包括:图像质量分析、智能超分辨率、细节锐化、压缩伪影消除。适用于博客作者、内容创作者、设计师、产品经理等需要高质量视觉素材的用户。关键词:图像增强,AI图像处理,截图优化,分辨率提升,图片锐化,去噪工具,批量处理,社交媒体图片优化。

4.5

Platerecognizer自动化Skill platerecognizer-automation

这个技能用于通过Rube MCP和Composio工具包自动化Platerecognizer的车牌识别任务,实现工具集成、连接管理和操作执行。关键词:车牌识别,自动化,Rube MCP,Composio,计算机视觉,工具集成,AI应用。

4.5

ImagePreprocessingSkill ImagePreprocessing

使用Python和OpenCV进行图像预处理,以优化OCR和计算机视觉任务的执行。关键技术包括颜色空间转换、图像降噪、阈值处理、形态学操作、边缘检测和图像纠偏。

4.5

高级计算机视觉工程师Skill senior-computer-vision

本技能专注于生产级计算机视觉工程,涵盖目标检测、图像分割和视觉AI系统的部署。包括CNN和视觉变换器架构,YOLO/Faster R-CNN/DETR检测,Mask R-CNN/SAM分割,以及ONNX/TensorRT的生产部署。涉及PyTorch、torchvision、Ultralytics、Detectron2和MMDetection框架。

4.5

FiftyOne图像去重工具Skill fiftyone-find-duplicates

FiftyOne图像去重工具是一个基于深度学习的计算机视觉工具,专门用于在图像数据集中查找和移除重复或近似重复的图像。通过使用FiftyOne大脑插件的相似度计算功能,该工具能够自动识别视觉相似的图像,支持数据集清洗、图像聚类、冗余样本删除等操作。主要功能包括:计算图像嵌入向量、查找完全重复和近似重复图像、按相似度排序、自动去重等。适用于机器学习数据预处理、计算机视觉项目、图像数据集管理等场景。关键词:图像去重、FiftyOne、深度学习、计算机视觉、数据集清洗、相似度计算、图像聚类、数据预处理、AI工具、视觉识别。

4.5

FiftyOne代码风格指南Skill fiftyone-code-style

FiftyOne代码风格指南是一套完整的Python编码规范,专门为FiftyOne计算机视觉数据集管理框架设计。该指南详细规定了模块结构、导入组织、文档字符串格式、私有函数命名、延迟导入策略、错误处理模式和代码质量检查清单。适用于开发者为FiftyOne贡献代码、开发插件或编写与FiftyOne代码库集成的Python程序时遵循,确保代码风格统一、可维护性强。关键词:FiftyOne, Python代码规范, 计算机视觉, 数据集管理, 代码风格, 开发指南, 开源贡献

4.5

FiftyOne数据集推理工具Skill fiftyone-dataset-inference

FiftyOne数据集推理工具是一个用于计算机视觉任务的端到端解决方案,支持从本地目录创建数据集、导入COCO/YOLO/VOC等标准格式标签、运行深度学习模型推理并存储预测结果。该工具提供完整的ML管道,适用于目标检测、图像分类、语义分割等计算机视觉应用,帮助用户高效管理视觉数据集和模型评估。