计算机视觉 Skill技能列表
Gemini视觉API技能Skill gemini-vision
此技能基于Google的Gemini API,实现图像理解和分析功能,支持图像描述、分类、视觉问答、对象检测、分割和多图像比较,适用于AI应用和计算机视觉任务,关键词:图像理解、Gemini API、人工智能、计算机视觉、图像分析、AI模型。
图像增强器Skill image-enhancer
图像增强器是一个基于AI的技能,用于自动提升图像质量,包括智能放大分辨率、锐化细节、减少压缩伪影,优化图像以适用于博客、文档、社交媒体和演示等场景,提升视觉表现。
OCRwithTesseractSkill OCRwithTesseract
使用Tesseract OCR引擎和Python进行光学字符识别(OCR)的综合指南,包括安装、基本用法、多语言支持、图像预处理、OCR配置优化、后处理等。
OCR文档转换器Skill ocr
OCR文档转换器是一款基于Claude vision技术的智能文件处理工具,专门用于将PDF和图像文件通过OCR光学字符识别转换为可编辑的Markdown格式。支持批量处理、并行转换、自定义提取指令,具备智能表格识别、代码提取、多语言翻译等功能。适用于文档数字化、数据提取、内容归档等场景。关键词:OCR识别、PDF转换、图像转文本、Markdown生成、文档数字化、批量处理、智能提取、表格识别、代码提取、多格式支持。
NVIDIAIsaacSim逼真模拟与合成数据生成技能Skill NVIDIAIsaacSimSkill
NVIDIA Isaac Sim 技能是一个专注于利用NVIDIA Isaac Sim平台进行高保真、照片级逼真模拟和合成数据生成的专家级工具。它集成了Omniverse和Replicator,能够高效创建虚拟环境、配置物理引擎、实现领域随机化,并生成带标注的训练数据,广泛应用于机器人仿真、自动驾驶、数字孪生和强化学习等领域。 关键词:NVIDIA Isaac Sim,逼真模拟,合成数据生成,Omniverse,Replicator,物理模拟,领域随机化,机器人仿真,自动驾驶,数字孪生,USD格式,ROS桥接,RTX光线追踪。
Platerecognizer自动化Skill platerecognizer-automation
这个技能用于通过Rube MCP和Composio工具包自动化Platerecognizer的车牌识别任务,实现工具集成、连接管理和操作执行。关键词:车牌识别,自动化,Rube MCP,Composio,计算机视觉,工具集成,AI应用。
UniversalDatasetImportforFiftyOneSkill fiftyone-dataset-import
FiftyOne数据集导入技能,支持所有媒体类型和标签格式,自动检测和处理多模态数据集,适用于自动驾驶和3D场景数据。
感知系统Skill perception-system
该技能为AI提供多模态感知能力,包括视觉锥、听觉系统、嗅觉/接近检测和威胁评估,用于环境感知、目标识别和安全监控等场景。关键词:AI感知,视觉检测,听觉系统,威胁评估,环境感知,目标识别,安全监控。
数字病理学全幻灯片图像处理技能Skill histolab
Histolab是一个用于数字病理学的Python库,专为全幻灯片图像(WSI)的组织检测、瓦片提取和预处理设计,支持自动化组织分割、多种瓦片提取策略(随机、网格、评分)和图像过滤,适用于深度学习管道、数据集准备和医学图像分析。关键词:数字病理学、WSI、组织检测、瓦片提取、预处理、Python库、深度学习、医学图像、计算机视觉、H&E染色。
FiftyOne数据集推理工具Skill fiftyone-dataset-inference
FiftyOne数据集推理工具是一个用于计算机视觉任务的端到端解决方案,支持从本地目录创建数据集、导入COCO/YOLO/VOC等标准格式标签、运行深度学习模型推理并存储预测结果。该工具提供完整的ML管道,适用于目标检测、图像分类、语义分割等计算机视觉应用,帮助用户高效管理视觉数据集和模型评估。
图像增强器Skill image-enhancer
图像增强技能基于人工智能技术,分析图像质量如分辨率和锐度,通过智能算法提升分辨率、增强细节锐化、减少压缩噪声,适用于优化截图和数字图像,提高在博客、社交媒体、演示文档中的视觉呈现。关键词:图像增强、分辨率提升、AI图像处理、锐化、去噪、SEO友好。
图像增强器Skill image-enhancer
这个技能用于自动提升图像质量,通过增强分辨率、锐度和清晰度,特别适用于截图处理。关键词:图像增强、分辨率提升、清晰度改善、截图优化、AI图像处理。