计算机视觉 Skill技能列表

4.5

计算机视觉Skill ComputerVision

利用PyTorch和TensorFlow实现图像分类、目标检测、语义分割等计算机视觉任务

4.5

FiftyOne插件开发Skill fiftyone-develop-plugin

FiftyOne插件开发技能,提供从零开始创建自定义FiftyOne插件的完整指导。涵盖操作符和面板开发、外部API集成、插件测试与迭代。适用于计算机视觉、数据可视化、AI数据管理领域的开发者。关键词:FiftyOne插件开发、计算机视觉工具、数据标注平台、自定义操作符、交互式面板、Python插件、JavaScript面板、Voxel51、AI数据管理、机器学习工作流。

4.5

UniversalDatasetImportforFiftyOneSkill fiftyone-dataset-import

FiftyOne数据集导入技能,支持所有媒体类型和标签格式,自动检测和处理多模态数据集,适用于自动驾驶和3D场景数据。

4.5

AI视觉准确性检查Skill ai-visual-accuracy-check

AI视觉准确性检查是一种基于人工智能的质量保证技能,用于验证HTML页面渲染与原始PDF文档的视觉一致性。该技能通过多模态AI模型(如Claude)对PDF截图和HTML渲染截图进行智能对比分析,评估布局匹配、视觉层次、内容定位和排版样式四个维度,提供0-100的客观评分和详细差异报告。作为流水线中的阻塞性质量门控,当评分低于85%时会自动停止部署流程,确保数字出版物的视觉保真度和用户体验。关键词:AI视觉验证、PDF转HTML质量检查、多模态AI比较、自动化质量门控、视觉一致性评估、Claude API集成、网页渲染准确性、文档数字化质量控制。

4.5

视觉分析师Skill vision

这是一个基于大模型的视觉分析技能,专门用于解读和分析各类图像内容。核心功能包括:识别图像中的UI元素、提取文本信息、解析图表结构、分析布局设计、诊断错误截图。适用于软件开发截图分析、架构图理解、UI设计稿评审、错误排查等场景。关键词:视觉分析,图像识别,UI分析,图表解析,错误诊断,截图解读,AI视觉助手。

4.5

点云处理技能Skill PointCloudProcessingSkill

本技能专注于利用PCL和Open3D库,对三维点云数据进行高效处理与分析。核心功能包括点云滤波、分割、聚类、表面重建、特征提取、点云配准以及激光雷达与相机数据融合,是自动驾驶、机器人感知、三维建模等领域的关键技术。关键词:点云处理,3D点云,激光雷达LiDAR,PCL,Open3D,点云配准,点云分割,计算机视觉。

4.5

目标检测与分割技能Skill ObjectDetection/SegmentationSkill

该技能专注于在机器人感知领域部署和优化深度学习模型,实现高效的目标检测、实例分割、3D目标检测以及多目标跟踪。核心能力包括配置YOLO、Detectron2等主流框架,进行TensorRT模型加速,搭建ROS视觉管道,并支持多摄像头数据融合。适用于需要实时、精准环境感知的自动化与机器人系统开发。关键词:目标检测,实例分割,深度学习,机器人视觉,YOLO,Detectron2,TensorRT,ROS,3D检测,多目标跟踪。

4.5

NVIDIAIsaacSim逼真模拟与合成数据生成技能Skill NVIDIAIsaacSimSkill

NVIDIA Isaac Sim 技能是一个专注于利用NVIDIA Isaac Sim平台进行高保真、照片级逼真模拟和合成数据生成的专家级工具。它集成了Omniverse和Replicator,能够高效创建虚拟环境、配置物理引擎、实现领域随机化,并生成带标注的训练数据,广泛应用于机器人仿真、自动驾驶、数字孪生和强化学习等领域。 关键词:NVIDIA Isaac Sim,逼真模拟,合成数据生成,Omniverse,Replicator,物理模拟,领域随机化,机器人仿真,自动驾驶,数字孪生,USD格式,ROS桥接,RTX光线追踪。

4.5

抓取规划技能Skill GraspPlanningSkill

抓取规划技能是机器人操作领域的核心技术,专注于机器人抓取姿态生成、质量评估和夹爪控制。该技能支持对向抓取检测、6自由度姿态估计、碰撞感知选择等关键功能,适用于拾取放置、料箱拣选等工业自动化场景。核心能力包括GPD算法配置、GraspIt!集成、MoveIt抓取库应用,为智能制造、工业机器人提供专业抓取解决方案。

4.5

边缘部署技能Skill EdgeDeploymentSkill

该技能专注于将机器学习模型高效部署到机器人及嵌入式边缘设备(如NVIDIA Jetson)。核心功能包括模型优化(TensorRT、ONNX转换、INT8/FP16量化、模型剪枝)、加速推理配置(DeepStream、CUDA图、DLA)、以及集成实现(ROS2节点、多流推理)。旨在解决边缘计算场景下的模型轻量化、低延迟推理与硬件适配挑战,适用于机器人视觉、自动驾驶、工业检测等实时AI应用部署。 关键词:边缘计算部署,Jetson模型优化,TensorRT加速,ONNX转换,INT8量化,DeepStream,ROS2推理节点,嵌入式AI,模型轻量化,低延迟推理

4.5

校准工具技能Skill CalibrationToolsSkill

校准工具技能是用于机器人及传感器系统精确校准的专业技能,涵盖相机、IMU、LiDAR、手眼、运动学及多传感器校准。关键词包括:机器人校准、传感器校准、Kalibr、手眼校准、相机标定、IMU校准、LiDAR校准、运动学校准、多传感器融合、校准验证。

4.5

感知系统Skill perception-system

该技能为AI提供多模态感知能力,包括视觉锥、听觉系统、嗅觉/接近检测和威胁评估,用于环境感知、目标识别和安全监控等场景。关键词:AI感知,视觉检测,听觉系统,威胁评估,环境感知,目标识别,安全监控。