计算机视觉 Skill技能列表

4.5

数字病理图像处理工具包Skill histolab

Histolab 是一个Python库,专门用于处理数字病理中的全玻片图像(WSI)。它自动化组织检测,从高分辨率图像中提取信息块,并为深度学习管道准备数据集。支持多种图像格式,实现组织分割和灵活的提取策略。关键词:数字病理、图像处理、WSI、组织检测、图块提取、深度学习、计算机视觉、医学影像。

4.5

OCRwithTesseractSkill OCRwithTesseract

使用Tesseract OCR引擎和Python进行光学字符识别(OCR)的综合指南,包括安装、基本用法、多语言支持、图像预处理、OCR配置优化、后处理等。

4.5

图像增强器Skill image-enhancer

图像增强器是一个基于AI的技能,用于自动提升图像质量,包括智能放大分辨率、锐化细节、减少压缩伪影,优化图像以适用于博客、文档、社交媒体和演示等场景,提升视觉表现。

4.5

FiftyOne插件开发Skill fiftyone-develop-plugin

FiftyOne插件开发技能,提供从零开始创建自定义FiftyOne插件的完整指导。涵盖操作符和面板开发、外部API集成、插件测试与迭代。适用于计算机视觉、数据可视化、AI数据管理领域的开发者。关键词:FiftyOne插件开发、计算机视觉工具、数据标注平台、自定义操作符、交互式面板、Python插件、JavaScript面板、Voxel51、AI数据管理、机器学习工作流。

4.5

CLIP模型Skill clip

CLIP(对比语言-图像预训练模型)是OpenAI开发的一个多模态人工智能模型,专门用于连接视觉和语言信息。它能够执行零样本图像分类、图像-文本相似度计算、跨模态检索等任务,广泛应用于图像搜索、内容审核、视觉-语言任务等领域,无需额外训练。关键词:零样本图像分类、图像-文本匹配、内容审核、多模态AI、视觉语言模型。

4.5

图像放大技能Skill image-upscaling

该技能利用AI模型如Real-ESRGAN、Topaz等,通过inference.sh CLI工具放大和增强图像,适用于提高图像分辨率、修复旧照片、放大AI生成艺术等场景,关键词包括图像放大、AI增强、分辨率提升、旧照片修复、AI艺术放大。

4.5

Gemini视觉API技能Skill gemini-vision

此技能基于Google的Gemini API,实现图像理解和分析功能,支持图像描述、分类、视觉问答、对象检测、分割和多图像比较,适用于AI应用和计算机视觉任务,关键词:图像理解、Gemini API、人工智能、计算机视觉、图像分析、AI模型。

4.5

图像增强器Skill image-enhancer

图像增强器技能用于自动提升图像质量,特别擅长处理截图,通过智能算法增强分辨率、锐化细节、减少噪点,适用于博客、文档、社交媒体、演示等多种场景。关键词:图像处理、截图增强、分辨率提升、锐化技术、图像优化工具。