人工智能 Skill技能列表

4.5

AWQ量化技术Skill awq-quantization

AWQ(激活感知权重量化)是一种先进的4位量化技术,专为大型语言模型(LLM)设计,通过分析激活模式来保护关键权重,实现高达3倍的推理加速,同时保持最小精度损失。适用于AI模型部署、大模型微调、生产推理加速等场景,关键词包括AWQ、量化、LLM压缩、推理优化、AI部署。

4.5

OpenAI文档技能Skill "openai-docs"

该技能旨在通过使用 OpenAI 开发者文档的 MCP 工具,提供关于 OpenAI 产品和 API 的权威、最新指导,帮助开发者构建 AI 应用、ChatGPT 应用、代理工作流等。它强调优先使用官方文档工具,并在需要时回退到官方域名搜索,提高开发效率和准确性。关键词包括 OpenAI、文档、API、MCP、AI 开发、ChatGPT、Codex、代理 SDK。

4.5

凤凰AI观测平台Skill phoenix-observability

凤凰AI观测平台是一个开源AI观测平台,专注于大语言模型(LLM)的追踪、评估和监控,帮助开发者调试LLM应用、运行系统评估和实时监控生产AI系统。提供详细追踪、数据集评估、实验比较和开源自托管功能。关键词:AI观测、LLM跟踪、开源观测平台、AI应用监控、深度学习评估、大模型评估、实时监控、数据集测试。

4.5

LangSmith可观察性平台技能Skill langsmith-observability

LangSmith是一个用于大型语言模型(LLM)的可观察性平台,提供追踪、评估和监控功能,帮助开发人员调试AI应用、进行系统评估和性能监控。关键词:LLM、可观察性、追踪、评估、监控、调试、AI应用。

4.5

Whisper语音识别Skill whisper

Whisper 是 OpenAI 开发的多语言语音识别模型,能够将语音转换为文字,支持 99 种语言的转录和翻译到英语,适用于语音转文字、播客转录、会议自动化、音频处理等场景。关键词:语音识别、ASR、多语言、转录、翻译、音频处理、人工智能、NLP。

4.5

StableDiffusion图像生成Skill stable-diffusion-image-generation

这个技能涉及使用Stable Diffusion模型和HuggingFace Diffusers库进行高级图像生成,包括文本到图像、图像到图像转换、修复等,是AI生成内容(AIGC)的核心技术之一。关键词:Stable Diffusion, 图像生成, Diffusers, AI图像生成, 文本到图像。

4.5

SAM图像分割模型Skill segment-anything-model

SAM(分割任意模型)是一个用于图像分割的先进AI模型,支持零样本学习,能够通过点、框或掩码提示来分割图像中的任意对象,或自动生成所有对象掩码。适用于计算机视觉任务,如图像标注、对象检测和自动掩码生成。关键词:图像分割、零样本学习、SAM、计算机视觉、AI模型、深度学习。

4.5

LLaVASkill llava

LLaVA(大型语言和视觉助手)是一个开源的人工智能模型,用于图像理解和视觉语言对话。它结合了CLIP视觉编码器和语言模型,支持视觉问答、图像描述、多轮对话等任务,适用于构建视觉语言聊天机器人、文档理解等应用。关键词:视觉语言模型、图像理解、VQA视觉问答、开源AI、对话式AI、多模态学习、深度学习、计算机视觉、自然语言处理。

4.5

CLIP模型Skill clip

CLIP(对比语言-图像预训练模型)是OpenAI开发的一个多模态人工智能模型,专门用于连接视觉和语言信息。它能够执行零样本图像分类、图像-文本相似度计算、跨模态检索等任务,广泛应用于图像搜索、内容审核、视觉-语言任务等领域,无需额外训练。关键词:零样本图像分类、图像-文本匹配、内容审核、多模态AI、视觉语言模型。

4.5

AudioCraft音频生成Skill audiocraft-audio-generation

AudioCraft是一个用于音频生成的PyTorch库,基于深度学习技术,能够根据文本描述自动生成音乐和音效。它支持MusicGen(文本到音乐)和AudioGen(文本到音频),适用于音乐创作、音效设计、AI应用开发等领域。关键词:音频生成、文本到音乐、AI生成内容、深度学习、PyTorch、MusicGen、AudioGen、AIGC。

4.5

Torchtitan分布式LLM预训练Skill distributed-llm-pretraining-torchtitan

Torchtitan是一个用于大规模语言模型(LLM)预训练的PyTorch原生平台,支持4D并行(FSDP2、TP、PP、CP)、Float8训练和分布式检查点,适用于从8到512+ GPU的Llama、DeepSeek等模型的预训练,提供高效的训练速度和可扩展性。关键词:分布式训练、LLM预训练、PyTorch、Torchtitan、4D并行、Float8、深度学习、人工智能。

4.5

RWKV架构Skill rwkv-architecture

RWKV是一种结合Transformer和RNN的混合神经网络架构,具有线性推理复杂度、无限上下文处理能力和高效内存使用。适用于长序列处理、流式应用和大模型训练与推理,特别适合AI领域的模型开发和优化。关键词:RWKV, Transformer, RNN, 线性复杂度, 无限上下文, 高效推理, 机器学习, AI模型, 大模型微调