人工智能 Skill技能列表
Transformer模型库技能Skill transformers
此技能基于Hugging Face Transformers库,专为处理预训练的Transformer模型设计,覆盖自然语言处理、计算机视觉、音频和多模态任务。可用于文本生成、分类、问答、翻译、摘要、图像分类、物体检测、语音识别及模型微调。关键词:Transformer模型,NLP,计算机视觉,音频处理,多模态AI,Hugging Face,模型微调。
会话记忆技能Skill session-memory
会话记忆技能用于管理跨会话的学习和记忆持久化,特别在AI辅助的代码开发项目中,记录任务、决策和模式,以增强开发连续性和效率。关键词:会话管理、记忆持久化、AI智能体、代码开发、项目记忆。
ClaudeAgentSDKSkill claude-agent-sdk
Claude Agent SDK 是一个用于构建和部署自主AI代理的软件开发工具包,支持工具集成、MCP服务器、多代理编排和会话管理,适用于自动化工作流、代码分析、系统监控等场景。关键词:Claude Agent SDK, AI智能体, 工具编排, MCP协议, 自主代理。
HuggingFace分词器应用与训练Skill huggingface-tokenizers
HuggingFace Tokenizers是一个高性能的自然语言处理(NLP)分词工具,基于Rust实现,支持BPE、WordPiece和Unigram算法,可用于训练自定义分词器,处理大规模文本数据,并集成到Transformers库中。适用于需要快速分词或定制分词器的研究和生产环境。关键词:分词、NLP、BPE、WordPiece、Unigram、快速分词、HuggingFace、Transformers、自定义训练、对齐跟踪。
技能创建指南Skill skill-creator
这个技能是用于指导用户如何创建或更新有效的Claude技能,以扩展其专业领域知识、工作流和工具集成能力。关键词:技能创建、AI代理、Claude、工作流、工具集成、指南。
新智能体创建技能Skill new-agent-creation
本技能提供在Unite-Hub平台创建和部署AI智能体的完整指南与模板。内容涵盖智能体开发、注册、测试、治理全流程,包含代码示例、检查清单和最佳实践。适用于AI开发者、系统架构师和自动化流程构建者。关键词:AI智能体开发,Unite-Hub平台,智能体注册,Agent治理,AI自动化,Claude API集成,智能体测试,编排器配置。
TOON格式Skill toon-format
TOON是一种为LLM(大型语言模型)提示设计的紧凑、人类可读的JSON编码格式,旨在减少令牌数量,提高数据传输效率。
任务复杂度分类器Skill task-classifier
任务复杂度分类器是一个智能AI任务路由系统,用于评估软件开发任务的复杂程度(1-10级),并根据复杂度自动推荐最优的AI模型进行处理。该系统通过分析技术因素(文件数量、依赖关系、数据库变更)、风险因素(安全影响、破坏性、回滚难度)和认知因素(问题新颖性、需求模糊性)来精确分类任务,实现AI资源的智能分配和优化。关键词:AI任务分类、复杂度评估、模型路由、智能编排、软件开发自动化、AI资源优化、任务优先级、风险分析。
SkillCreatorSkill skill-creator
这份技能提供了创建有效技能的指导。
Cloudflare智能体Skill cloudflare-agents
这是一个用于在Cloudflare Workers上构建和部署AI智能体的技能。它支持工具集成、多种LLM提供商(如OpenAI、Anthropic、Google Gemini)、MCP协议,并利用Cloudflare的serverless平台实现高效AI应用开发。关键词:Cloudflare、AI智能体、serverless、MCP、LLM、工具集成。
AI头像视频生成Skill ai-avatar-video
此技能用于通过inference.sh命令行工具创建AI驱动的头像和说话头部视频,支持多种先进模型如OmniHuman、Fabric和PixVerse,实现音频驱动、嘴唇同步和虚拟主持人功能。适用于AI主持人制作、教育解说视频、多语言配音、营销内容生成等场景。关键词:AI头像、说话头部、视频生成、嘴唇同步、虚拟主持人、AI应用、音频驱动视频、内容创建。
AI多模态Skill ai-multimodal
AI多模态技能利用Google Gemini API实现多媒体内容的处理与生成,包括音频分析(转录、摘要、音乐分析)、图像理解(分析、OCR、视觉问答)、视频处理(场景检测、问答)、文档提取(PDF表格、图表),以及图像和视频生成(文本到图像、文本到视频)。适用于开发多模态AI应用、内容创作、数据提取等场景。关键词:AI, 多模态, Google Gemini, 图像处理, 视频分析, 音频转录, 文档提取, AIGC, 图像生成, 视频生成。