NLP Skill技能列表
WitAI自动化技能Skill wit-ai-automation
这个技能用于通过Rube MCP和Composio的Wit AI工具包自动化自然语言处理(NLP)任务,包括工具发现、连接管理和工作流执行,适用于人工智能应用开发、自动化测试、智能助手集成和自动化流程优化。关键词:Wit AI、Rube MCP、Composio、NLP、自动化、人工智能、工具包、工作流。
语义相似度计算技能Skill semantic-similarity
语义相似度计算技能是一种基于人工智能的知识管理工具,专门用于分析文本内容的深层语义关系。通过先进的嵌入模型和向量相似度技术,该技能能够实现智能内容发现、重复检测、主题建模和个性化推荐等功能。核心能力包括文档向量化、相似度搜索、内容聚类、概念提取和语义搜索集成,广泛应用于知识库管理、企业搜索优化和智能推荐系统。关键技术涉及NLP、机器学习、向量数据库和相似度算法,帮助组织提升知识发现效率、优化内容组织和增强信息检索体验。
LEANN语义搜索Skill leann-search
LEANN语义搜索是一种基于人工智能的代码搜索工具,利用自然语言处理(NLP)技术进行语义理解,帮助开发者通过概念性查询快速定位代码。关键词:语义搜索、代码搜索、NLP、AI、开发工具、自然语言理解。
企业搜索知识综合Skill enterprise-search-knowledge
这个技能用于综合企业环境中的多源搜索知识,通过去重、置信度评估和总结,提供连贯、可信的答案。关键词包括:搜索综合、知识管理、去重算法、置信度评分、企业搜索、NLP应用。
正式报告草案起草与可执行结构技能Skill "formal-report-drafting-with-executable-structure"
这个技能用于生成正式、可执行的政策报告草案,具有结构严谨、语言克制、明确责任分配和量化成功指标的特点。它基于规则驱动,适用于AI系统辅助文本生成,确保报告的可操作性和可验证性。关键词包括:正式报告、政策起草、可执行结构、量化指标、责任分配、AI文本生成、自然语言处理。
去除AI痕迹Skill stop-slop
这个技能用于从文本中移除AI写作的痕迹,包括可预测的短语、结构和节奏,使内容听起来更自然、更像人类写作。关键词包括:AI写作、去除痕迹、自然语言、文本编辑。
句子嵌入框架Skill sentence-transformers
句子嵌入框架是一个用于生成高质量句子和文本嵌入的Python工具,支持语义相似度计算、RAG应用、多语言处理和领域特定模型,适用于自然语言处理任务,如语义搜索、文本聚类和分类。关键词:句子嵌入、语义相似度、RAG、多语言、NLP、AI、Python框架、预训练模型。
HuggingFace分词器应用与训练Skill huggingface-tokenizers
HuggingFace Tokenizers是一个高性能的自然语言处理(NLP)分词工具,基于Rust实现,支持BPE、WordPiece和Unigram算法,可用于训练自定义分词器,处理大规模文本数据,并集成到Transformers库中。适用于需要快速分词或定制分词器的研究和生产环境。关键词:分词、NLP、BPE、WordPiece、Unigram、快速分词、HuggingFace、Transformers、自定义训练、对齐跟踪。
nanoGPTSkill nanogpt
nanoGPT是一个简化的GPT实现技能,用于教育和实验目的。它通过约300行代码帮助学习和重现GPT-2模型,支持文本生成和模型训练,适合AI初学者、研究人员和快速原型开发。关键词:nanoGPT, GPT模型, 深度学习, 变压器架构, 教育实现, 文本生成, AI学习。
主题建模与文本挖掘Skill topic-modeling-text-mining
主题建模与文本挖掘技能专注于应用LDA、NMF等计算方法,通过参数调优从大规模文本语料库中自动发现隐藏的主题和模式。它涵盖文本预处理、主题模型构建、模式识别及可视化,广泛应用于数字人文、内容分析、信息检索等领域,帮助用户高效提取文本中的结构化信息和深层语义。关键词:主题建模,文本挖掘,LDA,NMF,文本分析,模式发现,参数调优,数字人文,语料库分析。
Gemini音频API技能Skill gemini-audio
这个技能利用 Google Gemini API 提供音频处理能力,包括音频转录、内容总结、声音分析以及文本到语音生成。支持多种音频格式,最大处理长达 9.5 小时的音频。适用于播客、会议、访谈等音频内容的处理和理解。关键词:音频处理,语音转录,AI 音频分析,语音生成,Gemini API,智能音频工具。
TOON格式Skill toon-format
TOON是一种为LLM(大型语言模型)提示设计的紧凑、人类可读的JSON编码格式,旨在减少令牌数量,提高数据传输效率。