人工智能 Skill技能列表
Gemini视频理解技能Skill gemini-video-understanding
这是一个基于Google Gemini API的视频分析工具,能够进行视频总结、问答、音频转录、时间戳引用、视频剪辑和多视频比较,支持多种视频格式和AI模型,适用于内容分析、教育、研究、SEO优化等场景。关键词:视频分析,Gemini API,AI视频理解,视频转录,YouTube分析,人工智能应用。
高级计算机视觉工程师Skill senior-computer-vision
本技能专注于生产级计算机视觉工程,涵盖目标检测、图像分割和视觉AI系统的部署。包括CNN和视觉变换器架构,YOLO/Faster R-CNN/DETR检测,Mask R-CNN/SAM分割,以及ONNX/TensorRT的生产部署。涉及PyTorch、torchvision、Ultralytics、Detectron2和MMDetection框架。
生成视频技能Skill generate-video
该技能用于自动生成产品演示视频,通过分析代码库、规划场景并利用AI生成图像,实现高效视频创作。适用于产品推广、视觉文档和培训材料制作。关键词:自动视频生成、产品演示、AI图像生成、代码分析、Remotion框架、短视频制作、SEO优化。
AIsaTavily搜索工具Skill aisa-tavily
AIsa Tavily 搜索工具是一个专为AI智能体设计的网络搜索接口,通过调用Tavily API并经由AIsa的统一网关进行优化,能够快速、精准地抓取和返回网络上的相关信息。它支持常规搜索和深度研究模式,并能针对新闻等特定主题进行过滤,同时提供从指定URL提取内容的功能。该工具旨在提升AI代理在信息检索、数据分析和内容生成等任务中的效率和准确性。关键词:AI搜索,Tavily API,网络爬虫,信息检索,AI智能体,数据提取,AIsa网关。
提示词与模式调优Skill prompt-schema-tuning
这是一个用于自定义文档分析提取功能的技能。它允许用户通过修改分析模式(定义提取哪些字段)和提示模板(指导AI如何提取)来精确控制从学术论文等文档中提取的信息内容和格式。关键词:文档分析、AI提取、提示工程、模式配置、学术研究、信息抽取、大语言模型调优、RAG应用。
稳定基线3Skill stable-baselines3
稳定基线3 是一个基于 PyTorch 的强化学习库,提供可靠的强化学习算法实现(如 PPO、SAC、DQN),支持快速训练 RL 代理、创建自定义环境、实现回调函数和优化工作流程。关键词:强化学习、稳定基线3、PyTorch、RL 算法、训练代理、自定义环境、回调函数、向量化环境、深度强化学习、AI 应用。
NCCL多GPU通信库集成Skill nccl-communication
NCCL 多 GPU 通信库集成技能,专注于 NVIDIA 集体通信库 (NCCL) 的配置、优化与应用。该技能提供多 GPU 环境下高效的集体通信操作,包括全归约、全收集、广播等,支持单节点与多节点集群,并可针对 NVLink、PCIe 等硬件拓扑进行性能优化。适用于深度学习训练、高性能计算 (HPC)、大规模并行计算等场景。关键词:NCCL,多 GPU 通信,集体操作,深度学习训练,高性能计算,GPU 集群,NVLink 优化,MPI 集成,RCCL 兼容。
网页搜索工具Skill web-search
这是一个网页搜索技能,使用 DuckDuckGo 搜索引擎,允许用户通过查询字符串搜索网络内容,返回标题、摘要和链接。它支持调整结果数量,并提供引用格式以规范信息呈现。适用于信息检索、新闻跟踪、研究工作、SEO 优化和数据分析。关键词包括:网页搜索、信息检索、DuckDuckGo、搜索工具、引用格式、新闻研究。
单细胞基因组学深度学习工具Skill scvi-tools
scvi-tools是一个基于Python的框架,专门用于单细胞基因组学数据的深度生成模型分析。它支持批效应校正、多模态数据集成、差异表达分析等,适用于单细胞RNA-seq、ATAC-seq、空间转录组学等多种数据类型。关键词:单细胞基因组学、深度学习、变分推断、数据分析、批效应校正。
外部知识管理Skill external-knowledge
外部知识管理技能是一个用于组织、存储和检索非研究论文类参考资料的系统工具,包括教科书、讲义笔记、技术文档和背景材料。该技能通过创建主题知识库、支持多格式文件上传、智能搜索和与研究问答系统集成,帮助研究人员快速获取理论基础和背景知识。关键词:知识管理、研究辅助、文档检索、RAG应用、学术工具、背景资料、智能搜索、资料整理
AI模型参考Skill ai-models
提供最新的AI模型信息,包括Anthropic的Claude、OpenAI、Google的Gemini、Eleven Labs和Replicate等,覆盖复杂推理、快速聊天、代码生成等多种任务,帮助用户根据任务需求选择合适的AI模型。
纳米香蕉图像提示生成技能Skill nano-banana-prompts
这个技能专为生成优化的图像提示而设计,基于2025年10月的最佳实践,适用于Gemini 2.5 Flash Image。它提供结构化模板、组件指导、示例和工作流,覆盖摄影、艺术、产品摄影等多种场景,帮助用户创建高质量图像生成提示。关键词包括:图像提示生成、AI图像优化、Gemini提示、多轮编辑、SEO优化、摄影提示、艺术风格、技术规格。