科学技能工具包Skill scientific-skills

这是一个综合性科学研究工具包,提供139个专门技能,覆盖生物学、化学、医学、数据科学和计算研究领域。它能够将AI助手转变为研究助手,访问科学数据库、使用分析工具和执行领域特定工作流程。关键词:科学研究、数据分析、生物信息学、化学信息学、机器学习、科学写作、AI研究助手。

数据分析 1 次安装 10 次浏览 更新于 3/10/2026

name: scientific-skills 描述: 综合性科学研究工具包,包含139个专门技能,覆盖生物学、化学、医学、数据科学和计算研究。将Claude转变为AI研究助手,提供科学数据库访问、分析工具和领域特定工作流程。 许可证: MIT 版本: 2.17.0 元数据: 技能作者: K-Dense Inc. 原始仓库: https://github.com/K-Dense-AI/claude-scientific-skills 类别: - 科学数据库 - 生物信息学 - 化学信息学 - 机器学习 - 数据分析 - 科学写作 技能数量: 139 工具:

  • 读取
  • 写入
  • 编辑
  • Bash
  • 网络搜索
  • 网络获取
  • 任务 已验证: false 最后验证时间: 2026-02-19T05:29:09.098Z

Claude 科学技能

概述

一个综合性集合,包含 139 个即用型科学技能,将 Claude 转变为能够执行跨生物学、化学、医学及相关领域复杂多步科学工作流的 AI 研究助手。

使用场景

在以下情况下调用此技能:

  • 处理科学研究任务
  • 需要访问专业数据库(如 PubMed、ChEMBL、UniProt 等)
  • 进行生物信息学或化学信息学分析
  • 创建文献综述或科学文档
  • 分析单细胞 RNA-seq、蛋白质组学或多组学数据
  • 药物发现和分子分析工作流
  • 对科学数据进行统计分析和机器学习

快速开始

// 调用主技能目录
Skill({ skill: 'scientific-skills' });

// 或直接调用特定子技能
Skill({ skill: 'scientific-skills/rdkit' }); // 化学信息学
Skill({ skill: 'scientific-skills/scanpy' }); // 单细胞分析
Skill({ skill: 'scientific-skills/biopython' }); // 生物信息学
Skill({ skill: 'scientific-skills/literature-review' }); // 文献综述

技能类别

科学数据库 (28+)

技能 描述
pubchem 化学化合物数据库
chembl-database 用于药物发现的生物活性数据库
uniprot-database 蛋白质序列和功能数据库
pdb 蛋白质数据银行结构
drugbank-database 药物和药物靶点信息
kegg 通路和基因组数据库
clinvar-database 临床变异解释
cosmic-database 癌症突变数据库
ensembl-database 基因组浏览器和注释
geo-database 基因表达数据
gwas-database 全基因组关联研究
reactome-database 生物通路
string-database 蛋白质-蛋白质相互作用
alphafold-database 蛋白质结构预测
biorxiv-database 生物学预印本服务器
clinicaltrials-database 临床试验注册中心
ena-database 欧洲核苷酸存档
fda-database FDA 药物批准和标签
gene-database 来自 NCBI 的基因信息
zinc-database 商业可用化合物
brenda-database 酶数据库
clinpgx-database 药物基因组学注释
uspto-database 专利数据库

Python 分析库 (55+)

技能 描述
rdkit 化学信息学工具包
scanpy 单细胞 RNA-seq 分析
anndata 注释数据矩阵
biopython 计算生物学工具
pytorch-lightning 深度学习框架
scikit-learn 机器学习库
transformers NLP 和深度学习模型
pandas / polars / vaex 数据操作
matplotlib / seaborn / plotly 可视化
deepchem 化学深度学习
esm 进化尺度建模
datamol 分子数据处理
pymatgen 材料科学
qiskit 量子计算
pymoo 多目标优化
statsmodels 统计建模
sympy 符号数学
networkx 网络分析
geopandas 地理空间分析
shap 模型可解释性

生物信息学与基因组学

技能 描述
gget 基因和转录本信息
pysam SAM/BAM 文件操作
deeptools NGS 数据分析
pydeseq2 差异表达
scvi-tools 单细胞深度学习
etetoolkit 系统发育分析
scikit-bio 生物信息学算法
bioservices 生物学网络服务
cellxgene-census 细胞图谱探索

化学信息学与药物发现

技能 描述
rdkit 分子操作
datamol 分子数据处理
molfeat 分子特征化
diffdock 分子对接
torchdrug 药物发现 ML
pytdc 治疗数据共享
cobrapy 代谢建模

科学交流

技能 描述
literature-review 系统文献综述
scientific-writing 学术写作协助
scientific-schematics AI 生成图
scientific-slides 演示生成
hypothesis-generation 假设开发
venue-templates 期刊特定格式化
citation-management 参考文献管理

临床与医学

技能 描述
clinical-decision-support 临床推理
clinical-reports 医学报告生成
treatment-plans 治疗规划
pyhealth 医疗保健 ML
pydicom 医学影像

实验室与集成

技能 描述
benchling-integration 实验室信息平台
dnanexus-integration 基因组学云平台
pylabrobot 实验室自动化
flowio 流式细胞术数据
omero-integration 生物成像平台

核心工作流

文献综述工作流

# 7阶段系统文献综述
# 1. 使用 PICO 框架规划
# 2. 多数据库搜索执行
# 3. 使用 PRISMA 流程图筛选
# 4. 数据提取和质量评估
# 5. 主题合成
# 6. 引用验证
# 7. PDF 生成

药物发现工作流

# 使用 RDKit + ChEMBL + datamol
from rdkit import Chem
from rdkit.Chem import Descriptors, AllChem

# 1. 查询 ChEMBL 获取生物活性数据
# 2. 计算分子性质
# 3. 通过药物相似性(Lipinski)过滤
# 4. 相似性筛选
# 5. 子结构分析

单细胞分析工作流

# 使用 scanpy + anndata
import scanpy as sc

# 1. 加载和质量控制数据
# 2. 归一化和特征选择
# 3. 降维(PCA、UMAP)
# 4. 聚类(Leiden 算法)
# 5. 标记基因识别
# 6. 细胞类型注释

假设生成工作流

# 8步系统过程
# 1. 理解现象
# 2. 文献搜索
# 3. 合成证据
# 4. 生成竞争假设
# 5. 评估质量
# 6. 设计实验
# 7. 制定预测
# 8. 生成报告

子技能结构

每个子技能遵循一致的结构:

scientific-skills/
├── SKILL.md                    # 此文件(目录/索引)
├── skills/                     # 单个技能目录
│   ├── rdkit/
│   │   ├── SKILL.md           # 技能文档
│   │   ├── references/        # API 引用、模式
│   │   └── scripts/           # 示例脚本
│   ├── scanpy/
│   ├── biopython/
│   └── ... (共139个)

调用子技能

直接调用

// 调用特定技能
Skill({ skill: 'scientific-skills/rdkit' });
Skill({ skill: 'scientific-skills/scanpy' });

链式工作流

// 多技能工作流
Skill({ skill: 'scientific-skills/literature-review' });
Skill({ skill: 'scientific-skills/hypothesis-generation' });
Skill({ skill: 'scientific-skills/scientific-schematics' });

先决条件

  • Python 3.9+(推荐 3.12+)
  • uv 包管理器(推荐)
  • 平台:macOS、Linux 或带有 WSL2 的 Windows

最佳实践

  1. 从正确技能开始:使用上述类别表找到合适技能
  2. 链式技能处理复杂工作流:文献综述 → 假设 → 实验设计
  3. 使用数据库技能进行数据访问:在分析前查询数据库
  4. 可视化结果:使用 matplotlib/seaborn/plotly 技能生成出版质量图
  5. 记录发现:使用科学写作技能进行正式文档记录

与代理框架集成

推荐代理配对

代理 科学技能
data-engineer polars、dask、vaex、zarr-python
python-pro 所有基于 Python 的技能
database-architect 用于模式设计的数据库技能
technical-writer literature-review、scientific-writing

示例代理生成

Task({
  task_id: 'task-1',
  subagent_type: 'python-pro',
  description: '使用 RDKit 分析分子数据集',
  prompt: `您是具有科学研究专业知识的 PYTHON-PRO 代理。

## 任务
分析分子数据集的药物相似性性质。

## 要调用的技能
1. Skill({ skill: "scientific-skills/rdkit" })
2. Skill({ skill: "scientific-skills/datamol" })

## 工作流
1. 加载分子数据
2. 计算描述符
3. 应用 Lipinski 过滤器
4. 生成可视化
5. 报告发现
`,
});

资源

捆绑文档

  • skills/*/SKILL.md - 单个技能文档
  • skills/*/references/ - API 引用和模式
  • skills/*/scripts/ - 示例脚本和模板

外部资源

版本历史

  • v2.17.0 - 当前版本,包含139个技能
  • 从 K-Dense-AI/claude-scientific-skills 仓库集成

许可证

MIT 许可证 - 开源,可免费用于研究和商业用途。