名称:drugbank-database 描述:访问和分析DrugBank数据库中的全面药物信息,包括药物属性、相互作用、靶点、通路、化学结构和药理学数据。此技能应用于处理制药数据、药物发现研究、药理学研究、药物-药物相互作用分析、靶点识别、化学相似性搜索、ADMET预测,或任何需要从DrugBank获取详细药物和药物靶点信息的任务。
DrugBank数据库
概述
DrugBank是一个全面的生物信息学和化学信息学数据库,包含药物和药物靶点的详细信息。此技能支持对DrugBank数据的程序化访问,包括约9,591个药物条目(2,037个FDA批准的小分子、241个生物技术药物、96个营养品和6,000多个实验化合物),每个条目有200多个数据字段。
核心能力
1. 数据访问和认证
使用Python下载和访问DrugBank数据,并进行适当认证。此技能提供以下指导:
- 安装和配置
drugbank-downloader包 - 通过环境变量或配置文件安全管理凭据
- 下载特定或最新数据库版本
- 高效打开和解析XML数据
- 使用缓存数据优化性能
何时使用:设置DrugBank访问、下载数据库更新、初始项目配置。
参考:详见references/data-access.md获取详细认证、下载流程、API访问、缓存策略和故障排除。
2. 药物信息查询
从数据库中提取全面药物信息,包括标识符、化学属性、药理学、临床数据和外部数据库交叉引用。
查询能力:
- 通过DrugBank ID、名称、CAS号或关键词搜索
- 提取基本药物信息(名称、类型、描述、适应症)
- 检索化学属性(SMILES、InChI、分子式)
- 获取药理学数据(作用机制、药效学、ADME)
- 访问外部标识符(PubChem、ChEMBL、UniProt、KEGG)
- 构建可搜索药物数据集并导出到DataFrame
- 按类型过滤药物(小分子、生物技术、营养品)
何时使用:检索特定药物信息、构建药物数据库、药理学研究、文献综述、药物分析。
参考:详见references/drug-queries.md获取XML导航、查询函数、数据提取方法和性能优化。
3. 药物-药物相互作用分析
分析药物-药物相互作用(DDI),包括机制、临床重要性和交互网络,用于药物警戒和临床决策支持。
分析能力:
- 提取特定药物的所有相互作用
- 构建双向交互网络
- 按严重程度和机制分类相互作用
- 检查药物对之间的相互作用
- 识别具有最多相互作用的药物
- 分析多药治疗方案的安全性
- 创建交互矩阵和网络图
- 在交互网络中执行社区检测
- 计算交互风险评分
何时使用:多药治疗安全性分析、临床决策支持、药物相互作用预测、药物警戒研究、识别禁忌症。
参考:详见references/interactions.md获取相互作用提取、分类方法、网络分析和临床应用。
4. 药物靶点和通路
访问药物-蛋白质相互作用的详细信息,包括靶点、酶、转运蛋白、载体和生物通路。
靶点分析能力:
- 提取具有作用(抑制剂、激动剂、拮抗剂)的药物靶点
- 识别代谢酶(CYP450、II相酶)
- 分析转运蛋白(摄取、外排)用于ADME研究
- 将药物映射到生物通路(SMPDB)
- 查找靶向特定蛋白质的药物
- 识别具有共享靶点的药物用于重新利用
- 分析多药理学和脱靶效应
- 提取靶点的基因本体(GO)术语
- 与UniProt交叉引用获取蛋白质数据
何时使用:作用机制研究、药物重新利用研究、靶点识别、通路分析、预测脱靶效应、理解药物代谢。
参考:详见references/targets-pathways.md获取靶点提取、通路分析、重新利用策略、CYP450分析和转运蛋白分析。
5. 化学属性和相似性
执行基于结构的分析,包括分子相似性搜索、属性计算、子结构搜索和ADMET预测。
化学分析能力:
- 提取化学结构(SMILES、InChI、分子式)
- 计算物理化学属性(分子量、logP、极性表面积、氢键)
- 应用Lipinski规则五和Veber规则
- 计算分子之间的Tanimoto相似性
- 生成分子指纹(Morgan、MACCS、拓扑)
- 使用SMARTS模式执行子结构搜索
- 查找结构相似的药物用于重新利用
- 创建相似性矩阵用于药物聚类
- 预测口服吸收和血脑屏障渗透性
- 使用PCA和聚类分析化学空间
- 导出化学属性数据库
何时使用:构效关系(SAR)研究、药物相似性搜索、QSAR建模、药物相似性评估、ADMET预测、化学空间探索。
参考:详见references/chemical-analysis.md获取结构提取、相似性计算、指纹生成、ADMET预测和化学空间分析。
典型工作流
药物发现工作流
- 使用
data-access.md下载和访问最新DrugBank数据 - 使用
drug-queries.md构建可搜索药物数据库 - 使用
chemical-analysis.md查找相似化合物 - 使用
targets-pathways.md识别共享靶点 - 使用
interactions.md检查候选组合的安全性
多药治疗安全性分析
- 使用
drug-queries.md查找患者药物 - 使用
interactions.md检查所有成对相互作用 - 使用
interactions.md分类相互作用严重程度 - 使用
interactions.md计算总体风险评分 - 使用
targets-pathways.md理解相互作用机制
药物重新利用研究
- 使用
targets-pathways.md查找具有共享靶点的药物 - 使用
chemical-analysis.md查找结构相似的药物 - 使用
drug-queries.md提取适应症和药理学数据 - 使用
interactions.md评估潜在组合疗法
药理学研究
- 使用
drug-queries.md提取感兴趣药物 - 使用
targets-pathways.md识别所有蛋白质相互作用 - 使用
targets-pathways.md映射到生物通路 - 使用
chemical-analysis.md预测ADMET属性 - 使用
interactions.md识别潜在禁忌症
安装要求
Python包
pip install drugbank-downloader # 核心访问
pip install bioversions # 最新版本检测
pip install lxml # XML解析优化
pip install pandas # 数据操作
pip install rdkit # 化学信息学(用于相似性)
pip install networkx # 网络分析(用于相互作用)
pip install scikit-learn # 机器学习/聚类(用于化学空间)
账户设置
- 在go.drugbank.com创建免费账户
- 接受许可协议(学术用途免费)
- 获取用户名和密码凭据
- 按照
references/data-access.md配置凭据
数据版本和可重复性
为可重复研究,始终指定DrugBank版本:
from drugbank_downloader import download_drugbank
path = download_drugbank(version='5.1.10') # 指定确切版本
在出版物和分析脚本中记录所用版本。
最佳实践
- 凭据:使用环境变量或配置文件,切勿硬编码
- 版本控制:指定确切数据库版本以确保可重复性
- 缓存:缓存解析数据以避免重新下载和重新解析
- 命名空间:解析时正确处理XML命名空间
- 验证:使用RDKit验证化学结构后再使用
- 交叉引用:使用外部标识符(UniProt、PubChem)进行集成
- 临床背景:解释相互作用数据时始终考虑临床背景
- 许可证合规:确保使用案例符合适当许可
参考文档
所有详细实施指导均组织在模块化参考文件中:
- references/data-access.md:认证、下载、解析、API访问、缓存
- references/drug-queries.md:XML导航、查询方法、数据提取、索引
- references/interactions.md:DDI提取、分类、网络分析、安全评分
- references/targets-pathways.md:靶点/酶/转运蛋白提取、通路映射、重新利用
- references/chemical-analysis.md:结构提取、相似性、指纹、ADMET预测
根据具体分析需求加载这些参考文件。