开放靶点数据库Skill opentargets-database

这个技能用于查询开放靶点平台,系统识别和优先化治疗药物靶点,通过整合遗传学、组学、文献等数据,支持药物靶点发现、疾病关联分析、证据检索和药物信息查询。关键词:药物靶点发现、疾病关联、遗传证据、药物研发、生物信息学、靶点评估、药物重定位。

药物研发 0 次安装 0 次浏览 更新于 3/16/2026

名称: 开放靶点数据库 描述: “查询开放靶点平台,获取目标-疾病关联、药物靶点发现、可追溯性/安全数据、遗传/组学证据、已知药物信息,用于治疗靶点识别。”

开放靶点数据库

概述

开放靶点平台是一个综合性资源,用于系统性地识别和优先化潜在的治疗药物靶点。它整合了公开可用的数据集,包括人类遗传学、组学、文献和化学数据,以构建和评分目标-疾病关联。

核心功能:

  • 查询目标(基因)注释,包括可追溯性、安全性、表达
  • 搜索疾病-目标关联及证据评分
  • 从多种数据类型(遗传学、通路、文献等)检索证据
  • 查找疾病的已知药物及其机制
  • 访问药物信息,包括临床试验阶段和不良事件
  • 评估靶点可药性和治疗潜力

数据访问: 平台提供GraphQL API、Web界面、数据下载和Google BigQuery访问。本技能专注于GraphQL API的程序化访问。

使用时机

此技能应在以下情况下使用:

  • 靶点发现: 寻找疾病的潜在治疗靶点
  • 靶点评估: 评估基因的可追溯性、安全性和可药性
  • 证据收集: 检索目标-疾病关联的支持证据
  • 药物重定位: 识别现有药物用于新适应症
  • 竞争情报: 了解临床先例和药物开发现状
  • 靶点优先化: 基于遗传证据和其他数据类型对靶点进行排序
  • 机制研究: 调查生物通路和基因功能
  • 生物标志物发现: 发现疾病中差异表达的基因
  • 安全评估: 识别药物靶点的潜在毒性问题

核心工作流

1. 搜索实体

首先找到感兴趣的目标、疾病或药物的标识符。

对于目标(基因):

from scripts.query_opentargets import search_entities

# 通过基因符号或名称搜索
results = search_entities("BRCA1", entity_types=["target"])
# 返回: [{"id": "ENSG00000012048", "name": "BRCA1", ...}]

对于疾病:

# 通过疾病名称搜索
results = search_entities("alzheimer", entity_types=["disease"])
# 返回: [{"id": "EFO_0000249", "name": "Alzheimer disease", ...}]

对于药物:

# 通过药物名称搜索
results = search_entities("aspirin", entity_types=["drug"])
# 返回: [{"id": "CHEMBL25", "name": "ASPIRIN", ...}]

使用的标识符:

  • 目标: Ensembl基因ID(例如,ENSG00000157764
  • 疾病: EFO(实验因子本体)ID(例如,EFO_0000249
  • 药物: ChEMBL ID(例如,CHEMBL25

2. 查询目标信息

检索全面的目标注释以评估可药性和生物学特性。

from scripts.query_opentargets import get_target_info

target_info = get_target_info("ENSG00000157764", include_diseases=True)

# 访问关键字段:
# - approvedSymbol: HGNC基因符号
# - approvedName: 完整基因名称
# - tractability: 跨模态的可药性评估
# - safetyLiabilities: 已知的安全问题
# - geneticConstraint: gnomAD的约束评分
# - associatedDiseases: 顶级疾病关联及评分

关键注释查看:

  • 可追溯性: 小分子、抗体、PROTAC可药性预测
  • 安全性: 来自多个数据库的已知毒性问题
  • 遗传约束: pLI和LOEUF评分表示必要性
  • 疾病关联: 与目标关联的疾病及证据评分

参考 references/target_annotations.md 获取所有目标特征的详细信息。

3. 查询疾病信息

获取疾病详情及关联的目标/药物。

from scripts.query_opentargets import get_disease_info

disease_info = get_disease_info("EFO_0000249", include_targets=True)

# 访问字段:
# - name: 疾病名称
# - description: 疾病描述
# - therapeuticAreas: 高层级疾病类别
# - associatedTargets: 顶级目标及关联评分

4. 检索目标-疾病证据

获取支持目标-疾病关联的详细证据。

from scripts.query_opentargets import get_target_disease_evidence

# 获取所有证据
evidence = get_target_disease_evidence(
    ensembl_id="ENSG00000157764",
    efo_id="EFO_0000249"
)

# 按证据类型筛选
genetic_evidence = get_target_disease_evidence(
    ensembl_id="ENSG00000157764",
    efo_id="EFO_0000249",
    data_types=["genetic_association"]
)

# 每条证据记录包含:
# - datasourceId: 特定数据源(例如,"gwas_catalog", "chembl")
# - datatypeId: 证据类别(例如,"genetic_association", "known_drug")
# - score: 证据强度(0-1)
# - studyId: 原始研究标识符
# - literature: 相关出版物

主要证据类型:

  1. genetic_association: GWAS、罕见变异、ClinVar、基因负担
  2. somatic_mutation: 癌症基因普查、IntOGen、癌症生物标志物
  3. known_drug: 来自获批/临床药物的临床先例
  4. affected_pathway: CRISPR筛选、通路分析、基因签名
  5. rna_expression: 表达图谱的差异表达
  6. animal_model: IMPC的小鼠表型
  7. literature: 来自Europe PMC的文本挖掘

参考 references/evidence_types.md 获取所有证据类型的详细描述和解释指南。

5. 查找已知药物

识别用于疾病的药物及其靶点。

from scripts.query_opentargets import get_known_drugs_for_disease

drugs = get_known_drugs_for_disease("EFO_0000249")

# drugs 包含:
# - uniqueDrugs: 唯一药物总数
# - uniqueTargets: 唯一靶点总数
# - rows: 药物-靶点-适应症记录列表,包括:
#   - drug: {name, drugType, maximumClinicalTrialPhase}
#   - targets: 药物靶向的基因
#   - phase: 该适应症的临床试验阶段
#   - status: 试验状态(活跃、完成等)
#   - mechanismOfAction: 药物作用机制

临床试验阶段:

  • 阶段 4: 获批药物
  • 阶段 3: 后期临床试验
  • 阶段 2: 中期试验
  • 阶段 1: 早期安全性试验

6. 获取药物信息

检索详细的药物信息,包括机制和适应症。

from scripts.query_opentargets import get_drug_info

drug_info = get_drug_info("CHEMBL25")

# 访问:
# - name, synonyms: 药物标识符
# - drugType: 小分子、抗体等
# - maximumClinicalTrialPhase: 开发阶段
# - mechanismsOfAction: 靶点和作用类型
# - indications: 疾病及试验阶段
# - withdrawnNotice: 如已撤回,原因和国家

7. 获取目标的所有关联

查找与目标关联的所有疾病,可选项按评分筛选。

from scripts.query_opentargets import get_target_associations

# 获取评分 >= 0.5 的关联
associations = get_target_associations(
    ensembl_id="ENSG00000157764",
    min_score=0.5
)

# 每个关联包含:
# - disease: {id, name}
# - score: 总体关联评分(0-1)
# - datatypeScores: 按证据类型的细分

关联评分:

  • 范围: 0-1(越高表示证据越强)
  • 使用谐波和聚合所有数据类型的证据
  • 非置信评分,而是相对排名指标
  • 研究不足的疾病可能评分较低,尽管证据良好

GraphQL API 详情

对于超出提供辅助函数的自定义查询,直接使用GraphQL API或修改 scripts/query_opentargets.py

关键信息:

  • 端点: https://api.platform.opentargets.org/api/v4/graphql
  • 交互式浏览器: https://api.platform.opentargets.org/api/v4/graphql/browser
  • 无需认证
  • 仅请求所需字段 以最小化响应大小
  • 使用分页 处理大型结果集: page: {size: N, index: M}

参考 references/api_reference.md 获取:

  • 完整端点文档
  • 所有实体类型的示例查询
  • 错误处理模式
  • API使用最佳实践

最佳实践

靶点优先化策略

在优先化药物靶点时:

  1. 从遗传证据开始: 人类遗传学(GWAS、罕见变异)提供最强的疾病相关性
  2. 检查可追溯性: 偏好具有临床或发现先例的靶点
  3. 评估安全性: 审查安全责任、表达模式和遗传约束
  4. 评估临床先例: 已知药物表示可药性和治疗窗口
  5. 考虑多种证据类型: 不同来源的汇聚证据增加信心
  6. 机制验证: 通路证据和生物学合理性
  7. 手动查阅文献: 对于关键决策,检查主要出版物

证据解释

强证据指标:

  • 多个独立证据来源
  • 高遗传关联评分(尤其是GWAS L2G > 0.5)
  • 来自获批药物的临床先例
  • ClinVar致病性变异与疾病匹配
  • 小鼠模型具有相关表型

警示标志:

  • 仅单一证据来源
  • 文本挖掘作为唯一证据(需要手动验证)
  • 不同来源的冲突证据
  • 高必要性 + 普遍表达(较差治疗窗口)
  • 多个安全责任

评分解释:

  • 评分排名相对强度,非绝对置信
  • 研究不足的疾病评分较低,尽管可能有有效靶点
  • 权重专家策展来源高于计算预测
  • 检查证据细分,而不仅是总体评分

常见工作流

工作流 1: 疾病靶点发现

  1. 搜索疾病 → 获取EFO ID
  2. 查询疾病信息,使用 include_targets=True
  3. 审查按关联评分排序的顶级靶点
  4. 对于有前景的靶点,获取详细目标信息
  5. 检查支持每个关联的证据类型
  6. 评估优先化靶点的可追溯性和安全性

工作流 2: 靶点验证

  1. 搜索靶点 → 获取Ensembl ID
  2. 获取全面的目标信息
  3. 检查可追溯性(尤其是临床先例)
  4. 审查安全责任和遗传约束
  5. 检查疾病关联以了解生物学
  6. 寻找化学探针或工具化合物
  7. 检查靶向基因的已知药物以获取机制见解

工作流 3: 药物重定位

  1. 搜索疾病 → 获取EFO ID
  2. 获取疾病的已知药物
  3. 对于每种药物,获取详细的药物信息
  4. 检查作用机制和靶点
  5. 寻找相关疾病适应症
  6. 评估临床试验阶段和状态
  7. 基于机制识别重定位机会

工作流 4: 竞争情报

  1. 搜索感兴趣的目标
  2. 获取关联疾病及证据
  3. 对于每种疾病,获取已知药物
  4. 审查临床阶段和开发现状
  5. 识别竞争对手及其机制
  6. 评估临床先例和市场格局

资源

脚本

scripts/query_opentargets.py 常见API操作的辅助函数:

  • search_entities() - 搜索目标、疾病或药物
  • get_target_info() - 检索目标注释
  • get_disease_info() - 检索疾病信息
  • get_target_disease_evidence() - 获取支持证据
  • get_known_drugs_for_disease() - 查找疾病的药物
  • get_drug_info() - 检索药物详情
  • get_target_associations() - 获取目标的所有关联
  • execute_query() - 执行自定义GraphQL查询

参考资料

references/api_reference.md 完整的GraphQL API文档包括:

  • 端点详情和认证
  • 可用的查询类型(目标、疾病、药物、搜索)
  • 所有常见操作的示例查询
  • 错误处理和最佳实践
  • 数据许可和引用要求

references/evidence_types.md 证据类型和数据源的全面指南:

  • 所有7种主要证据类型的详细描述
  • 每个来源的评分方法
  • 证据解释指南
  • 每种证据类型的优势和局限性
  • 质量评估建议

references/target_annotations.md 完整的目标注释参考:

  • 12种主要注释类别解释
  • 可追溯性评估详情
  • 安全责任来源
  • 表达、必要性和约束数据
  • 靶点优先化解释指南
  • 靶点评估的红旗和绿旗

数据更新和版本控制

开放靶点平台 每季度 更新一次新数据发布。当前发布(截至2025年10月)可在API端点获取。

发布信息: 查看 https://platform-docs.opentargets.org/release-notes 获取最新更新。

引用: 使用开放靶点数据时,请引用: Ochoa, D. et al. (2025) Open Targets Platform: facilitating therapeutic hypotheses building in drug discovery. Nucleic Acids Research, 53(D1):D1467-D1477.

限制和考虑

  1. API用于探索性查询: 对于许多目标/疾病的系统分析,使用数据下载或BigQuery
  2. 评分是相对的,非绝对的: 关联评分排名证据强度,但未预测临床成功
  3. 研究不足的疾病评分较低: 新颖或罕见疾病可能有强证据但总评分较低
  4. 证据质量各异: 权重专家策展来源高于计算预测
  5. 需要生物学解释: 评分和证据必须在生物学和临床背景下解释
  6. 无需认证: 所有数据可自由访问,但请适当引用