名称: 开放靶点数据库 描述: “查询开放靶点平台,获取目标-疾病关联、药物靶点发现、可追溯性/安全数据、遗传/组学证据、已知药物信息,用于治疗靶点识别。”
开放靶点数据库
概述
开放靶点平台是一个综合性资源,用于系统性地识别和优先化潜在的治疗药物靶点。它整合了公开可用的数据集,包括人类遗传学、组学、文献和化学数据,以构建和评分目标-疾病关联。
核心功能:
- 查询目标(基因)注释,包括可追溯性、安全性、表达
- 搜索疾病-目标关联及证据评分
- 从多种数据类型(遗传学、通路、文献等)检索证据
- 查找疾病的已知药物及其机制
- 访问药物信息,包括临床试验阶段和不良事件
- 评估靶点可药性和治疗潜力
数据访问: 平台提供GraphQL API、Web界面、数据下载和Google BigQuery访问。本技能专注于GraphQL API的程序化访问。
使用时机
此技能应在以下情况下使用:
- 靶点发现: 寻找疾病的潜在治疗靶点
- 靶点评估: 评估基因的可追溯性、安全性和可药性
- 证据收集: 检索目标-疾病关联的支持证据
- 药物重定位: 识别现有药物用于新适应症
- 竞争情报: 了解临床先例和药物开发现状
- 靶点优先化: 基于遗传证据和其他数据类型对靶点进行排序
- 机制研究: 调查生物通路和基因功能
- 生物标志物发现: 发现疾病中差异表达的基因
- 安全评估: 识别药物靶点的潜在毒性问题
核心工作流
1. 搜索实体
首先找到感兴趣的目标、疾病或药物的标识符。
对于目标(基因):
from scripts.query_opentargets import search_entities
# 通过基因符号或名称搜索
results = search_entities("BRCA1", entity_types=["target"])
# 返回: [{"id": "ENSG00000012048", "name": "BRCA1", ...}]
对于疾病:
# 通过疾病名称搜索
results = search_entities("alzheimer", entity_types=["disease"])
# 返回: [{"id": "EFO_0000249", "name": "Alzheimer disease", ...}]
对于药物:
# 通过药物名称搜索
results = search_entities("aspirin", entity_types=["drug"])
# 返回: [{"id": "CHEMBL25", "name": "ASPIRIN", ...}]
使用的标识符:
- 目标: Ensembl基因ID(例如,
ENSG00000157764) - 疾病: EFO(实验因子本体)ID(例如,
EFO_0000249) - 药物: ChEMBL ID(例如,
CHEMBL25)
2. 查询目标信息
检索全面的目标注释以评估可药性和生物学特性。
from scripts.query_opentargets import get_target_info
target_info = get_target_info("ENSG00000157764", include_diseases=True)
# 访问关键字段:
# - approvedSymbol: HGNC基因符号
# - approvedName: 完整基因名称
# - tractability: 跨模态的可药性评估
# - safetyLiabilities: 已知的安全问题
# - geneticConstraint: gnomAD的约束评分
# - associatedDiseases: 顶级疾病关联及评分
关键注释查看:
- 可追溯性: 小分子、抗体、PROTAC可药性预测
- 安全性: 来自多个数据库的已知毒性问题
- 遗传约束: pLI和LOEUF评分表示必要性
- 疾病关联: 与目标关联的疾病及证据评分
参考 references/target_annotations.md 获取所有目标特征的详细信息。
3. 查询疾病信息
获取疾病详情及关联的目标/药物。
from scripts.query_opentargets import get_disease_info
disease_info = get_disease_info("EFO_0000249", include_targets=True)
# 访问字段:
# - name: 疾病名称
# - description: 疾病描述
# - therapeuticAreas: 高层级疾病类别
# - associatedTargets: 顶级目标及关联评分
4. 检索目标-疾病证据
获取支持目标-疾病关联的详细证据。
from scripts.query_opentargets import get_target_disease_evidence
# 获取所有证据
evidence = get_target_disease_evidence(
ensembl_id="ENSG00000157764",
efo_id="EFO_0000249"
)
# 按证据类型筛选
genetic_evidence = get_target_disease_evidence(
ensembl_id="ENSG00000157764",
efo_id="EFO_0000249",
data_types=["genetic_association"]
)
# 每条证据记录包含:
# - datasourceId: 特定数据源(例如,"gwas_catalog", "chembl")
# - datatypeId: 证据类别(例如,"genetic_association", "known_drug")
# - score: 证据强度(0-1)
# - studyId: 原始研究标识符
# - literature: 相关出版物
主要证据类型:
- genetic_association: GWAS、罕见变异、ClinVar、基因负担
- somatic_mutation: 癌症基因普查、IntOGen、癌症生物标志物
- known_drug: 来自获批/临床药物的临床先例
- affected_pathway: CRISPR筛选、通路分析、基因签名
- rna_expression: 表达图谱的差异表达
- animal_model: IMPC的小鼠表型
- literature: 来自Europe PMC的文本挖掘
参考 references/evidence_types.md 获取所有证据类型的详细描述和解释指南。
5. 查找已知药物
识别用于疾病的药物及其靶点。
from scripts.query_opentargets import get_known_drugs_for_disease
drugs = get_known_drugs_for_disease("EFO_0000249")
# drugs 包含:
# - uniqueDrugs: 唯一药物总数
# - uniqueTargets: 唯一靶点总数
# - rows: 药物-靶点-适应症记录列表,包括:
# - drug: {name, drugType, maximumClinicalTrialPhase}
# - targets: 药物靶向的基因
# - phase: 该适应症的临床试验阶段
# - status: 试验状态(活跃、完成等)
# - mechanismOfAction: 药物作用机制
临床试验阶段:
- 阶段 4: 获批药物
- 阶段 3: 后期临床试验
- 阶段 2: 中期试验
- 阶段 1: 早期安全性试验
6. 获取药物信息
检索详细的药物信息,包括机制和适应症。
from scripts.query_opentargets import get_drug_info
drug_info = get_drug_info("CHEMBL25")
# 访问:
# - name, synonyms: 药物标识符
# - drugType: 小分子、抗体等
# - maximumClinicalTrialPhase: 开发阶段
# - mechanismsOfAction: 靶点和作用类型
# - indications: 疾病及试验阶段
# - withdrawnNotice: 如已撤回,原因和国家
7. 获取目标的所有关联
查找与目标关联的所有疾病,可选项按评分筛选。
from scripts.query_opentargets import get_target_associations
# 获取评分 >= 0.5 的关联
associations = get_target_associations(
ensembl_id="ENSG00000157764",
min_score=0.5
)
# 每个关联包含:
# - disease: {id, name}
# - score: 总体关联评分(0-1)
# - datatypeScores: 按证据类型的细分
关联评分:
- 范围: 0-1(越高表示证据越强)
- 使用谐波和聚合所有数据类型的证据
- 非置信评分,而是相对排名指标
- 研究不足的疾病可能评分较低,尽管证据良好
GraphQL API 详情
对于超出提供辅助函数的自定义查询,直接使用GraphQL API或修改 scripts/query_opentargets.py。
关键信息:
- 端点:
https://api.platform.opentargets.org/api/v4/graphql - 交互式浏览器:
https://api.platform.opentargets.org/api/v4/graphql/browser - 无需认证
- 仅请求所需字段 以最小化响应大小
- 使用分页 处理大型结果集:
page: {size: N, index: M}
参考 references/api_reference.md 获取:
- 完整端点文档
- 所有实体类型的示例查询
- 错误处理模式
- API使用最佳实践
最佳实践
靶点优先化策略
在优先化药物靶点时:
- 从遗传证据开始: 人类遗传学(GWAS、罕见变异)提供最强的疾病相关性
- 检查可追溯性: 偏好具有临床或发现先例的靶点
- 评估安全性: 审查安全责任、表达模式和遗传约束
- 评估临床先例: 已知药物表示可药性和治疗窗口
- 考虑多种证据类型: 不同来源的汇聚证据增加信心
- 机制验证: 通路证据和生物学合理性
- 手动查阅文献: 对于关键决策,检查主要出版物
证据解释
强证据指标:
- 多个独立证据来源
- 高遗传关联评分(尤其是GWAS L2G > 0.5)
- 来自获批药物的临床先例
- ClinVar致病性变异与疾病匹配
- 小鼠模型具有相关表型
警示标志:
- 仅单一证据来源
- 文本挖掘作为唯一证据(需要手动验证)
- 不同来源的冲突证据
- 高必要性 + 普遍表达(较差治疗窗口)
- 多个安全责任
评分解释:
- 评分排名相对强度,非绝对置信
- 研究不足的疾病评分较低,尽管可能有有效靶点
- 权重专家策展来源高于计算预测
- 检查证据细分,而不仅是总体评分
常见工作流
工作流 1: 疾病靶点发现
- 搜索疾病 → 获取EFO ID
- 查询疾病信息,使用
include_targets=True - 审查按关联评分排序的顶级靶点
- 对于有前景的靶点,获取详细目标信息
- 检查支持每个关联的证据类型
- 评估优先化靶点的可追溯性和安全性
工作流 2: 靶点验证
- 搜索靶点 → 获取Ensembl ID
- 获取全面的目标信息
- 检查可追溯性(尤其是临床先例)
- 审查安全责任和遗传约束
- 检查疾病关联以了解生物学
- 寻找化学探针或工具化合物
- 检查靶向基因的已知药物以获取机制见解
工作流 3: 药物重定位
- 搜索疾病 → 获取EFO ID
- 获取疾病的已知药物
- 对于每种药物,获取详细的药物信息
- 检查作用机制和靶点
- 寻找相关疾病适应症
- 评估临床试验阶段和状态
- 基于机制识别重定位机会
工作流 4: 竞争情报
- 搜索感兴趣的目标
- 获取关联疾病及证据
- 对于每种疾病,获取已知药物
- 审查临床阶段和开发现状
- 识别竞争对手及其机制
- 评估临床先例和市场格局
资源
脚本
scripts/query_opentargets.py 常见API操作的辅助函数:
search_entities()- 搜索目标、疾病或药物get_target_info()- 检索目标注释get_disease_info()- 检索疾病信息get_target_disease_evidence()- 获取支持证据get_known_drugs_for_disease()- 查找疾病的药物get_drug_info()- 检索药物详情get_target_associations()- 获取目标的所有关联execute_query()- 执行自定义GraphQL查询
参考资料
references/api_reference.md 完整的GraphQL API文档包括:
- 端点详情和认证
- 可用的查询类型(目标、疾病、药物、搜索)
- 所有常见操作的示例查询
- 错误处理和最佳实践
- 数据许可和引用要求
references/evidence_types.md 证据类型和数据源的全面指南:
- 所有7种主要证据类型的详细描述
- 每个来源的评分方法
- 证据解释指南
- 每种证据类型的优势和局限性
- 质量评估建议
references/target_annotations.md 完整的目标注释参考:
- 12种主要注释类别解释
- 可追溯性评估详情
- 安全责任来源
- 表达、必要性和约束数据
- 靶点优先化解释指南
- 靶点评估的红旗和绿旗
数据更新和版本控制
开放靶点平台 每季度 更新一次新数据发布。当前发布(截至2025年10月)可在API端点获取。
发布信息: 查看 https://platform-docs.opentargets.org/release-notes 获取最新更新。
引用: 使用开放靶点数据时,请引用: Ochoa, D. et al. (2025) Open Targets Platform: facilitating therapeutic hypotheses building in drug discovery. Nucleic Acids Research, 53(D1):D1467-D1477.
限制和考虑
- API用于探索性查询: 对于许多目标/疾病的系统分析,使用数据下载或BigQuery
- 评分是相对的,非绝对的: 关联评分排名证据强度,但未预测临床成功
- 研究不足的疾病评分较低: 新颖或罕见疾病可能有强证据但总评分较低
- 证据质量各异: 权重专家策展来源高于计算预测
- 需要生物学解释: 评分和证据必须在生物学和临床背景下解释
- 无需认证: 所有数据可自由访问,但请适当引用