名称: 开放靶点数据库描述: “查询开放靶点平台，获取目标-疾病关联、药物靶点发现、可追溯性/安全数据、遗传/组学证据、已知药物信息，用于治疗靶点识别。”

开放靶点数据库

概述

开放靶点平台是一个综合性资源，用于系统性地识别和优先化潜在的治疗药物靶点。它整合了公开可用的数据集，包括人类遗传学、组学、文献和化学数据，以构建和评分目标-疾病关联。

核心功能:

查询目标（基因）注释，包括可追溯性、安全性、表达
搜索疾病-目标关联及证据评分
从多种数据类型（遗传学、通路、文献等）检索证据
查找疾病的已知药物及其机制
访问药物信息，包括临床试验阶段和不良事件
评估靶点可药性和治疗潜力

数据访问: 平台提供GraphQL API、Web界面、数据下载和Google BigQuery访问。本技能专注于GraphQL API的程序化访问。

使用时机

此技能应在以下情况下使用：

靶点发现: 寻找疾病的潜在治疗靶点
靶点评估: 评估基因的可追溯性、安全性和可药性
证据收集: 检索目标-疾病关联的支持证据
药物重定位: 识别现有药物用于新适应症
竞争情报: 了解临床先例和药物开发现状
靶点优先化: 基于遗传证据和其他数据类型对靶点进行排序
机制研究: 调查生物通路和基因功能
生物标志物发现: 发现疾病中差异表达的基因
安全评估: 识别药物靶点的潜在毒性问题

核心工作流

1. 搜索实体

首先找到感兴趣的目标、疾病或药物的标识符。

对于目标（基因）:

from scripts.query_opentargets import search_entities

# 通过基因符号或名称搜索
results = search_entities("BRCA1", entity_types=["target"])
# 返回: [{"id": "ENSG00000012048", "name": "BRCA1", ...}]

对于疾病:

# 通过疾病名称搜索
results = search_entities("alzheimer", entity_types=["disease"])
# 返回: [{"id": "EFO_0000249", "name": "Alzheimer disease", ...}]

对于药物:

# 通过药物名称搜索
results = search_entities("aspirin", entity_types=["drug"])
# 返回: [{"id": "CHEMBL25", "name": "ASPIRIN", ...}]

使用的标识符:

目标: Ensembl基因ID（例如，ENSG00000157764）
疾病: EFO（实验因子本体）ID（例如，EFO_0000249）
药物: ChEMBL ID（例如，CHEMBL25）

2. 查询目标信息

检索全面的目标注释以评估可药性和生物学特性。

from scripts.query_opentargets import get_target_info

target_info = get_target_info("ENSG00000157764", include_diseases=True)

# 访问关键字段:
# - approvedSymbol: HGNC基因符号
# - approvedName: 完整基因名称
# - tractability: 跨模态的可药性评估
# - safetyLiabilities: 已知的安全问题
# - geneticConstraint: gnomAD的约束评分
# - associatedDiseases: 顶级疾病关联及评分

关键注释查看:

可追溯性: 小分子、抗体、PROTAC可药性预测
安全性: 来自多个数据库的已知毒性问题
遗传约束: pLI和LOEUF评分表示必要性
疾病关联: 与目标关联的疾病及证据评分

参考 references/target_annotations.md 获取所有目标特征的详细信息。

3. 查询疾病信息

获取疾病详情及关联的目标/药物。

from scripts.query_opentargets import get_disease_info

disease_info = get_disease_info("EFO_0000249", include_targets=True)

# 访问字段:
# - name: 疾病名称
# - description: 疾病描述
# - therapeuticAreas: 高层级疾病类别
# - associatedTargets: 顶级目标及关联评分

4. 检索目标-疾病证据

获取支持目标-疾病关联的详细证据。

from scripts.query_opentargets import get_target_disease_evidence

# 获取所有证据
evidence = get_target_disease_evidence(
    ensembl_id="ENSG00000157764",
    efo_id="EFO_0000249"
)

# 按证据类型筛选
genetic_evidence = get_target_disease_evidence(
    ensembl_id="ENSG00000157764",
    efo_id="EFO_0000249",
    data_types=["genetic_association"]
)

# 每条证据记录包含:
# - datasourceId: 特定数据源（例如，"gwas_catalog", "chembl"）
# - datatypeId: 证据类别（例如，"genetic_association", "known_drug"）
# - score: 证据强度（0-1）
# - studyId: 原始研究标识符
# - literature: 相关出版物

主要证据类型:

genetic_association: GWAS、罕见变异、ClinVar、基因负担
somatic_mutation: 癌症基因普查、IntOGen、癌症生物标志物
known_drug: 来自获批/临床药物的临床先例
affected_pathway: CRISPR筛选、通路分析、基因签名
rna_expression: 表达图谱的差异表达
animal_model: IMPC的小鼠表型
literature: 来自Europe PMC的文本挖掘

参考 references/evidence_types.md 获取所有证据类型的详细描述和解释指南。

5. 查找已知药物

识别用于疾病的药物及其靶点。

from scripts.query_opentargets import get_known_drugs_for_disease

drugs = get_known_drugs_for_disease("EFO_0000249")

# drugs 包含:
# - uniqueDrugs: 唯一药物总数
# - uniqueTargets: 唯一靶点总数
# - rows: 药物-靶点-适应症记录列表，包括:
#   - drug: {name, drugType, maximumClinicalTrialPhase}
#   - targets: 药物靶向的基因
#   - phase: 该适应症的临床试验阶段
#   - status: 试验状态（活跃、完成等）
#   - mechanismOfAction: 药物作用机制

临床试验阶段:

阶段 4: 获批药物
阶段 3: 后期临床试验
阶段 2: 中期试验
阶段 1: 早期安全性试验

6. 获取药物信息

检索详细的药物信息，包括机制和适应症。

from scripts.query_opentargets import get_drug_info

drug_info = get_drug_info("CHEMBL25")

# 访问:
# - name, synonyms: 药物标识符
# - drugType: 小分子、抗体等
# - maximumClinicalTrialPhase: 开发阶段
# - mechanismsOfAction: 靶点和作用类型
# - indications: 疾病及试验阶段
# - withdrawnNotice: 如已撤回，原因和国家

7. 获取目标的所有关联

查找与目标关联的所有疾病，可选项按评分筛选。

from scripts.query_opentargets import get_target_associations

# 获取评分 >= 0.5 的关联
associations = get_target_associations(
    ensembl_id="ENSG00000157764",
    min_score=0.5
)

# 每个关联包含:
# - disease: {id, name}
# - score: 总体关联评分（0-1）
# - datatypeScores: 按证据类型的细分

关联评分:

范围: 0-1（越高表示证据越强）
使用谐波和聚合所有数据类型的证据
非置信评分，而是相对排名指标
研究不足的疾病可能评分较低，尽管证据良好

GraphQL API 详情

对于超出提供辅助函数的自定义查询，直接使用GraphQL API或修改 scripts/query_opentargets.py。

关键信息:

端点: https://api.platform.opentargets.org/api/v4/graphql
交互式浏览器: https://api.platform.opentargets.org/api/v4/graphql/browser
无需认证
仅请求所需字段 以最小化响应大小
使用分页 处理大型结果集: page: {size: N, index: M}

参考 references/api_reference.md 获取:

完整端点文档
所有实体类型的示例查询
错误处理模式
API使用最佳实践

最佳实践

靶点优先化策略

在优先化药物靶点时:

从遗传证据开始: 人类遗传学（GWAS、罕见变异）提供最强的疾病相关性
检查可追溯性: 偏好具有临床或发现先例的靶点
评估安全性: 审查安全责任、表达模式和遗传约束
评估临床先例: 已知药物表示可药性和治疗窗口
考虑多种证据类型: 不同来源的汇聚证据增加信心
机制验证: 通路证据和生物学合理性
手动查阅文献: 对于关键决策，检查主要出版物

证据解释

强证据指标:

多个独立证据来源
高遗传关联评分（尤其是GWAS L2G > 0.5）
来自获批药物的临床先例
ClinVar致病性变异与疾病匹配
小鼠模型具有相关表型

警示标志:

仅单一证据来源
文本挖掘作为唯一证据（需要手动验证）
不同来源的冲突证据
高必要性 + 普遍表达（较差治疗窗口）
多个安全责任

评分解释:

评分排名相对强度，非绝对置信
研究不足的疾病评分较低，尽管可能有有效靶点
权重专家策展来源高于计算预测
检查证据细分，而不仅是总体评分

常见工作流

工作流 1: 疾病靶点发现

搜索疾病 → 获取EFO ID
查询疾病信息，使用 include_targets=True
审查按关联评分排序的顶级靶点
对于有前景的靶点，获取详细目标信息
检查支持每个关联的证据类型
评估优先化靶点的可追溯性和安全性

工作流 2: 靶点验证

搜索靶点 → 获取Ensembl ID
获取全面的目标信息
检查可追溯性（尤其是临床先例）
审查安全责任和遗传约束
检查疾病关联以了解生物学
寻找化学探针或工具化合物
检查靶向基因的已知药物以获取机制见解

工作流 3: 药物重定位

搜索疾病 → 获取EFO ID
获取疾病的已知药物
对于每种药物，获取详细的药物信息
检查作用机制和靶点
寻找相关疾病适应症
评估临床试验阶段和状态
基于机制识别重定位机会

工作流 4: 竞争情报

搜索感兴趣的目标
获取关联疾病及证据
对于每种疾病，获取已知药物
审查临床阶段和开发现状
识别竞争对手及其机制
评估临床先例和市场格局

资源

脚本

scripts/query_opentargets.py 常见API操作的辅助函数:

search_entities() - 搜索目标、疾病或药物
get_target_info() - 检索目标注释
get_disease_info() - 检索疾病信息
get_target_disease_evidence() - 获取支持证据
get_known_drugs_for_disease() - 查找疾病的药物
get_drug_info() - 检索药物详情
get_target_associations() - 获取目标的所有关联
execute_query() - 执行自定义GraphQL查询

参考资料

references/api_reference.md 完整的GraphQL API文档包括:

端点详情和认证
可用的查询类型（目标、疾病、药物、搜索）
所有常见操作的示例查询
错误处理和最佳实践
数据许可和引用要求

references/evidence_types.md 证据类型和数据源的全面指南:

所有7种主要证据类型的详细描述
每个来源的评分方法
证据解释指南
每种证据类型的优势和局限性
质量评估建议

references/target_annotations.md 完整的目标注释参考:

12种主要注释类别解释
可追溯性评估详情
安全责任来源
表达、必要性和约束数据
靶点优先化解释指南
靶点评估的红旗和绿旗

数据更新和版本控制

开放靶点平台 每季度 更新一次新数据发布。当前发布（截至2025年10月）可在API端点获取。

发布信息: 查看 https://platform-docs.opentargets.org/release-notes 获取最新更新。

引用: 使用开放靶点数据时，请引用: Ochoa, D. et al. (2025) Open Targets Platform: facilitating therapeutic hypotheses building in drug discovery. Nucleic Acids Research, 53(D1):D1467-D1477.

限制和考虑

API用于探索性查询: 对于许多目标/疾病的系统分析，使用数据下载或BigQuery
评分是相对的，非绝对的: 关联评分排名证据强度，但未预测临床成功
研究不足的疾病评分较低: 新颖或罕见疾病可能有强证据但总评分较低
证据质量各异: 权重专家策展来源高于计算预测
需要生物学解释: 评分和证据必须在生物学和临床背景下解释
无需认证: 所有数据可自由访问，但请适当引用

名称: 开放靶点数据库 描述: “查询开放靶点平台，获取目标-疾病关联、药物靶点发现、可追溯性/安全数据、遗传/组学证据、已知药物信息，用于治疗靶点识别。”