名称：领域研究-健康科学描述：用于制定临床研究问题（PICOT框架）、评估健康证据质量（研究设计层级、偏倚评估、GRADE）、优先考虑患者重要结局、进行系统评价或meta分析、为指南创建证据总结、评估监管证据，或当用户提到临床试验、循证医学、健康研究方法论、系统评价、研究方案或研究质量评估时。

领域研究：健康科学

目的

这个技能帮助使用循证医学框架结构化临床和健康科学研究。它指导您制定精确研究问题（PICOT）、评估研究质量（证据层级、偏倚评估、GRADE）、优先考虑结局（患者重要结局 vs 替代终点），并为临床决策合成证据。

何时使用

在以下情况使用此技能：

制定研究问题：使用P ICO T（人群、干预、对照、结局、时间框架）结构化临床问题
评估证据质量：评估研究设计强度、风险偏倚、证据确定性（GRADE框架）
优先考虑结局：区分患者重要结局与替代终点，创建结局层级
系统评价：计划或进行系统评价、meta分析或证据合成
临床指南：为实践指南或决策支持创建证据总结
试验设计：设计RCT、实用试验或具有严格方法学的观察性研究
监管提交：为药物/设备批准或报销决策准备证据档案
批判性评价：评估已发表研究的临床适用性和方法学质量

触发短语：“临床试验设计”、“系统评价”、“PICOT问题”、“证据质量”、“偏倚评估”、“GRADE”、“结局测量”、“研究方案”、“证据合成”、“研究评价”

是什么？

领域研究：健康科学应用循证医学的结构化框架，确保临床研究制定完善、方法学合理且临床有意义。

快速示例：

模糊问题：“这种药物对心脏病有效吗？”

PICOT结构化问题：

P（人群）：>65岁心力衰竭伴射血分数降低的成人
I（干预）：SGLT2抑制剂（达格列净10mg每日）
C（对照）：标准护理（ACE抑制剂+β阻滞剂）
O（结局）：全因死亡率（主要）；住院率、生活质量（次要）
T（时间框架）：12个月随访

结果：精确、可回答的研究问题，指导研究设计、文献检索和结局选择。

工作流程

复制此清单并跟踪进度：

健康研究进度：
- [ ] 步骤1：制定研究问题（PICOT）
- [ ] 步骤2：评估证据层级和研究设计
- [ ] 步骤3：评估研究质量和偏倚
- [ ] 步骤4：优先考虑并定义结局
- [ ] 步骤5：合成证据并分级确定性
- [ ] 步骤6：创建决策就绪总结

步骤1：制定研究问题（PICOT）

使用PICOT框架结构化可回答的临床问题。定义人群（人口统计学、条件、设置）、干预（治疗、暴露、诊断测试）、对照（替代治疗、安慰剂、标准护理）、结局（患者重要终点）和时间框架（随访持续时间）。参见resources/template.md获取结构化模板。

步骤2：评估证据层级和研究设计

基于研究问题类型确定适当研究设计（治疗：RCT；诊断：横断面；预后：队列；危害：病例对照或队列）。理解证据层级（系统评价 > RCT > 队列 > 病例对照 > 病例系列）。参见resources/methodology.md获取设计选择指导。

步骤3：评估研究质量和偏倚

应用风险偏倚评估工具（Cochrane RoB 2用于RCT、ROBINS-I用于观察性研究、QUADAS-2用于诊断准确性）。评估随机化、盲法、分配隐藏、不完整结局数据、选择性报告。参见resources/methodology.md获取详细标准。

步骤4：优先考虑并定义结局

区分患者重要结局（死亡率、症状、生活质量、功能）与替代终点（生物标志物、实验室值）。创建结局层级：关键（驱动决策）、重要（告知决策）、不重要。定义测量工具和最小临床重要差异（MCID）。参见resources/template.md获取优先排序框架。

步骤5：合成证据并分级确定性

应用GRADE（推荐分级评估、发展和评价）对证据确定性进行评级（高、中、低、非常低）。考虑研究局限性、不一致性、间接性、不精确性、发表偏倚。如有大效应、剂量反应或减少效应的混杂因素则升级。参见resources/methodology.md获取评级指导。

步骤6：创建决策就绪总结

生成证据概况或发现总结表，将结局链接到确定性评级和效应估计。包括临床解释、适用性评估和证据空白。使用resources/evaluators/rubric_domain_research_health_science.json验证。最低标准：平均得分 ≥ 3.5。

常见模式

模式1：治疗/干预问题

PICOT：具有条件的成人 → 新治疗 vs 标准护理 → 患者重要结局 → 随访期
研究设计：首选RCT（因果关系最高质量）；RCT系统评价用于合成
关键结局：死亡率、发病率、生活质量、不良事件
偏倚评估：Cochrane RoB 2（随机化、盲法、流失、选择性报告）
示例：SGLT2抑制剂用于心力衰竭 → 降低死亡率（GRADE：高确定性）

模式2：诊断测试准确性

PICOT：疑似条件患者 → 新测试 vs 参考标准 → 敏感性/特异性 → 横断面
研究设计：连续入组的横断面研究；避免病例对照（夸大准确性）
关键结局：敏感性、特异性、阳性/阴性预测值、似然比
偏倚评估：QUADAS-2（患者选择、索引测试、参考标准、流程和时间）
示例：高敏肌钙蛋白用于心肌梗死 → 敏感性95%，特异性92%（GRADE：中确定性）

模式3：预后/风险预测

PICOT：具有条件/暴露的人群 → 风险因素 → 结局（死亡、疾病进展） → 长期随访
研究设计：前瞻性队列（从暴露到结局跟踪）；避免回顾性（回忆偏倚）
关键结局：发病率、风险比、绝对风险、风险预测模型性能（C统计量、校准）
偏倚评估：ROBINS-I或PROBAST（用于预测模型）
示例：弗莱明汉风险评分用于心血管疾病 → C统计量0.76（中歧视度）

模式4：危害/安全性评估

PICOT：暴露于干预的人群 → 不良事件 → 罕见/延迟危害的时间框架
研究设计：RCT用于常见危害；观察性（队列、病例对照）用于罕见危害（更大样本、更长随访）
关键结局：严重不良事件、停药、器官特异性毒性、长期安全性
偏倚评估：罕见与常见危害不同；观察性研究中考虑适应症混杂
示例：NSAID心血管风险 → 观察性研究显示心肌梗死风险增加（GRADE：低确定性因混杂）

模式5：系统评价/meta分析

PICOT：在方案中定义；指导搜索策略、纳入标准、结局提取
研究设计：全面搜索、明确资格标准、重复筛选/提取、偏倚评估、定量合成（如果合适）
关键结局：合并效应估计（RR、OR、MD、SMD）、异质性（I²）、确定性评级（GRADE）
偏倚评估：个体研究RoB + 评价级别评估（AMSTAR 2用于评价质量）
示例：他汀用于一级预防 → MI的RR 0.75（95% CI 0.70-0.80, I²=12%, GRADE：高确定性）

护栏

关键要求：

为所有临床问题使用PICOT：模糊问题导致研究不集中。始终明确指定人群、干预、对照、结局、时间框架。避免“X有效吗？”而不定义对象、对比和测量结局。
匹配研究设计与问题类型：RCT回答治疗问题（因果推理）。队列研究回答预后。横断面研究回答诊断。病例对照研究回答罕见危害或病因学。不要声称观察性数据的因果关系或使用病例系列处理治疗效果。
优先考虑患者重要结局而非替代终点：替代终点（生物标志物、实验室值）不总是与患者结局相关。聚焦死亡率、发病率、症状、功能、生活质量。仅在验证与患者结局关系时使用替代终点。
系统而非非正式评估偏倚：使用验证工具（Cochrane RoB 2、ROBINS-I、QUADAS-2）而非主观判断。偏倚评估影响证据确定性和临床建议。常见偏倚：选择偏倚、表现偏倚（缺乏盲法）、检测偏倚、流失偏倚、报告偏倚。
应用GRADE评级证据确定性：不要混淆研究设计与确定性。RCT起始为高确定性但可降级（严重局限性、不一致性、间接性、不精确性、发表偏倚）。观察性研究起始为低但可升级（大效应、剂量反应、残余混杂减少效应）。
区分统计显著性与临床重要性：p < 0.05不代表临床有意义。考虑最小临床重要差异（MCID）、绝对风险降低、需要治疗人数（NNT）。小p值但小效应量具有统计显著性但临床无关。
评估外部有效性和适用性：来自选定试验人群的证据可能不适用于您的患者。考虑PICO匹配（您的患者是否相似？）、设置差异（三级中心vs社区）、干预可行性、患者价值观和偏好。
明确说明局限性和确定性：所有证据都有局限性。指定不确定之处、证据空白存在之处以及这如何影响建议信心。避免过度自信主张，证据质量不支持。

常见陷阱：

❌ 将所有RCT视为高质量：RCT可能有严重偏倚（随机化不充分、未设盲、高流失）。始终评估偏倚。
❌ 忽略meta分析中的异质性：高I²（>50%）表明研究间重要差异。在合并前探索来源（人群、干预、结局定义）。
❌ 混淆关联与因果关系：观察性研究显示关联，非因果关系。残余混杂总是可能。
❌ 不加批判地使用复合结局：复合终点（如“死亡或MI或住院”）掩盖哪个成分驱动效应。分开报告成分。
❌ 不加批判地接受行业资助证据：制药/设备公司赞助的试验可能有偏倚（结局选择、选择性报告）。评估利益冲突。
❌ 过度解释亚组分析：大多数亚组效应是偶然发现。仅在预指定、统计测试交互作用且生物合理时才可信。

快速参考

关键资源：

resources/template.md：PICOT框架、结局层级模板、证据表、GRADE总结模板
resources/methodology.md：证据层级、偏倚评估工具、GRADE详细指导、研究设计选择、系统评价方法
resources/evaluators/rubric_domain_research_health_science.json：研究问题、证据合成和临床解释的质量标准

PICOT模板：

P（人群）：[谁？年龄、性别、条件、严重程度、设置]
I（干预）：[什么？药物、程序、测试、暴露 - 剂量、持续时间、途径]
C（对照）：[与什么比较？安慰剂、标准护理、替代治疗]
O（结局）：[什么重要？死亡率、症状、生活质量、危害 - 测量工具、时间点]
T（时间框架）：[多久？随访持续时间、到达结局时间]

证据层级（治疗问题）：

RCT的系统评价/meta分析
个体RCT（大型、设计良好）
队列研究（前瞻性）
病例对照研究
病例系列、病例报告
专家意见、病理生理学原理

GRADE确定性评级：

高（⊕⊕⊕⊕）：非常确信真实效应接近估计效应
中（⊕⊕⊕○）：中度确信，真实效应可能接近但可能显著不同
低（⊕⊕○○）：有限信心，真实效应可能显著不同
非常低（⊕○○○）：很少信心，真实效应可能显著不同

典型工作流程时间：

PICOT制定：10-15分钟
单个研究批判性评价：20-30分钟
系统评价方案：2-4小时
带GRADE的证据合成：1-2小时
完整系统评价：40-100小时（取决于范围）

何时升级：

复杂统计meta分析（网络meta分析、IPD meta分析）
高级因果推理方法（工具变量、倾向评分）
卫生技术评估（成本效益、预算影响）
指南开发小组（需要多利益相关方共识） → 咨询生物统计学家、卫生经济学家或指南方法论学家

所需输入：

研究问题（临床场景或决策问题）
证据来源（评估的研究、系统评价数据库）
结局偏好（哪些结局对患者/临床医生最重要）
背景（设置、患者人群、决策紧迫性）

产出：

domain-research-health-science.md：结构化研究问题、证据评价、结局层级、确定性评估、临床解释

健康科学研究方法论技能Skill domain-research-health-science