系统性研究技能Skill research

这个技能用于帮助用户系统地进行研究,包括分析主题、扩展查询、诊断研究质量,并指导完成研究过程。适用于信息检索、查询优化和知识管理场景,提升研究的全面性和准确性。关键词:研究、查询扩展、诊断、系统性、质量评估、信息检索、知识管理。

文献检索 0 次安装 0 次浏览 更新于 3/9/2026

名称: 研究 描述: 诊断研究质量并指导系统性查询扩展。在开始研究任何主题时、研究受阻时或不确定研究是否完成时使用。 许可证: MIT 元数据: 作者: jwynia 版本: “1.0” 领域: 研究 集群: 方法论

研究技能

系统性研究查询扩展与完成评估。将基本问题转化为全面的搜索策略。

诊断状态

R1: 无分析

症状: 直接开始搜索而不分析主题。 测试: 你能清晰表达利益相关者、时间范围和领域映射吗? 干预: 在生成查询之前运行第0阶段分析模板。

R1.5: 无词汇映射

症状: 使用外行或入门级术语。只找到表面材料。 测试: 你识别了专家与外行术语吗?跨领域术语? 干预: 构建词汇映射。在早期来源中寻找“也称为”、“技术术语”。

R2: 单视角搜索

症状: 所有查询支持一个观点。缺失反驳观点。 测试: 你明确搜索了相反视角吗? 干预: 生成竞争视角查询。搜索最强反驳论点。

R3: 领域盲点

症状: 只在熟悉领域搜索。缺失跨学科见解。 测试: 你映射了跨领域的术语变体吗? 干预: 识别相邻领域对此主题的称呼。在至少2个领域搜索。更新词汇映射。

R4: 近期偏见

症状: 只有近期来源。缺失历史背景。 测试: 你能解释这个主题何时出现及如何演变吗? 干预: 添加历史背景查询。找到开创性著作。

R5: 广度无深度

症状: 许多标签,无合成。无法解释核心概念。 测试: 你能用自己的话定义关键术语吗? 干预: 每个视角应用3来源规则。在搜索更多之前总结。

R6: 完成不确定性

症状: 不确定继续还是停止。研究无限扩展。 测试: 你能回答分层完成标准吗? 干预: 运行完成检查清单。寻找收益递减信号。

R7: 研究完成

症状: 能解释主题、识别不确定性并采取行动。 指标: 循环引用、重复发现、足够用于目的。

R8: 无持久性

症状: 每次会话从头开始。重新发现相同词汇。 测试: 你在开始前检查了先前研究吗?你在存储发现吗? 干预: 存储词汇映射、来源、消化笔记和空白供未来使用。

R9: 范围不匹配

症状: 过度研究琐碎问题。不足研究关键决策。 测试: 研究深度与决策风险成比例吗? 干预: 应用范围校准。将置信水平匹配到决策可逆性和风险。

R10: 无置信信号

症状: 到处使用模棱两可的语言。读者无法区分确定与推测。 测试: 读者能区分既定事实与推测吗? 干预: 使用明确置信标记。说明来源质量和共识状态。

第0阶段: 分析模板

搜索前,结构化你的主题:

# 研究分析: [主题]

## 核心概念
- **主要术语:** [需要定义的关键术语]
- **术语变体:** [同义词、行话、历史术语]
- **模糊术语:** [有多个含义的术语]

## 利益相关者
- **主要参与者:** [谁直接参与?]
- **受影响群体:** [谁承担后果?]
- **对立利益:** [谁从不同结果中受益?]

## 时间范围
- **历史起源:** [何时开始?]
- **关键转变:** [何时及何事改变了?]
- **当前状态:** [现在发生什么?]

## 领域
- **主要领域:** [主要学科]
- **相邻领域:** [相关学科]

## 争议
- **活跃辩论:** [什么有争议?]
- **竞争框架:** [不同的理解方式]

查询类型

  1. 基础性: “术语定义 AND 领域综述”
  2. 历史性: “主题历史发展 [日期范围]”
  3. 当前性: “主题当前趋势 [近年]”
  4. 竞争性: “主题辩论 AND (视角1 OR 视角2)”
  5. 证据性: “主题影响测量研究数据”

完成标准

最低可行(快速决策)

  • [ ] 能用自己话定义核心概念
  • [ ] 知道2-3个主要视角
  • [ ] 每个视角找到权威来源
  • [ ] 识别了已知未知

工作知识(大多数决策)

  • [ ] 能解释历史背景
  • [ ] 理解利益相关者立场
  • [ ] 遇到反驳论点
  • [ ] 检查多个领域

深度专业知识(高风险)

  • [ ] 追踪主张到主要来源
  • [ ] 能评估竞争证据
  • [ ] 理解知识限制

收益递减信号

停止当:

  • 新来源引用相同基础著作(循环)
  • 新搜索返回熟悉内容(重复)
  • 每小时增加少于先前(边际)
  • 能做出决策或采取行动(足够)

反模式

模式 症状 修复
确认陷阱 搜索以确认,非学习 搜索最强反驳论点
权威谬误 接受来源声望的声称 评估证据,非来源
近期陷阱 只有近期来源 明确搜索历史时期
广度陷阱 50标签,无一阅读 3来源规则,继续前总结
单来源 维基百科作为最终答案 需要3个独立来源
行话盲点 缺失其他领域术语 映射变体,搜索多个领域
无限兔子洞 迷失原始目的 写决策/行动锚点,返回

词汇映射

主要研究交付物。 词汇决定搜索空间和LLM语义激活。

为何重要

  • 专家术语 → 专家材料。外行术语 → 入门材料。
  • 精确词汇激活更丰富的LLM语义空间。
  • 跨领域术语连接使用不同名称的工作体。

词汇映射模板

## 核心术语
| 术语 | 领域 | 深度级别 |
|------|--------|-------------|
| [专家术语] | [领域] | 专家 |
| [外行术语] | 通用 | 入门 |

## 跨领域同义词
| 概念 | 按领域术语 |
|---------|-----------------|
| [概念] | 领域A: [术语], 领域B: [术语] |

## 深度指标
| 级别 | 术语 | 它们浮现什么 |
|-------|-------|-------------------|
| 入门 | [术语] | 概述、解释器 |
| 专家 | [术语] | 研究、细致分析 |

发现过程

  1. 注意哪些术语感觉像外行语言
  2. 在早期来源中,留意“也称为”、“技术术语”
  3. 映射跨领域术语
  4. 在搜索中测试不同术语,注意浮现内容

研究持久性

存储来源和消化结果。 不要从头开始。

存储什么

内容
词汇映射 术语、领域、深度级别
来源 PDF、保存页面、书签
消化笔记 摘要、关键引用、合成
查询日志 有效/失败的搜索
空白 仍未知的内容

开始前

检查先前研究。加载词汇映射。从上次停止处开始。

单次研究

当研究没有后续问题运行时(代理执行、时间框查询):

范围校准

决策类型 所需置信 研究深度
可逆,低风险 60-70% 快速扫描(分钟)
可逆,中等 75-85% 工作知识(1-2小时)
不可逆,中等 85-90% 坚实基础(半天)
不可逆,高 90-95% 深度专业知识(天)

问题模式 → 策略

模式 策略
“什么是X?” 2-3个权威来源,建立共识
“我应该X吗?” 利弊、替代方案、每个条件
“X是真的吗?” 主要来源、反驳证据、共识检查
“如何做X?” 分步、先决条件、常见陷阱

来源类型选择

来源 最适合
维基百科/百科全书 定向、术语、引用猎取
学术论文 机制、因果关系、方法论
实践者内容 实际如何工作、边缘案例
官方文档 技术规格、政策、程序

合成模板

## 摘要
[直接回答问题]

## 置信水平
[高/中/低] - [理由]

## 关键发现
1. [发现与来源类型]

## 注意事项
- [未咨询的内容]
- [做出的假设]

## 进一步调查
[什么会增加置信]

置信标记

级别 短语
既定 “X是…”、“X通过…工作”
强证据 “证据强烈表明…”
中等证据 “大多数来源报告…”
有限证据 “一项研究发现…”
未知 “未找到可靠信息…”

单次检查清单

  • [ ] 范围匹配风险?
  • [ ] 咨询多个来源类型?
  • [ ] 寻求反驳证据?
  • [ ] 置信水平明确?
  • [ ] 空白承认?

健康检查问题

研究中,问:

  1. 我是搜索以学习还是以确认?
  2. 针对我当前观点的最强论点是什么?
  3. 我查看了熟悉领域之外吗?
  4. 我能总结到目前为止学到的内容吗?
  5. 这仍在服务我的原始目的吗?
  6. 我使用专家还是外行词汇?
  7. 我存储了学到的内容供未来使用吗?
  8. 我的深度与风险成比例吗?
  9. 我明确发出置信信号吗?

整合点

技能 连接
替身 研究告知决策;对发现应用/真相检查
上下文网络 在研究网络节点中存储发现
边界批判 应用于遇到的建议和推荐

输出持久性

此技能将主要输出写入文件,以便工作跨会话持久。

输出发现

在进行任何其他工作前:

  1. 检查项目中的context/output-config.md
  2. 如果找到,查找此技能的条目
  3. 如果未找到或此技能无条目,首先询问用户:
    • “我应该在哪里保存此研究会话的输出?”
    • 建议:explorations/research/或此项目的合理位置
  4. 存储用户偏好:
    • 如果上下文网络存在,在context/output-config.md
    • 否则,在项目根目录的.research-output.md

主要输出

对于此技能,持久化:

  • 词汇映射 - 术语、领域、深度级别、跨领域同义词
  • 第0阶段分析 - 核心概念、利益相关者、时间范围、领域
  • 合成文档 - 摘要、置信水平、关键发现、注意事项
  • 来源评估 - 咨询的来源及质量注释
  • 识别空白 - 仍未知的内容、后续步骤

对话 vs. 文件

到文件 留在对话
词汇映射 术语发现讨论
合成文档 查询细化迭代
带评估的来源列表 实时来源评估
空白分析 澄清问题
带置信标记的发现 后续调查

文件命名

模式: {主题}-研究-{日期}.md 示例: 能力框架-研究-2025-01-15.md

与研究持久性部分的关系

上文的“研究持久性”部分描述了存储什么。此部分操作化何处和如何 - 确保技能检查配置位置,需要时询问用户,并一致地写入输出。

来源框架

源自: frameworks/research/research-framework.md