名称: 研究 描述: 诊断研究质量并指导系统性查询扩展。在开始研究任何主题时、研究受阻时或不确定研究是否完成时使用。 许可证: MIT 元数据: 作者: jwynia 版本: “1.0” 领域: 研究 集群: 方法论
研究技能
系统性研究查询扩展与完成评估。将基本问题转化为全面的搜索策略。
诊断状态
R1: 无分析
症状: 直接开始搜索而不分析主题。 测试: 你能清晰表达利益相关者、时间范围和领域映射吗? 干预: 在生成查询之前运行第0阶段分析模板。
R1.5: 无词汇映射
症状: 使用外行或入门级术语。只找到表面材料。 测试: 你识别了专家与外行术语吗?跨领域术语? 干预: 构建词汇映射。在早期来源中寻找“也称为”、“技术术语”。
R2: 单视角搜索
症状: 所有查询支持一个观点。缺失反驳观点。 测试: 你明确搜索了相反视角吗? 干预: 生成竞争视角查询。搜索最强反驳论点。
R3: 领域盲点
症状: 只在熟悉领域搜索。缺失跨学科见解。 测试: 你映射了跨领域的术语变体吗? 干预: 识别相邻领域对此主题的称呼。在至少2个领域搜索。更新词汇映射。
R4: 近期偏见
症状: 只有近期来源。缺失历史背景。 测试: 你能解释这个主题何时出现及如何演变吗? 干预: 添加历史背景查询。找到开创性著作。
R5: 广度无深度
症状: 许多标签,无合成。无法解释核心概念。 测试: 你能用自己的话定义关键术语吗? 干预: 每个视角应用3来源规则。在搜索更多之前总结。
R6: 完成不确定性
症状: 不确定继续还是停止。研究无限扩展。 测试: 你能回答分层完成标准吗? 干预: 运行完成检查清单。寻找收益递减信号。
R7: 研究完成
症状: 能解释主题、识别不确定性并采取行动。 指标: 循环引用、重复发现、足够用于目的。
R8: 无持久性
症状: 每次会话从头开始。重新发现相同词汇。 测试: 你在开始前检查了先前研究吗?你在存储发现吗? 干预: 存储词汇映射、来源、消化笔记和空白供未来使用。
R9: 范围不匹配
症状: 过度研究琐碎问题。不足研究关键决策。 测试: 研究深度与决策风险成比例吗? 干预: 应用范围校准。将置信水平匹配到决策可逆性和风险。
R10: 无置信信号
症状: 到处使用模棱两可的语言。读者无法区分确定与推测。 测试: 读者能区分既定事实与推测吗? 干预: 使用明确置信标记。说明来源质量和共识状态。
第0阶段: 分析模板
搜索前,结构化你的主题:
# 研究分析: [主题]
## 核心概念
- **主要术语:** [需要定义的关键术语]
- **术语变体:** [同义词、行话、历史术语]
- **模糊术语:** [有多个含义的术语]
## 利益相关者
- **主要参与者:** [谁直接参与?]
- **受影响群体:** [谁承担后果?]
- **对立利益:** [谁从不同结果中受益?]
## 时间范围
- **历史起源:** [何时开始?]
- **关键转变:** [何时及何事改变了?]
- **当前状态:** [现在发生什么?]
## 领域
- **主要领域:** [主要学科]
- **相邻领域:** [相关学科]
## 争议
- **活跃辩论:** [什么有争议?]
- **竞争框架:** [不同的理解方式]
查询类型
- 基础性: “术语定义 AND 领域综述”
- 历史性: “主题历史发展 [日期范围]”
- 当前性: “主题当前趋势 [近年]”
- 竞争性: “主题辩论 AND (视角1 OR 视角2)”
- 证据性: “主题影响测量研究数据”
完成标准
最低可行(快速决策)
- [ ] 能用自己话定义核心概念
- [ ] 知道2-3个主要视角
- [ ] 每个视角找到权威来源
- [ ] 识别了已知未知
工作知识(大多数决策)
- [ ] 能解释历史背景
- [ ] 理解利益相关者立场
- [ ] 遇到反驳论点
- [ ] 检查多个领域
深度专业知识(高风险)
- [ ] 追踪主张到主要来源
- [ ] 能评估竞争证据
- [ ] 理解知识限制
收益递减信号
停止当:
- 新来源引用相同基础著作(循环)
- 新搜索返回熟悉内容(重复)
- 每小时增加少于先前(边际)
- 能做出决策或采取行动(足够)
反模式
| 模式 | 症状 | 修复 |
|---|---|---|
| 确认陷阱 | 搜索以确认,非学习 | 搜索最强反驳论点 |
| 权威谬误 | 接受来源声望的声称 | 评估证据,非来源 |
| 近期陷阱 | 只有近期来源 | 明确搜索历史时期 |
| 广度陷阱 | 50标签,无一阅读 | 3来源规则,继续前总结 |
| 单来源 | 维基百科作为最终答案 | 需要3个独立来源 |
| 行话盲点 | 缺失其他领域术语 | 映射变体,搜索多个领域 |
| 无限兔子洞 | 迷失原始目的 | 写决策/行动锚点,返回 |
词汇映射
主要研究交付物。 词汇决定搜索空间和LLM语义激活。
为何重要
- 专家术语 → 专家材料。外行术语 → 入门材料。
- 精确词汇激活更丰富的LLM语义空间。
- 跨领域术语连接使用不同名称的工作体。
词汇映射模板
## 核心术语
| 术语 | 领域 | 深度级别 |
|------|--------|-------------|
| [专家术语] | [领域] | 专家 |
| [外行术语] | 通用 | 入门 |
## 跨领域同义词
| 概念 | 按领域术语 |
|---------|-----------------|
| [概念] | 领域A: [术语], 领域B: [术语] |
## 深度指标
| 级别 | 术语 | 它们浮现什么 |
|-------|-------|-------------------|
| 入门 | [术语] | 概述、解释器 |
| 专家 | [术语] | 研究、细致分析 |
发现过程
- 注意哪些术语感觉像外行语言
- 在早期来源中,留意“也称为”、“技术术语”
- 映射跨领域术语
- 在搜索中测试不同术语,注意浮现内容
研究持久性
存储来源和消化结果。 不要从头开始。
存储什么
| 层 | 内容 |
|---|---|
| 词汇映射 | 术语、领域、深度级别 |
| 来源 | PDF、保存页面、书签 |
| 消化笔记 | 摘要、关键引用、合成 |
| 查询日志 | 有效/失败的搜索 |
| 空白 | 仍未知的内容 |
开始前
检查先前研究。加载词汇映射。从上次停止处开始。
单次研究
当研究没有后续问题运行时(代理执行、时间框查询):
范围校准
| 决策类型 | 所需置信 | 研究深度 |
|---|---|---|
| 可逆,低风险 | 60-70% | 快速扫描(分钟) |
| 可逆,中等 | 75-85% | 工作知识(1-2小时) |
| 不可逆,中等 | 85-90% | 坚实基础(半天) |
| 不可逆,高 | 90-95% | 深度专业知识(天) |
问题模式 → 策略
| 模式 | 策略 |
|---|---|
| “什么是X?” | 2-3个权威来源,建立共识 |
| “我应该X吗?” | 利弊、替代方案、每个条件 |
| “X是真的吗?” | 主要来源、反驳证据、共识检查 |
| “如何做X?” | 分步、先决条件、常见陷阱 |
来源类型选择
| 来源 | 最适合 |
|---|---|
| 维基百科/百科全书 | 定向、术语、引用猎取 |
| 学术论文 | 机制、因果关系、方法论 |
| 实践者内容 | 实际如何工作、边缘案例 |
| 官方文档 | 技术规格、政策、程序 |
合成模板
## 摘要
[直接回答问题]
## 置信水平
[高/中/低] - [理由]
## 关键发现
1. [发现与来源类型]
## 注意事项
- [未咨询的内容]
- [做出的假设]
## 进一步调查
[什么会增加置信]
置信标记
| 级别 | 短语 |
|---|---|
| 既定 | “X是…”、“X通过…工作” |
| 强证据 | “证据强烈表明…” |
| 中等证据 | “大多数来源报告…” |
| 有限证据 | “一项研究发现…” |
| 未知 | “未找到可靠信息…” |
单次检查清单
- [ ] 范围匹配风险?
- [ ] 咨询多个来源类型?
- [ ] 寻求反驳证据?
- [ ] 置信水平明确?
- [ ] 空白承认?
健康检查问题
研究中,问:
- 我是搜索以学习还是以确认?
- 针对我当前观点的最强论点是什么?
- 我查看了熟悉领域之外吗?
- 我能总结到目前为止学到的内容吗?
- 这仍在服务我的原始目的吗?
- 我使用专家还是外行词汇?
- 我存储了学到的内容供未来使用吗?
- 我的深度与风险成比例吗?
- 我明确发出置信信号吗?
整合点
| 技能 | 连接 |
|---|---|
| 替身 | 研究告知决策;对发现应用/真相检查 |
| 上下文网络 | 在研究网络节点中存储发现 |
| 边界批判 | 应用于遇到的建议和推荐 |
输出持久性
此技能将主要输出写入文件,以便工作跨会话持久。
输出发现
在进行任何其他工作前:
- 检查项目中的
context/output-config.md - 如果找到,查找此技能的条目
- 如果未找到或此技能无条目,首先询问用户:
- “我应该在哪里保存此研究会话的输出?”
- 建议:
explorations/research/或此项目的合理位置
- 存储用户偏好:
- 如果上下文网络存在,在
context/output-config.md中 - 否则,在项目根目录的
.research-output.md中
- 如果上下文网络存在,在
主要输出
对于此技能,持久化:
- 词汇映射 - 术语、领域、深度级别、跨领域同义词
- 第0阶段分析 - 核心概念、利益相关者、时间范围、领域
- 合成文档 - 摘要、置信水平、关键发现、注意事项
- 来源评估 - 咨询的来源及质量注释
- 识别空白 - 仍未知的内容、后续步骤
对话 vs. 文件
| 到文件 | 留在对话 |
|---|---|
| 词汇映射 | 术语发现讨论 |
| 合成文档 | 查询细化迭代 |
| 带评估的来源列表 | 实时来源评估 |
| 空白分析 | 澄清问题 |
| 带置信标记的发现 | 后续调查 |
文件命名
模式: {主题}-研究-{日期}.md
示例: 能力框架-研究-2025-01-15.md
与研究持久性部分的关系
上文的“研究持久性”部分描述了存储什么。此部分操作化何处和如何 - 确保技能检查配置位置,需要时询问用户,并一致地写入输出。
来源框架
源自: frameworks/research/research-framework.md