名称: 研究 描述: 诊断研究质量并指导系统性查询扩展。在开始研究任何主题时、在研究停滞时或不确定研究是否完成时使用。 许可证: MIT 元数据: 作者: jwynia 版本: “1.0” 领域: 研究 集群: 方法论
研究技能
系统性研究查询扩展和完成评估。将基本问题转化为全面的搜索策略。
诊断状态
R1: 无分析
症状: 直接跳转到搜索而不分析主题。 测试: 你能清晰阐述利益相关者、时间范围和领域映射吗? 干预: 在生成查询前运行Phase 0分析模板。
R1.5: 无词汇映射
症状: 使用外部/入门术语。只找到表面级材料。 测试: 你是否识别了专家与外部术语?跨领域术语? 干预: 构建词汇映射。在早期来源中寻找"也称为"、“技术上称为”。
R2: 单一视角搜索
症状: 所有查询支持一个观点。错过对立观点。 测试: 你是否明确搜索了对立视角? 干预: 生成竞争视角查询。搜索最强反对论点。
R3: 领域盲点
症状: 只在熟悉领域搜索。错过跨学科洞见。 测试: 你是否映射了跨领域的术语变体? 干预: 识别相邻领域如何称呼此主题。至少在2个领域搜索。更新词汇映射。
R4: 近期偏见
症状: 只使用近期来源。错过历史背景。 测试: 你能解释此主题何时出现及如何演变吗? 干预: 添加历史背景查询。寻找开创性作品。
R5: 广度无深度
症状: 许多标签页,无综合。无法解释核心概念。 测试: 你能用自己的话定义关键术语吗? 干预: 对每个视角应用3-来源规则。在搜索更多前进行总结。
R6: 完成不确定性
症状: 不确定是否继续或停止。研究无限扩展。 测试: 你能回答层级完成标准吗? 干预: 运行完成检查清单。寻找收益递减信号。
R7: 研究完成
症状: 能解释主题、识别不确定性并采取行动。 指标: 循环引用、重复发现、足够满足目的。
R8: 无持久性
症状: 每次会话从头开始。重新发现相同词汇。 测试: 你在开始前检查了先前研究吗?你在存储发现吗? 干预: 存储词汇映射、来源、消化笔记和未来使用的缺口。
R9: 范围不匹配
症状: 过度研究琐碎问题。研究不足关键决策。 测试: 研究深度是否与决策风险成比例? 干预: 应用范围校准。匹配置信水平到决策可逆性和风险。
R10: 无置信信号
症状: 处处使用模糊语言。读者无法区分确定与推测。 测试: 读者能区分已确立事实与推测吗? 干预: 使用明确置信标记。说明来源质量和共识状态。
Phase 0: 分析模板
在搜索前,结构化你的主题:
# 研究分析: [主题]
## 核心概念
- **主要术语:** [需要定义的关键术语]
- **术语变体:** [同义词、行话、历史术语]
- **模糊术语:** [有多重含义的术语]
## 利益相关者
- **主要行动者:** [谁直接参与?]
- **受影响群体:** [谁承担后果?]
- **对立利益:** [谁从不同结果中受益?]
## 时间范围
- **历史起源:** [这何时开始?]
- **关键转变:** [何时发生了什么变化?]
- **当前状态:** [现在发生了什么?]
## 领域
- **主要领域:** [主要学科]
- **相邻领域:** [相关学科]
## 争议
- **活跃辩论:** [什么有争议?]
- **竞争框架:** [不同的理解方式]
查询类型
- 基础性: “术语定义 AND 领域回顾”
- 历史性: “主题历史发展 [日期范围]”
- 当前性: “主题当前趋势 [最近几年]”
- 竞争性: “主题辩论 AND (视角1 OR 视角2)”
- 证据性: “主题影响测量 研究 数据”
完成标准
最小可行(快速决策)
- [ ] 能用自己的话定义核心概念
- [ ] 知道2-3个主要视角
- [ ] 为每个视角找到权威来源
- [ ] 识别已知未知
工作知识(大多数决策)
- [ ] 能解释历史背景
- [ ] 理解利益相关者立场
- [ ] 遇到反对论点
- [ ] 检查多个领域
深度专业知识(高风险)
- [ ] 追溯声明到主要来源
- [ ] 能评估竞争证据
- [ ] 理解知识局限
收益递减信号
停止当:
- 新来源引用相同基础作品(循环)
- 新搜索返回熟悉内容(重复)
- 每小时添加少于前一次(边际)
- 能做出决策或采取行动(足够)
反模式
| 模式 | 症状 | 修复 |
|---|---|---|
| 确认陷阱 | 搜索以确认,而非学习 | 搜索最强反对论点 |
| 权威谬误 | 接受基于来源声望的声明 | 评估证据,而非来源 |
| 近期陷阱 | 只使用近期来源 | 明确搜索历史时期 |
| 广度陷阱 | 50个标签页,无阅读 | 3-来源规则,继续前总结 |
| 单来源 | Wikipedia作为最终答案 | 要求3个独立来源 |
| 行话盲点 | 错过其他领域术语 | 映射变体,搜索多个领域 |
| 无限兔子洞 | 失去原始目的 | 写下决策/行动锚点,返回 |
词汇映射
主要研究成果。 词汇决定搜索空间和LLM语义激活。
为什么重要
- 专家术语 → 专家材料。外部术语 → 入门材料。
- 精确词汇激活更丰富的LLM语义空间。
- 跨领域术语桥接使用不同名称的作品体。
词汇映射模板
## 核心术语
| 术语 | 领域 | 深度级别 |
|------|--------|-------------|
| [专家术语] | [领域] | 专家 |
| [外部术语] | 通用 | 入门 |
## 跨领域同义词
| 概念 | 按领域术语 |
|---------|-----------------|
| [概念] | 领域A: [术语], 领域B: [术语] |
## 深度指标
| 级别 | 术语 | 它们浮现什么 |
|-------|-------|-------------------|
| 入门 | [术语] | 概述、解释器 |
| 专家 | [术语] | 研究、细微分析 |
发现过程
- 注意哪些术语感觉像外部语言
- 在早期来源中,观察"也称为"、“技术上称为”
- 映射跨领域术语
- 在搜索中测试不同术语,注意浮现内容
研究持久性
存储来源和消化结果。 不要从头开始。
存储内容
| 层 | 内容 |
|---|---|
| 词汇映射 | 术语、领域、深度级别 |
| 来源 | PDF、保存页面、书签 |
| 消化笔记 | 摘要、关键引用、综合 |
| 查询日志 | 有效/失败的搜索 |
| 缺口 | 仍未知的内容 |
开始前
检查先前研究。加载词汇映射。从上次离开处开始。
单次研究
当研究无需后续问题运行时(代理执行、时间框查询):
范围校准
| 决策类型 | 所需置信度 | 研究深度 |
|---|---|---|
| 可逆,低风险 | 60-70% | 快速扫描(分钟) |
| 可逆,中等 | 75-85% | 工作知识(1-2小时) |
| 不可逆,中等 | 85-90% | 坚实基础(半天) |
| 不可逆,高 | 90-95% | 深度专业知识(数天) |
问题模式 → 策略
| 模式 | 策略 |
|---|---|
| “X是什么?” | 2-3个权威来源,建立共识 |
| “我应该X吗?” | 利弊、替代方案、每个条件 |
| “X是真的吗?” | 主要来源、反对证据、共识检查 |
| “如何做X?” | 逐步、先决条件、常见陷阱 |
来源类型选择
| 来源 | 最适合 |
|---|---|
| Wikipedia/百科全书 | 定向、术语、引用狩猎 |
| 学术论文 | 机制、因果、方法论 |
| 实践者内容 | 事物实际如何工作、边缘情况 |
| 官方文档 | 技术规格、政策、程序 |
综合模板
## 摘要
[直接回答问题]
## 置信级别
[高/中/低] - [理由]
## 关键发现
1. [发现及来源类型]
## 注意事项
- [未咨询内容]
- [做出假设]
## 用于深入调查
[什么会增加置信度]
置信标记
| 级别 | 短语 |
|---|---|
| 已确立 | “X是…”、“X通过…工作” |
| 强证据 | “证据强烈表明…” |
| 中等证据 | “大多数来源报告…” |
| 有限证据 | “一项研究发现…” |
| 未知 | “未找到可靠信息…” |
单次检查清单
- [ ] 范围与风险匹配?
- [ ] 咨询多种来源类型?
- [ ] 寻求反对证据?
- [ ] 置信级别明确?
- [ ] 承认缺口?
健康检查问题
研究期间,问:
- 我在搜索以学习还是确认?
- 对我当前观点的最强反对论点是什么?
- 我看过熟悉领域外吗?
- 我能总结至今所学吗?
- 这仍在服务原始目的吗?
- 我使用专家还是外部词汇?
- 我存储了所学以备将来使用吗?
- 我的深度与风险成比例吗?
- 我明确发出置信信号吗?
集成点
| 技能 | 连接 |
|---|---|
| doppelganger | 研究告知决策;应用/truth-check到发现 |
| context-networks | 在适当网络节点存储研究发现 |
| boundary-critique | 应用到遇到的建议和推荐 |
输出持久性
此技能将主要输出写入文件,以便工作跨会话持久。
输出发现
在做任何其他工作前:
- 检查项目中
context/output-config.md - 如果找到,查找此技能的条目
- 如果未找到或无此技能条目,先询问用户:
- “我应该在哪里保存此研究会话的输出?”
- 建议:
explorations/research/或此项目的合理位置
- 存储用户偏好:
- 在
context/output-config.md中,如果上下文网络存在 - 否则在项目根目录的
.research-output.md中
- 在
主要输出
对此技能,持久化:
- 词汇映射 - 术语、领域、深度级别、跨领域同义词
- Phase 0分析 - 核心概念、利益相关者、时间范围、领域
- 综合文档 - 摘要、置信级别、关键发现、注意事项
- 来源评估 - 咨询来源及质量笔记
- 识别缺口 - 仍未知内容、下一步
对话 vs. 文件
| 写入文件 | 保留在对话中 |
|---|---|
| 词汇映射 | 术语发现讨论 |
| 综合文档 | 查询优化迭代 |
| 来源列表及评估 | 实时来源评估 |
| 缺口分析 | 澄清问题 |
| 置信标记发现 | 后续调查 |
文件命名
模式:{主题}-研究-{日期}.md
示例:competency-frameworks-research-2025-01-15.md
与研究持久性部分的关系
上面的"研究持久性"部分描述了什么要存储。此部分操作化在哪里和如何——确保技能检查配置位置,需要时询问用户,并一致写入输出。
来源框架
衍生自:frameworks/research/research-framework.md