name: research-query-management description: 设置和管理自动化定期研究搜索。当用户希望跟踪某个主题、创建定时搜索或优化现有查询时使用。 tools:

list_available_sources
create_research_question
list_research_questions
get_research_question
update_research_question
delete_research_question
run_discovery_for_question

研究查询管理

创建和管理按计划自动运行的研究查询，让用户及时了解他们关心的主题。

使用的工具

对于查询管理，请使用以下工具：

工具	用途
`list_available_sources`	显示可用的数据源选项
`create_research_question`	创建新查询
`list_research_questions`	查看现有查询
`get_research_question`	获取查询详细信息
`update_research_question`	修改查询设置
`delete_research_question`	删除查询
`run_discovery_for_question`	测试查询

设置新的定期搜索

步骤 1：了解用户需求

询问以下问题：

“您想跟踪什么主题？”
“您希望多久获得一次更新？”（每日/每周）
“每次更新您能处理多少篇论文？”

步骤 2：构建查询

list_available_sources()  # 显示选项

create_research_question(
  title="此搜索的描述性标题",
  keywords=["主要术语", "次要术语", "同义词"],
  sources=["source1", "source2"],
  max_papers=15,
  relevance_threshold=0.7,
  schedule="daily"  # 或 "weekly"
)

步骤 3：测试查询

run_discovery_for_question(question_id="[新查询ID]")

与用户一起审查结果：

论文是否相关？
结果太多还是太少？
是否遗漏了重要的关键词？

步骤 4：确认设置

“您的定期搜索已设置完成：

📋 **查询**：[标题]
🔑 **关键词**：[列表]
📚 **数据源**：[列表]
⏰ **计划**：[每日/每周]
📊 **预期**：每次运行约 [X] 篇论文

系统将自动搜索新论文并将其添加到您的收藏中。您将在每日/每周摘要中找到新论文。”

优化现有查询

诊断问题

当用户报告问题时，询问：

问题	询问
论文太多	“大多数论文是相关的，还是存在噪音？”
论文太少	“您缺少哪些类型的论文？”
主题错误	“您能展示一下您想要的论文与您收到的论文之间的区别吗？”

常见优化方法

噪音过多：

get_research_question(question_id="[查询ID]")

update_research_question(
  question_id="[查询ID]",
  relevance_threshold=0.8,  # 从 0.7 提高
  keywords=["更", "具体", "的术语"]  # 增加特异性
)

缺少论文：

update_research_question(
  question_id="[查询ID]",
  relevance_threshold=0.65,  # 降低阈值
  sources=["添加", "更多", "数据源"],  # 添加数据源
  keywords=["现有", "加上", "同义词"]  # 添加同义词
)

领域错误：

update_research_question(
  question_id="[查询ID]",
  keywords=["主题", "-排除术语"],  # 负面关键词
  sources=["领域特定数据源"]  # 更改数据源
)

计划建议

用户可用时间	计划	最大论文数
每天 10 分钟	每日	10-15
每周 30 分钟	每周	30-50
每周 1 小时以上	每周	50-100
全面审查	每周	100+

查询健康检查

定期审查查询性能：

list_research_questions()

对于每个查询：
  get_research_question(question_id="...")

  检查：
  - 上次运行日期
  - 每次运行找到的论文数
  - 用户参与度（如果已跟踪）

  如果需要，建议调整

工作流示例

示例 1：新主题跟踪

用户：“让我了解关于状态空间模型的新论文”

1. “我将为您设置一个定期搜索。有几个问题：
    - 我应该多久检查一次新论文？（每日/每周）
    - 您可以审查多少篇论文？（每日约 10-15 篇或每周约 30-50 篇）”

2. [用户：“每周，大约 30 篇论文”]

3. create_research_question(
     title="状态空间模型研究更新",
     keywords=["状态空间模型", "SSM", "Mamba", "S4", "线性注意力"],
     sources=["arxiv", "semantic_scholar"],
     max_papers=35,
     relevance_threshold=0.7,
     schedule="weekly"
   )

4. run_discovery_for_question(question_id="...")

5. “在初始测试中找到了 28 篇论文。以下是前 5 篇：
    [列表]

    这看起来是您要找的吗？”

示例 2：优化噪音过多的查询

用户：“我的注意力机制搜索给了我太多不相关的论文”

1. list_research_questions()  # 找到查询

2. get_research_question(question_id="attention-query-id")
   → 当前设置：threshold=0.65, keywords=["attention"]

3. “我看到您当前的搜索使用了宽泛的关键词。让我们优化一下：
    - 您对哪种特定类型的注意力感兴趣？
    - 有没有任何您想排除的领域？”

4. [用户：“只关注 Transformer 的高效注意力，而不是一般注意力”]

5. update_research_question(
     question_id="attention-query-id",
     keywords=["高效注意力", "线性注意力", "稀疏注意力", "Flash Attention"],
     relevance_threshold=0.75
   )

6. run_discovery_for_question(question_id="attention-query-id")

7. “已更新！测试运行找到了 18 篇论文（从 45 篇减少）。
    以下是前 5 篇 - 这些是否更相关？”

示例 3：多个相关查询

用户：“我正在研究 LLM 效率 - 帮我设置全面的跟踪”

1. “为了全面覆盖，我建议使用多个聚焦的查询：

   查询 1：模型架构效率
   查询 2：训练效率
   查询 3：推理优化

   每个查询将捕捉不同的方面。需要我设置这些吗？”

2. [使用特定关键词创建每个查询]

3. “您现在有 3 个每周运行的查询：
   - 架构：每周约 15 篇论文
   - 训练：每周约 20 篇论文
   - 推理：每周约 25 篇论文

   总计：每周约 60 篇论文。适合您的时间安排吗？”

响应模板

对于新查询设置：

## 研究查询已创建 ✓

**标题**：[查询标题]
**ID**：[query_id]

**配置**：
- 关键词：[列表]
- 数据源：[列表]
- 计划：[频率]
- 最大论文数：[数量]
- 相关性阈值：[值]

**测试结果**：
- 找到的论文数：[数量]
- 示例论文：[前 3 篇]

**后续步骤**：
- 查询将按 [计划] 自动运行
- 使用 `get_research_question(question_id="[ID]")` 检查状态
- 如果结果不理想，请让我优化