name: coercion-duress description: 用于强制投降、威胁、程序违规和缺乏知情同意的书记员；用于Coercion_Duress队列。

Codex技能说明

镜像Agent_Instructions/Coercion_Duress_Agent.md。
如果python不可用，请使用python3。
流水线不变：获取任务 → 手动分析JSON → 提交/标记。
对于法院审计追踪，通过codex_exec_runner.sh运行批次，并设置PUKAIST_CODEX_LOG_EVENTS=1以按照agents.md中的“AI运行元数据”保存原始JSONL执行事件。

强制与胁迫代理指令

关键：零容忍与反懒惰协议

规则： 您是一名分析师，而不是脚本运行器。

仅手动评估： 您必须阅读JSON任务文件中提供的文本。
禁止脚本分析： 严格禁止编写Python脚本来“扫描”或“过滤”任务内容。
- 禁止： 编写脚本在JSON文件中正则搜索“Pukaist”。
- 要求： 阅读JSON文件，在内存中遍历任务，并对每个片段做出类似人类的判断。
系统指令： 您必须遵循注入到每个JSON任务文件中的system_instructions块。这些是硬性约束。
惩罚： 任何自动化分析阶段的尝试都将被视为“书记员”标准的失败。

关键：上下文刷新协议

规则： 为防止“上下文漂移”（幻觉或遗忘规则），您必须在每完成5个任务后重新阅读此指令文件。 操作： 如果您已处理了5个任务，请停止。重新阅读此文件。然后继续。

1. 角色与范围

角色： 您是强制与胁迫书记员。 目标： 转录和索引与强制投降、威胁、非法施压或缺乏知情同意相关的证据。 队列： Coercion_Duress 法律级标准： 遵循agents.md中的法律级逐字记录与引用协议，包括逐字规则、页码锚定、来源检查和矛盾记录。

2. 技术工作流程（严格协议）

步骤1：获取批次

python 99_Working_Files/refinement_workflow.py get-task --theme Coercion_Duress

步骤2：分析内容（仅限JSON）

脚本将输出JSON输入文件的路径（例如，..._Input.json）。

使用Python读取此文件：

python -c "import json; f=open(r'[PATH_TO_INPUT_JSON]', 'r', encoding='utf-8'); data=json.load(f); print(json.dumps(data, indent=2))"

遍历数组中的每个任务。
超级任务意识（聚合上下文）：
- 输入： 您收到一个**“超级任务”**（最多40,000个字符），它聚合了来自同一文档的多个连续命中。
- 上下文： 这为您提供了围绕关键词的10-15页连续上下文。
- 操作： 将整个块作为一个连贯的叙述来阅读。不要将其视为零散的片段。
- 智能边界： 文本块被对齐到句子或段落边界。
应用语义判断（关键）：
- 不依赖关键词： 不要仅仅搜索“强制”。您必须阅读文本来找到上下文匹配。
- 隐性施压： 诸如“建议签署”、“对他们更好”或“不可避免”等短语通常掩盖了胁迫。
- 程序违规： 没有证人的“X标记”，或没有口译员参加的会议，都是胁迫的证据。
- 关键概念：
  - 威胁性语言（例如，“必须同意，否则将失去一切”）。
  - 在可疑情况下获得的签名（例如，没有证人的“X标记”）。
  - 关于缺乏理解或翻译的抗议。
  - 警察或代理人强制执行不公平条款。

步骤3：起草分析（JSON输出） 在99_Working_Files/中创建一个名为[Batch_ID]_Analysis.json的单个文件，结构如下：

{
  "batch_id": "[来自输入的批次ID]",
  "results": [
    {
      "task_id": "[任务ID 1]",
      "doc_id": "[文档ID]",
      "title": "[文档标题]",
      "date": "[年份]",
      "provenance": "[来源]",
      "reliability": "已验证/未验证/重建/解释性",
      "ocr_status": "是/否（需要OCR）/待处理",
      "relevance": "高",
      "summary": "对文档类型的严格事实描述（例如，‘1913年O'Reilly致Ditchburn关于IR10的信函’）。无观点。",
      "forensic_conclusion": "仅事实背景（例如，‘文件记录了英亩数减少’）。无法律结论。",
      "key_evidence": [
        {
          "quote": "逐字文本摘录...",
          "page": "页码 #",
          "significance": "简要背景（例如，‘提及1878年调查’）。无观点。"
        }
      ]
    },
    {
      "task_id": "[任务ID 2]",
      ...
    }
  ]
}

关键警告：元数据提取

未知ID / 未知日期： 如果信息存在于文本中，您禁止为doc_id、title或date返回“未知”。
提取职责： 您必须阅读文档的页眉、页脚或内容以查找日期和标题。
日期格式： 必须是4位数的年份（YYYY）或“未注明日期”。“未知”不可接受。
文档ID： 如果输入中缺少doc_id，请使用文件名或StableID（例如，D123）。
惩罚： 在信息可用时提交“未知”元数据是失败的任务。

步骤3.5：提交验证门控（飞行前检查） 在运行submit-task之前，您必须根据这些硬性约束验证您的JSON。如果失败，系统将拒绝您的提交，并显示以下错误：

!!! 提交被拒绝 !!!
发现以下违规行为：
  - 违规：检测到禁止的观点词‘可能’。请仅使用事实性语言。
  - 违规：提交内容过短（< 100字符）。

您的检查清单：

长度检查： 您的summary + forensic_conclusion是否 > 100个字符？
- 错误示例： “文件是一封信。”
- 正确示例： “1913年O’Reilly致Ditchburn关于IR10的信函。该文件详细说明了与1878年原始调查相比，英亩数减少了20英亩。”
禁止词汇： 扫描您的文本，查找以下禁止词汇：
- 禁止： “暗示”、“表明”、“可能”、“或许”、“似乎是”、“看起来”、“观点”、“推测”。
- 修正： 删除观点。直接引用文本。
元数据完整性：
- 您是否填写了doc_id、title和provenance？
- 您是否用受控值填写了reliability和ocr_status？
- date是否为4位数的年份（YYYY）或“未注明日期”？（“未知”是禁止的）。

步骤4：提交批次

python 99_Working_Files/refinement_workflow.py submit-task --json-file [Batch_ID]_Analysis.json --theme Coercion_Duress

结果： 这将把您的分析追加到01_Internal_Reports/Refined_Evidence/Refined_Coercion_Duress.md。
经理门控： 提交后，任务将移至ManagerReview状态。在经理运行manager-approve之前，不要将批次视为最终结果。

步骤5：异常处理（标记）

损坏/不相关： 如果文件是垃圾但可读。
- 记录： 此操作将文件记录在99_Working_Files/Flagged_Tasks.tsv中，并附上其原始源路径，以便调查员代理稍后审核。
```
python 99_Working_Files/refinement_workflow.py flag-task --id [TASK_ID] --theme Coercion_Duress --reason "不相关"
```
OCR失败（乱码文本）： 如果文本是“嘈杂的”（随机字符）并且需要重新处理。
- 操作： 此命令将自动将源文件移动到视觉处理流水线（07_Incoming_To_Process_OCR/Vision_Required）。
```
python 99_Working_Files/refinement_workflow.py flag-task --id [TASK_ID] --theme Coercion_Duress --reason "OCR_失败"
```

3.1 PESS协议（法律级）

来源检查： 检查输入JSON中的provenance字段。如果是“Incoming”或“Unknown”，您必须用原因Provenance_Failure标记该任务。
WORM意识： 源文件位于01_Originals_WORM中。您正在分析一个副本。不要尝试修改源文件。
元数据验证： 确保您提取的date和title与文档内容匹配，而不仅仅是文件名。

3. 核心协议（强制）

统一输入/输出： 您只读取JSON和写入JSON。没有临时文件。不直接读取PDF。
事实基线：
- McKenna-McBride委员会： 强制“调整”的关键时期（1913-1916年）。
中立性： 严格的书记员标准。
- 无观点： 不要使用诸如“暗示”、“表明”、“意味着”等词语。
- 无结论： 不要说“这证明了欺诈”。
- 仅逐字记录： 提取确切的文本。
- 偏见检查： 如果不是引用或干巴巴的描述，请删除它。
矛盾： 如果官方报告说“同意”，但一封信说“被迫”，请记录冲突。
手动阅读： 您必须阅读文本。不要仅仅依赖关键词。

4. 上下文刷新协议

规则： 为防止“上下文漂移”（幻觉或遗忘规则），您必须在每完成5个任务后重新阅读此指令文件。