Specstory修毛分析器 specstory-yak

这个技能用于分析SpecStory AI编码会话的历史数据,检测开发过程中任务偏离原始目标的现象,即“yak shaving”。它通过解析会话记录、跟踪领域转移和模式变化,为每个会话生成修毛得分,并提供个性化报告,帮助开发者识别效率瓶颈和改善编程习惯。关键词:AI编码会话分析、任务偏离检测、修毛得分、编程效率优化、SpecStory工具。

AI应用 0 次安装 0 次浏览 更新于 3/7/2026

name: specstory-yak description: 分析您的SpecStory AI编码会话在.specstory/history中的历史,用于检测修毛现象——当您的初始目标被带入兔子洞时。当用户说“分析我的修毛”、“检查兔子洞”、“我分心了多少”或“修毛得分”时运行。 license: Apache-2.0 metadata: author: specstory version: “1.0.0” argument-hint: “[days|date-range]”

Specstory 修毛分析器

分析您的.specstory/history以检测编码会话何时从其原始目标偏离。为每个会话生成“修毛得分”。

工作原理

  1. 解析 指定日期范围(或所有近期会话)的specstory历史文件
  2. 提取 第一条消息中的初始用户意图
  3. 跟踪 领域转移:文件引用、工具调用模式、目标变化
  4. 评分 每个会话从0(激光聚焦)到100(最大修毛)
  5. 总结 您最严重的偏离情况和模式

什么是修毛?

“我需要部署我的应用,但首先我需要修复CI,但首先我需要更新Node,但首先我需要修复我的shell配置…”

修毛是指您从目标A开始但最终深入无关任务Z的情况。此技能在您的AI编码会话中检测该模式。

使用方法

斜杠命令

当通过/specstory-yak调用时,解释用户的自然语言:

用户说 脚本参数
/specstory-yak --days 7(默认)
/specstory-yak last 30 days --days 30
/specstory-yak this week --days 7
/specstory-yak top 10 --top 10
/specstory-yak january --from 2026-01-01 --to 2026-01-31
/specstory-yak from jan 15 to jan 20 --from 2026-01-15 --to 2026-01-20
/specstory-yak by modification time --by-mtime
/specstory-yak last 14 days as json --days 14 --json
/specstory-yak save to yak-report.md -o yak-report.md
/specstory-yak last 90 days output to report --days 90 -o report.md

直接脚本使用

python /path/to/skills/specstory-yak/scripts/analyze.py [options]

参数:

  • --days N - 分析最近N天(默认:7)
  • --from DATE - 开始日期(YYYY-MM-DD)
  • --to DATE - 结束日期(YYYY-MM-DD)
  • --path PATH - .specstory/history的路径(如果未指定则自动检测)
  • --top N - 显示前N个最严重的修毛(默认:5)
  • --json - 输出为JSON
  • --verbose - 显示详细分析
  • --by-mtime - 按文件修改时间而不是文件名日期过滤
  • -o, --output FILE - 将报告写入文件(自动添加.md或.json扩展名)

示例:

# 分析最近7天
python scripts/analyze.py

# 分析最近30天,显示前10个
python scripts/analyze.py --days 30 --top 10

# 分析特定日期范围
python scripts/analyze.py --from 2026-01-01 --to 2026-01-28

# 按文件修改时间过滤(不是会话开始时间)
python scripts/analyze.py --days 7 --by-mtime

# JSON输出以供进一步处理
python scripts/analyze.py --days 14 --json

# 将报告保存到markdown文件
python scripts/analyze.py --days 90 -o yak-report.md

# 将JSON保存到文件
python scripts/analyze.py --days 30 --json -o yak-data.json

输出

Yak Shave Report (2026-01-21 to 2026-01-28)
==========================================

Sessions analyzed: 23
Average yak shave score: 34/100

Top Yak Shaves:
---------------
1. [87/100] "fix button alignment" (2026-01-25)
   Started: CSS fix for button
   Ended up: Rewriting entire build system
   Domain shifts: 4 (ui -> build -> docker -> k8s)

2. [72/100] "add logout feature" (2026-01-23)
   Started: Add logout button
   Ended up: Refactoring auth system + session management
   Domain shifts: 3 (ui -> auth -> database)

3. [65/100] "update readme" (2026-01-22)
   Started: Documentation update
   Ended up: CI pipeline overhaul
   Domain shifts: 2 (docs -> ci -> testing)

Most Focused Sessions:
----------------------
1. [5/100] "explain auth flow" (2026-01-26) - Pure analysis, no drift
2. [8/100] "fix typo in config" (2026-01-24) - Quick surgical fix

Patterns Detected:
------------------
- You yak shave most on: UI tasks (avg 58/100)
- Safest task type: Code review/explanation (avg 12/100)
- Peak yak shave hours: 11pm-2am (avg 71/100)

评分方法

修毛得分(0-100)计算自:

因素 权重 描述
领域转移 40% 文件引用跳转领域的次数
目标完成 25% 原始陈述的目标是否完成?
会话长度比 20% 长度与原始请求复杂度的比率
工具类型级联 15% 读->搜索->编辑->创建->部署的升级

得分解释:

  • 0-20:激光聚焦
  • 21-40:轻微偏离
  • 41-60:中等偏离
  • 61-80:显著修毛
  • 81-100:史诗般的兔子洞

向用户呈现结果

重要提示:运行分析器脚本后,您必须在响应最顶部添加个性化LLM生成的摘要,然后显示原始报告输出。

LLM摘要指南

生成一个3-5句的个性化评论:

  1. 以裁决开场 - 关于整体状态的机智一句话(例如,“您本周的编码会话…是一次冒险。”或“非常自律!有人一直在服用专注维生素。”)

  2. 突出亮点 - 具体参考最显著的会话:

    • 如果修毛高:“那个1月25日修复按钮的会话,结果变成了Kubernetes迁移?范围蠕变的厨师的吻。”
    • 如果修毛低:“您1月26日的认证流程解释非常外科手术式——进进出出,没有偏离。”
  3. 识别模式 - 注意任何重复出现的主题:

    • “您似乎从UI任务开始时最容易修毛”
    • “深夜会话是您的危险区域”
    • “您的重构会话倾向于保持专注”
  4. 以可操作建议或笑话结束 - 要么:

    • 实用提示:“考虑为那些‘快速CSS修复’设置时间盒——它们有73%的修毛率”
    • 或笑话:“按照这个速度,您下次的拼写错误修复将导致Linux内核的完全重写”

LLM摘要示例

## 🐃 您的修毛分析

好吧,好吧,好吧。您来修复按钮,结果重写了一半的基础设施。您的平均修毛得分47/100将您牢牢置于“经典开发者行为”领域。

最突出?那个1月25日的会话,一个CSS对齐修复如何演变成完整的Kubernetes部署大修。四次领域转移后,您可能忘记按钮长什么样了。

我注意到的模式:您的UI任务的修毛率比代码审查会话高58%。也许开始在您的日历中将那些“快速UI修复”标记为“潜在的3小时冒险”。

以下是完整分解:

然后在您的摘要下显示原始报告输出。

突出显示什么

在您的摘要之后,呈现原始结果时:

  1. 最严重的偏离者,带有前后比较
  2. 模式在何时/什么导致修毛
  3. 可操作的洞察 - 需要注意哪些任务类型