name: tech-stack-evaluator description: 技术栈评估与比较工具，包含TCO分析、安全评估，为工程团队提供智能推荐

技术栈评估器

一个全面的评估框架，用于比较技术、框架、云提供商和完整技术栈。提供数据驱动的推荐，包含TCO分析、安全评估、生态系统健康评分和迁移路径分析。

能力

本技能提供八项全面的评估能力：

技术比较：框架、语言和工具的直接对比（React vs Vue，PostgreSQL vs MongoDB，Node.js vs Python）
技术栈评估：针对特定用例评估完整技术栈（实时协作、API密集型SaaS、数据密集型平台）
成熟度与生态系统分析：评估社区健康度、维护状态、长期可行性和生态系统强度
总拥有成本（TCO）：计算综合成本，包括许可、托管、开发人员生产力和扩展成本
安全与合规：分析漏洞、合规准备情况（GDPR、SOC2、HIPAA）和安全态势
迁移路径分析：评估从遗留技术栈迁移到现代技术栈的复杂性、风险、时间线和策略
云提供商比较：针对特定工作负载比较AWS vs Azure vs GCP，包含成本和功能分析
决策报告：生成包含优缺点、置信度分数和可操作建议的综合决策矩阵

输入要求

灵活的输入格式（自动检测）

技能自动检测和处理多种输入格式：

文本/对话式：

“为构建SaaS仪表板比较React与Vue”
“评估实时协作平台的技术栈”
“我们应该从MongoDB迁移到PostgreSQL吗？”

结构化（YAML）：

comparison:
  technologies:
    - name: "React"
    - name: "Vue"
  use_case: "SaaS仪表板"
  priorities:
    - "开发人员生产力"
    - "生态系统成熟度"
    - "性能"

结构化（JSON）：

{
  "comparison": {
    "technologies": ["React", "Vue"],
    "use_case": "SaaS仪表板",
    "priorities": ["开发人员生产力", "生态系统成熟度"]
  }
}

生态系统分析的URL：

GitHub仓库URL（用于健康评分）
npm包URL（用于下载统计）
技术文档URL（用于功能提取）

分析范围选择

用户可以选择运行哪些分析：

快速比较：基本评分和比较（200-300个token）
标准分析：评分 + TCO + 安全（500-800个token）
综合报告：包含迁移路径在内的所有分析（1200-1500个token）
自定义：用户选择特定部分（模块化）

输出格式

上下文感知输出

技能根据环境自动调整输出：

Claude桌面版（富Markdown）：

带颜色指示器的格式化表格
详细分析的可展开部分
可视化决策矩阵
图表和图形（适当时）

CLI/终端（终端友好）：

带ASCII边框的纯文本表格
紧凑格式化
清晰的部分标题
易于复制粘贴的代码块

渐进式披露结构

执行摘要（200-300个token）：

推荐摘要
前3个优缺点
置信度级别（高/中/低）
关键决策因素

详细细分（按需）：

完整的评分矩阵
详细的TCO计算
全面的安全分析
迁移复杂性评估
所有支持数据和计算

报告部分（用户可选）

用户选择包含哪些部分：

评分与比较矩阵
- 加权决策分数
- 直接对比表格
- 优势和劣势
财务分析
- TCO细分（5年预测）
- ROI分析
- 每用户/请求成本指标
- 隐藏成本识别
生态系统健康度
- 社区规模和活跃度
- GitHub星标、npm下载量
- 发布频率和维护情况
- 问题响应时间
- 可行性评估
安全与合规
- 漏洞数量（CVE数据库）
- 安全补丁频率
- 合规准备情况（GDPR、SOC2、HIPAA）
- 安全评分
迁移分析（适用时）
- 迁移复杂性评分
- 代码变更估算
- 数据迁移要求
- 停机时间评估
- 风险缓解策略
性能基准
- 吞吐量/延迟比较
- 资源使用分析
- 可扩展性特征

使用方法

基本调用

快速比较：

“为我们的SaaS仪表板项目比较React与Vue”
“为我们的应用程序比较PostgreSQL与MongoDB”

技术栈评估：

“评估实时协作平台的技术栈：
Node.js、WebSockets、Redis、PostgreSQL”

TCO分析：

“计算我们工作负载的AWS与Azure总拥有成本：
- 50个EC2/VM实例
- 10TB存储
- 高带宽要求”

安全评估：

“分析我们当前技术栈的安全态势：
Express.js、MongoDB、JWT身份验证。
需要SOC2合规。”

迁移路径：

“评估从Angular.js（1.x）迁移到React的路径。
应用程序有50,000行代码，200个组件。”

高级调用

自定义分析部分：

“比较Next.js与Nuxt.js。
包含：生态系统健康度、TCO和性能基准。
跳过：迁移分析、合规。”

加权决策标准：

“为ML工作负载比较云提供商。
优先级（加权）：
- GPU可用性（40%）
- 成本（30%）
- 生态系统（20%）
- 支持（10%）”

多技术比较：

“比较：React、Vue、Svelte、Angular用于企业SaaS。
用例：大型团队（20+开发人员），复杂状态管理。
生成综合决策矩阵。”

脚本

核心模块

stack_comparator.py：带加权评分算法的主要比较引擎
tco_calculator.py：总拥有成本计算（许可、托管、开发人员生产力、扩展）
ecosystem_analyzer.py：社区健康评分、GitHub/npm指标、可行性评估
security_assessor.py：漏洞分析、合规准备情况、安全评分
migration_analyzer.py：迁移复杂性评分、风险评估、工作量估算
format_detector.py：自动输入格式检测（文本、YAML、JSON、URL）
report_generator.py：上下文感知报告生成，带渐进式披露

实用模块

data_fetcher.py：从GitHub、npm、CVE数据库获取实时数据
benchmark_processor.py：处理和标准化性能基准数据
confidence_scorer.py：计算推荐置信度级别

指标与计算

1. 评分与比较指标

技术比较矩阵：

功能完整性（0-100分）
学习曲线评估（简单/中等/困难）
开发人员体验评分
文档质量（0-10分）
加权总分

决策评分算法：

用户定义的标准权重
标准化评分（0-100）
置信区间
敏感性分析

2. 财务计算

TCO组成部分：

初始成本：许可、培训、迁移
运营成本：托管、支持、维护（月度/年度）
扩展成本：每用户成本、基础设施扩展预测
开发人员生产力：上市时间影响、开发速度乘数
隐藏成本：技术债务、供应商锁定风险

ROI计算：

成本节省预测（3年、5年）
生产力收益（节省的开发人员小时数）
盈亏平衡分析
风险调整回报

每指标成本：

每用户成本（月度/年度）
每API请求成本
每GB存储/传输成本
每计算小时成本

3. 成熟度与生态系统指标

健康度评分（0-100分）：

GitHub指标：星标、分支、贡献者、提交频率
npm指标：每周下载量、版本稳定性、依赖项数量
发布节奏：定期发布、语义版本控制遵守情况
问题管理：响应时间、解决率、开放与关闭问题

社区指标：

活跃维护者数量
贡献者增长率
Stack Overflow问题量
就业市场需求（职位发布分析）

可行性评估：

企业支持强度
社区可持续性
替代方案可用性
长期风险评分

4. 安全与合规指标

安全评分：

CVE数量：已知漏洞（过去12个月，过去3年）
严重性分布：严重/高/中/低漏洞数量
补丁频率：平均补丁时间（天）
安全记录：历史安全态势

合规准备情况：

GDPR：数据隐私功能、同意管理、数据可移植性
SOC2：访问控制、加密、审计日志
HIPAA：PHI处理、加密标准、访问控制
PCI-DSS：支付数据安全（如适用）

合规评分（每标准）：

就绪：90-100%合规
基本就绪：70-89%（微小差距）
部分就绪：50-69%（需要显著工作）
未就绪：<50%（主要差距）

5. 迁移分析指标

复杂性评分（1-10分）：

代码变更：受影响代码行数估算
架构影响：破坏性变更、API兼容性
数据迁移：模式变更、数据转换复杂性
停机时间要求：零停机可能 vs 计划停机

工作量估算：

开发小时数（按组件）
测试小时数
培训小时数
总人月数

风险评估：

技术风险：API不兼容、性能回归
业务风险：停机影响、功能对等差距
团队风险：学习曲线、技能差距
缓解策略：特定风险推荐

迁移阶段：

阶段1：规划和原型设计（时间线、工作量）
阶段2：核心迁移（时间线、工作量）
阶段3：测试和验证（时间线、工作量）
阶段4：部署和监控（时间线、工作量）

6. 性能基准指标

吞吐量/延迟：

每秒请求数（RPS）
平均响应时间（毫秒）
P95/P99延迟百分位数
并发用户容量

资源使用：

内存消耗（MB/GB）
CPU利用率（%）
存储要求
网络带宽

可扩展性特征：

水平扩展效率
垂直扩展限制
每性能单位成本
扩展拐点

最佳实践

用于准确评估

定义清晰用例：指定确切要求、约束和优先级
提供完整上下文：团队规模、现有技术栈、时间线、预算约束
设置现实优先级：使用加权标准（总计100%）进行多因素决策
考虑团队技能：考虑学习曲线和现有专业知识
长远考虑：评估3-5年前景，而不仅仅是即时需求

用于TCO分析

包含所有成本组成部分：不要忘记培训、迁移、技术债务
使用现实扩展预测：基于实际增长指标，而非一厢情愿
考虑开发人员生产力：上市时间和开发速度是关键成本
考虑隐藏成本：供应商锁定、退出成本、技术债务积累
验证假设：记录所有TCO假设以供审查

用于迁移决策

从风险评估开始：尽早识别阻碍因素
计划增量迁移：尽可能避免大爆炸式重写
原型关键路径：在承诺前测试复杂迁移场景
构建回滚计划：始终有备用策略
测量基线性能：在迁移前建立当前指标

用于安全评估

检查近期漏洞：关注过去12个月以了解当前安全态势
审查补丁响应时间：快速补丁比零漏洞更重要
验证合规声明：供应商声明 ≠ 实际合规准备情况
考虑供应链：评估所有依赖项的安全性
测试安全功能：不要假设功能按文档工作

限制

数据准确性

生态系统指标是时间点快照（GitHub星标、npm下载量变化迅速）
TCO计算是基于提供的假设和市场利率的估算
基准数据可能不反映您的特定用例或配置
安全漏洞数量取决于公共CVE数据库的完整性

范围边界

行业特定要求：某些专业行业可能有标准分析未涵盖的独特约束
新兴技术：非常新的技术（<1年）可能缺乏足够数据进行准确评估
自定义/专有解决方案：没有数据无法评估闭源或内部工具
政治/组织因素：无法考虑公司政治、供应商关系或遗留承诺

上下文限制

团队技能评估：无法直接评估您团队的具体技能和学习能力
现有架构：除非提供迁移上下文，否则推荐假设为绿地项目
预算约束：TCO分析提供成本但无法为您做出预算决策
时间线压力：无法考虑业务截止日期和上市时间紧迫性

何时不使用此技能

琐碎决策：选择几乎相同的工具（使用团队偏好）
强制解决方案：当技术选择已由管理层/政策决定时
上下文不足：当您不知道要求、优先级或约束时
实时生产决策：用于规划，而非紧急生产问题
非技术决策：业务战略、招聘、组织问题

置信度级别

技能为所有推荐提供置信度分数：

高置信度（80-100%）：强数据、明确胜出者、低风险
中置信度（50-79%）：良好数据、存在权衡、中等风险
低置信度（<50%）：有限数据、接近选择、高不确定性
数据不足：没有更多信息无法做出推荐

置信度基于：

数据完整性和时效性
跨多个指标的共识
用例要求的清晰度
行业成熟度和标准