name: tech-stack-evaluator description: 综合技术栈评估和比较工具，包含TCO分析、安全评估和智能推荐，供工程团队使用

技术栈评估器

用于比较技术、框架、云服务提供商和完整技术栈的综合评估框架。提供数据驱动的建议，包括TCO分析、安全评估、生态系统健康评分和迁移路径分析。

功能

此技能提供八种全面评估功能：

技术比较：框架、语言和工具的头对头比较（React与Vue，PostgreSQL与MongoDB，Node.js与Python）
栈评估：针对特定用例评估完整的技术栈（实时协作、API密集型SaaS、数据密集型平台）
成熟度与生态系统分析：评估社区健康、维护状态、长期可行性和生态系统强度
总拥有成本（TCO）：计算包括许可、托管、开发者生产力和扩展在内的全面成本
安全与合规：分析漏洞、合规准备情况（GDPR、SOC2、HIPAA）和安全姿态
迁移路径分析：评估从传统到现代栈的迁移复杂性、风险、时间线和策略
云服务提供商比较：针对特定工作负载比较AWS与Azure与GCP的成本和功能
决策报告：生成包含利弊、信心分数和可操作建议的综合决策矩阵

输入要求

灵活的输入格式（自动检测）

此技能自动检测和处理多种输入格式：

文本/会话：

"比较React与Vue构建SaaS仪表板"
"评估实时协作平台的技术栈"
"我们应该从MongoDB迁移到PostgreSQL吗？"

结构化（YAML）：

comparison:
  technologies:
    - name: "React"
    - name: "Vue"
  use_case: "SaaS dashboard"
  priorities:
    - "Developer productivity"
    - "Ecosystem maturity"
    - "Performance"

结构化（JSON）：

{
  "comparison": {
    "technologies": ["React", "Vue"],
    "use_case": "SaaS dashboard",
    "priorities": ["Developer productivity", "Ecosystem maturity"]
  }
}

URL用于生态系统分析：

GitHub仓库URL（用于健康评分）
npm包URL（用于下载统计）
技术文档URL（用于功能提取）

分析范围选择

用户可以选择运行哪些分析：

快速比较：基本评分和比较（200-300令牌）
标准分析：评分+TCO+安全（500-800令牌）
综合报告：包括迁移路径在内的所有分析（1200-1500令牌）
自定义：用户选择特定部分（模块化）

输出格式

基于上下文的输出

此技能自动根据环境适应输出：

Claude桌面（富Markdown）：

带有颜色指示的格式化表格
可展开的详细分析部分
视觉决策矩阵
图表和图形（适当时）

CLI/终端（终端友好）：

带有ASCII边框的纯文本表格
紧凑的格式
清晰的部分标题
可复制粘贴的代码块

逐步披露结构

执行摘要（200-300令牌）：

推荐摘要
前3个利弊
信心水平（高/中/低）
关键决策因素

详细分解（按需）：

完整的评分矩阵
详细的TCO计算
全面安全分析
迁移复杂性评估
所有支持数据和计算

报告部分（用户可选）

用户选择包含哪些部分：

评分与比较矩阵
- 加权决策分数
- 头对头比较表
- 优势和劣势
财务分析
- TCO细分（5年预测）
- ROI分析
- 每个用户/请求的成本度量
- 隐藏成本识别
生态系统健康
- 社区规模和活动
- GitHub星星，npm下载
- 发布频率和维护
- 问题响应时间
- 可行性评估
安全与合规
- 漏洞计数（CVE数据库）
- 安全补丁频率
- 合规准备情况（GDPR，SOC2，HIPAA）
- 安全评分
迁移分析（如适用）
- 迁移复杂性评分
- 代码更改估计
- 数据迁移要求
- 停机时间评估
- 风险缓解策略
性能基准
- 吞吐量/延迟比较
- 资源使用分析
- 可扩展性特征

如何使用

基本调用

快速比较：

"比较React与Vue构建我们的SaaS仪表板项目"
"PostgreSQL与MongoDB用于我们的应用程序"

栈评估：

"评估实时协作平台的技术栈：
Node.js，WebSockets，Redis，PostgreSQL"

TCO分析：

"计算AWS与Azure对我们的工作负载的总拥有成本：
- 50个EC2/VM实例
- 10TB存储
- 高带宽需求"

安全评估：

"分析我们当前栈的安全姿态：
Express.js，MongoDB，JWT认证。
需要SOC2合规性。"

迁移路径：

"评估从Angular.js（1.x）迁移到React。
应用程序有50,000行代码，200个组件。"

高级调用

自定义分析部分：

"比较Next.js与Nuxt.js。
包括：生态系统健康，TCO和性能基准。
跳过：迁移分析，合规。"

加权决策标准：

"比较云服务提供商对ML工作负载的影响。
优先事项（加权）：
- GPU可用性（40%）
- 成本（30%）
- 生态系统（20%）
- 支持（10%）"

多技术比较：

"比较：React，Vue，Svelte，Angular对企业SaaS的影响。
用例：大型团队（20+开发人员），复杂的状态管理。
生成综合决策矩阵。"

脚本

核心模块

stack_comparator.py：带有加权评分算法的主要比较引擎
tco_calculator.py：总拥有成本计算（许可，托管，开发者生产力，扩展）
ecosystem_analyzer.py：社区健康评分，GitHub/npm指标，可行性评估
security_assessor.py：漏洞分析，合规准备情况，安全评分
migration_analyzer.py：迁移复杂性评分，风险评估，工作量估计
format_detector.py：自动输入格式检测（文本，YAML，JSON，URLs）
report_generator.py：基于上下文的报告生成，逐步披露

实用模块

data_fetcher.py：从GitHub，npm，CVE数据库获取实时数据
benchmark_processor.py：处理和规范化性能基准数据
confidence_scorer.py：计算推荐的信心水平

指标和计算

1. 评分与比较指标

技术比较矩阵：

功能完整性（0-100规模）
学习曲线评估（易/中/难）
开发者体验评分
文档质量（0-10规模）
加权总分

决策评分算法：

用户定义的标准权重
标准化评分（0-100）
置信区间
敏感性分析

2. 财务计算

TCO组成部分：

初始成本：许可，培训，迁移
运营成本：托管，支持，维护（每月/每年）
扩展成本：每个用户成本，基础设施扩展预测
开发者生产力：上市时间影响，开发速度乘数
隐藏成本：技术债务，供应商锁定风险

ROI计算：

成本节省预测（3年，5年）
生产力增益（节省的开发者小时数）
收支平衡分析
风险调整后的回报

每个指标的成本：

每个用户的成本（每月/每年）
每个API请求的成本
每个GB存储/传输的成本
每个计算小时的成本

3. 成熟度与生态系统指标

健康评分（0-100规模）：

GitHub指标：星星，叉子，贡献者，提交频率
npm指标：每周下载量，版本稳定性，依赖计数
发布节奏：定期发布，语义版本控制遵守
问题管理：响应时间，解决率，开放与关闭的问题

社区指标：

活跃维护者计数
贡献者增长率
Stack Overflow问题量
就业市场需求（职位发布分析）

可行性评估：

企业支持力度
社区可持续性
替代品可用性
长期风险评分

4. 安全与合规指标

安全评分：

CVE计数：已知漏洞（过去12个月，过去3年）
严重性分布：关键/高/中/低漏洞计数
补丁频率：平均补丁时间（天）
安全记录：历史安全姿态

合规准备情况：

GDPR：数据隐私功能，同意管理，数据可携带性
SOC2：访问控制，加密，审计日志
HIPAA：PHI处理，加密标准，访问控制
PCI-DSS：支付数据安全（如适用）

合规评分（每个标准）：

准备就绪：90-100%合规
大部分准备就绪：70-89%（小差距）
部分：50-69%（需要大量工作）
未准备：<50%（大差距）

5. 迁移分析指标

复杂性评分（1-10规模）：

代码更改：估计受影响的代码行数
架构影响：破坏性更改，API兼容性
数据迁移：架构更改，数据转换复杂性
停机时间要求：零停机时间可能与计划外停机

工作量估计：

开发小时数（按组件）
测试小时数
培训小时数
总人月数

风险评估：

技术风险：API不兼容，性能回归
业务风险：停机时间影响，功能对等差距
团队风险：学习曲线，技能差距
缓解策略：针对特定风险的建议

迁移阶段：

第1阶段：规划和原型制作（时间线，工作量）
第2阶段：核心迁移（时间线，工作量）
第3阶段：测试和验证（时间线，工作量）
第4阶段：部署和监控（时间线，工作量）

6. 性能基准指标

吞吐量/延迟：

每秒请求数（RPS）
平均响应时间（毫秒）
P95/P99延迟百分位数
并发用户容量

资源使用：

内存消耗（MB/GB）
CPU利用率（%）
存储需求
网络带宽

可扩展性特征：

水平扩展效率
垂直扩展限制
每个性能单位的成本
扩展拐点

最佳实践

准确评估

明确用例：指定确切的要求，约束和优先事项
提供完整上下文：团队规模，现有栈，时间线，预算限制
设置现实优先事项：使用加权标准（总计=100%）进行多因素决策
考虑团队技能：考虑学习曲线和现有专业知识
考虑长期：评估3-5年的前景，不仅仅是即时需求

TCO分析

包括所有成本组成部分：不要忘记培训，迁移，技术债务
使用现实的扩展预测：基于实际增长指标，而不是一厢情愿的想法
考虑开发者生产力：上市时间和开发速度是关键成本
考虑隐藏成本：供应商锁定，退出成本，技术债务积累
验证假设：记录所有TCO假设以供审查

迁移决策

从风险评估开始：及早识别阻碍因素
计划增量迁移：尽可能避免大爆炸式重写
原型关键路径：在承诺之前测试复杂的迁移场景
构建回滚计划：始终有一个回退策略
测量基线性能：在迁移之前建立当前指标

安全评估

检查最近的漏洞：专注于过去12个月的当前安全姿态
审查补丁响应时间：快速补丁比零漏洞更重要
验证合规声明：供应商声明≠实际合规准备情况
考虑供应链：评估所有依赖项的安全性
测试安全功能：不要假设功能按文档工作

限制

数据准确性

生态系统指标是即时快照（GitHub星星，npm下载迅速变化）
TCO计算是基于提供的假设和市场利率的估计
基准数据可能不反映您的特定用例或配置
安全漏洞计数取决于公共CVE数据库的完整性

范围限制

行业特定要求：一些特殊行业可能有标准分析未涵盖的独特约束
新兴技术：非常新的技术（<1岁）可能缺乏足够数据进行准确评估
定制/专有解决方案：无法评估封闭源代码或内部工具，除非有数据
政治/组织因素：无法考虑公司政治，供应商关系或遗留承诺

上下文限制

团队技能评估：无法直接评估您的团队的具体技能和学习能力
现有架构：假设绿色领域，除非提供迁移上下文
预算限制：TCO分析提供成本，但不能为您做出预算决策
时间线压力：无法考虑业务截止日期和上市时间紧迫性

何时不使用此技能

微不足道的决策：在几乎相同的工具之间选择（使用团队偏好）
强制解决方案：当技术选择已经由管理层/政策决定时
上下文不足：当您不知道您的要求，优先事项或约束时
实时生产决策：用于计划，而不是紧急生产问题
非技术决策：业务战略，招聘，组织问题

信心水平

此技能为所有建议提供信心分数：

高信心（80-100%）：强大的数据，清晰的胜者，低风险
中等信心（50-79%）：良好的数据，权衡存在，中等风险
低信心（<50%）：有限的数据，接近决定，高不确定性
数据不足：没有更多信息无法做出建议

信心基于：

数据完整性和最新性
多个指标的共识
用例要求的清晰度
行业成熟度和标准