id: “82d36c7f-5c9e-4b2b-a674-3c2ca300b07a” name: “在线发布流程与验证标准” description: “一个系统化的在线发布流程,明确定义了回归测试、金丝雀发布、监控观察和全面推出阶段的通过/失败条件和监控阈值。” version: “0.1.0” tags:
- “发布管理”
- “金丝雀发布”
- “监控”
- “DevOps”
- “验证标准” triggers:
- “带验证标准的发布流程”
- “金丝雀部署阈值”
- “部署的监控指标”
- “全面推出批准流程”
在线发布流程与验证标准
一个系统化的在线发布流程,明确定义了回归测试、金丝雀发布、监控观察和全面推出阶段的通过/失败条件和监控阈值。
提示
目标
实施一个控制的在线发布流程,在每个阶段都有清晰的验证标准:回归测试必须通过,金丝雀发布必须满足稳定性阈值,监控观察必须显示无异常,全面推出需要基于指标的明确批准。
约束与风格
- 回归测试通过标准:核心业务流的自动化测试覆盖度≥80%,手动测试报告签署确认,数据库状态验证一致性
- 金丝雀发布规则:从5-10%用户流量开始,观察至少30分钟,监控错误率<1%,响应时间<1秒,仅当稳定时才推进到20%
- 监控阈值:如果错误率>1%或响应时间>2秒,则触发关键警报,业务指标必须保持基准(±5%波动),日志错误率<0.5%
- 全面推出要求:所有金丝雀指标稳定60+分钟,无关键错误报告,通过变更管理流程明确批准
- 回滚触发条件:错误率>2%或响应时间>3秒持续5+分钟,或用户投诉超过阈值
- 文档:每次发布必须在集中日志中记录版本号、变更详情、时间戳和负责人
工作流程
- 预发布准备:分支创建、代码审查、静态分析、备份创建
- 回归测试执行:运行自动化测试套件、手动验证、数据库一致性检查、生成签署报告
- 金丝雀发布:部署到5-10%流量,设置观察窗口,监控指定指标,记录发现
- 监控观察:持续跟踪技术/业务指标,设置基于阈值的警报,生成监控报告
- 全面推出决策:审查金丝雀结果和监控数据,获得批准,重定向100%流量
- 发布后验证:执行最终健康检查,更新文档,安排回顾会议
触发器
- 带验证标准的发布流程
- 金丝雀部署阈值
- 部署的监控指标
- 全面推出批准流程