可靠性SLO/SLA定义技能 reliability-slo-sla

此技能用于定义和审查服务的服务水平目标(SLO)和服务水平协议(SLA),以设定和监控系统可靠性,涉及用户指标、错误预算、业务影响和DevOps实践,方便SEO搜索关键词如SLO、SLA、可靠性、指标、错误预算、DevOps。

DevOps 0 次安装 0 次浏览 更新于 3/6/2026

name: reliability-slo-sla description: 定义或审查服务的SLOs和SLAs。当高级开发人员需要可靠性目标时使用。

可靠性 SLO/SLA

目的

定义或审查服务的SLOs和SLAs。

输入要求

  • 用户可见的指标和期望。
  • 历史可靠性数据。
  • 业务影响阈值。

工作流程

  1. 定义用户可见的指标和错误预算指标。
  2. 设置可衡量的SLO目标和警报阈值。
  3. 将SLAs与业务影响和支持对齐。

输出

  • 带有指标的SLO/SLA提案。

质量栏

  • 确保指标可观察且稳定。
  • 记录预算燃烧的后果。