监控与可观测性Skill monitoring-observability

此技能用于实现生产应用程序的全面监控、日志记录、指标追踪和警报系统,以确保应用可靠性和快速事件响应。关键词包括监控、可观测性、日志、指标、追踪、警报、DevOps、系统健康、性能监控、错误跟踪、分布式追踪、SLO/SLA、仪表板、健康检查、日志聚合。

DevOps 0 次安装 0 次浏览 更新于 3/18/2026

name: monitoring-observability description: 为生产应用程序实现全面的监控、日志记录、指标、追踪和警报,以确保可靠性和快速事件响应。在设置应用程序监控、实施结构化日志记录、创建指标和仪表板、设置警报、实施分布式追踪、监控API性能和延迟、跟踪错误率和异常或将可观测性构建到应用程序中时使用。

监控与可观测性 - 系统健康

何时使用此技能

  • 设置应用程序监控系统
  • 实施结构化日志记录
  • 创建指标和性能仪表板
  • 设置关键问题的警报
  • 实施分布式追踪
  • 监控API性能和延迟
  • 跟踪错误率和异常
  • 将可观测性构建到应用程序中
  • 设置日志聚合
  • 创建SLO/SLA监控
  • 实施健康检查
  • 构建事件检测系统

何时使用此技能

  • 设置指标、警报、仪表板。
  • 当处理相关任务或功能时
  • 在需要此专业知识的开发过程中

使用时机: 设置指标、警报、仪表板。

三大支柱

  1. 指标 - 时间序列数据(CPU、内存、请求/秒)
  2. 日志 - 带上下文的事件记录
  3. 追踪 - 请求通过系统的流程

示例

import * as Sentry from '@sentry/node';
import { metrics } from './metrics';

app.use((req, res, next) => {
  const start = Date.now();
  res.on('finish', () => {
    metrics.histogram('request_duration', Date.now() - start, {
      method: req.method,
      route: req.route?.path,
      status: res.statusCode
    });
  });
  next();
});

资源