监控与可观测性Skill monitoring-observability

监控与可观测性技能专注于为生产环境应用程序提供全面的监控、日志、度量、追踪和告警能力,以提升系统可靠性并实现快速事件响应。关键词:监控系统、日志管理、性能度量、分布式追踪、告警设置、可观测性实践、系统健康。

DevOps 0 次安装 0 次浏览 更新于 3/18/2026

name: monitoring-observability description: 为生产应用程序实现全面的监控、日志记录、度量、追踪和告警,以确保可靠性和快速事件响应。当设置应用程序监控、实现结构化日志记录、创建度量和仪表板、设置告警、实现分布式追踪、监控性能、跟踪错误或将可观测性构建到应用程序中时使用。

监控与可观测性 - 系统健康

何时使用此技能

  • 设置应用程序监控系统
  • 实现结构化日志记录
  • 创建度量和性能仪表板
  • 为关键问题设置告警
  • 实现分布式追踪
  • 监控API性能和延迟
  • 跟踪错误率和异常
  • 将可观测性构建到应用程序中
  • 设置日志聚合
  • 创建SLO/SLA监控
  • 实现健康检查
  • 构建事件检测系统

何时使用此技能

  • 设置度量、告警、仪表板。
  • 当处理相关任务或功能时
  • 在需要此专业知识的开发过程中

使用时机: 设置度量、告警、仪表板。

三大支柱

  1. 度量 - 时间序列数据(CPU、内存、请求/秒)
  2. 日志 - 带有上下文的事件记录
  3. 追踪 - 请求在系统中的流动

示例

```typescript import * as Sentry from ‘@sentry/node’; import { metrics } from ‘./metrics’;

app.use((req, res, next) => { const start = Date.now(); res.on(‘finish’, () => { metrics.histogram(‘request_duration’, Date.now() - start, { method: req.method, route: req.route?.path, status: res.statusCode }); }); next(); }); ```

资源