name: monitoring-observability description: 为生产应用程序实现全面的监控、日志记录、度量、追踪和告警,以确保可靠性和快速事件响应。当设置应用程序监控、实现结构化日志记录、创建度量和仪表板、设置告警、实现分布式追踪、监控性能、跟踪错误或将可观测性构建到应用程序中时使用。
监控与可观测性 - 系统健康
何时使用此技能
- 设置应用程序监控系统
- 实现结构化日志记录
- 创建度量和性能仪表板
- 为关键问题设置告警
- 实现分布式追踪
- 监控API性能和延迟
- 跟踪错误率和异常
- 将可观测性构建到应用程序中
- 设置日志聚合
- 创建SLO/SLA监控
- 实现健康检查
- 构建事件检测系统
何时使用此技能
- 设置度量、告警、仪表板。
- 当处理相关任务或功能时
- 在需要此专业知识的开发过程中
使用时机: 设置度量、告警、仪表板。
三大支柱
- 度量 - 时间序列数据(CPU、内存、请求/秒)
- 日志 - 带有上下文的事件记录
- 追踪 - 请求在系统中的流动
示例
```typescript import * as Sentry from ‘@sentry/node’; import { metrics } from ‘./metrics’;
app.use((req, res, next) => { const start = Date.now(); res.on(‘finish’, () => { metrics.histogram(‘request_duration’, Date.now() - start, { method: req.method, route: req.route?.path, status: res.statusCode }); }); next(); }); ```