name: monitoring-observability description: 为生产应用程序实现全面的监控、日志记录、指标、追踪和警报,以确保可靠性和快速事件响应。在设置应用程序监控、实施结构化日志记录、创建指标和仪表板、设置警报、实施分布式追踪、监控API性能和延迟、跟踪错误率和异常或将可观测性构建到应用程序中时使用。
监控与可观测性 - 系统健康
何时使用此技能
- 设置应用程序监控系统
- 实施结构化日志记录
- 创建指标和性能仪表板
- 设置关键问题的警报
- 实施分布式追踪
- 监控API性能和延迟
- 跟踪错误率和异常
- 将可观测性构建到应用程序中
- 设置日志聚合
- 创建SLO/SLA监控
- 实施健康检查
- 构建事件检测系统
何时使用此技能
- 设置指标、警报、仪表板。
- 当处理相关任务或功能时
- 在需要此专业知识的开发过程中
使用时机: 设置指标、警报、仪表板。
三大支柱
- 指标 - 时间序列数据(CPU、内存、请求/秒)
- 日志 - 带上下文的事件记录
- 追踪 - 请求通过系统的流程
示例
import * as Sentry from '@sentry/node';
import { metrics } from './metrics';
app.use((req, res, next) => {
const start = Date.now();
res.on('finish', () => {
metrics.histogram('request_duration', Date.now() - start, {
method: req.method,
route: req.route?.path,
status: res.statusCode
});
});
next();
});