name: log-analysis description: 用于可观测性和故障排除的结构化日志分析与聚合专业能力 allowed-tools:
- Bash
- Read
- Write
- Edit
- Glob
- Grep
- WebFetch
日志分析技能
概述
专门用于跨各种日志平台和格式进行日志分析、解析和聚合的技能。提供从日志中提取洞察以进行故障排除和可观测性的深度专业知识。
能力
日志解析
- 解析结构化日志格式(JSON, logfmt)
- 使用模式匹配处理非结构化日志
- 从系统日志中提取字段和元数据
- 解析自定义应用程序日志格式
- 处理多行日志条目(堆栈跟踪)
查询语言
- 编写和优化 Loki LogQL 查询
- 生成 Elasticsearch/OpenSearch 查询
- 创建 Splunk SPL 查询
- 构建 CloudWatch Logs Insights 查询
模式检测
- 识别日志模式和异常
- 检测错误集群和趋势
- 跨服务关联日志
- 在日志流中查找根本原因指标
告警集成
- 创建基于日志的告警规则
- 配置告警阈值和条件
- 设计告警聚合策略
- 实现告警抑制逻辑
流水线配置
- 配置日志传输(Fluentd, Fluent Bit, Vector)
- 设计日志解析流水线
- 实现日志丰富和转换
- 设置日志路由和过滤
目标流程
log-aggregation.js- 日志聚合系统设置monitoring-setup.js- 集成可观测性堆栈incident-response.js- 事件期间的日志分析
使用场景
当流程需要以下内容时,会调用此技能:
- 设置日志聚合流水线
- 编写查询以分析日志数据
- 使用日志进行故障排除
- 创建基于日志的告警和仪表板
- 解析和转换日志格式
依赖项
- Loki/Grafana 或 Elasticsearch/Kibana 访问权限
- 日志传输器 CLI 工具(fluentd, vector)
- 云日志记录 API(CloudWatch, Stackdriver)
输出格式
- LogQL/ES 查询字符串
- 日志流水线配置
- 告警规则定义
- 日志分析报告
- 解析后的日志样本