Grafana仪表板分析Skill grafana-dashboards

这个技能用于通过Grafana进行监控和分析,包括查询Prometheus指标、管理仪表板、查看警报和从模板创建仪表板,适用于DevOps和云原生环境监控。关键词:Grafana, Prometheus, 仪表板, 监控, 警报, DevOps, 云原生。

DevOps 0 次安装 0 次浏览 更新于 3/15/2026

name: grafana-dashboards description: Grafana 仪表板和指标分析。用于通过 Grafana 查询仪表板、面板、Prometheus 指标、检查数据源、查看警报或从模板创建仪表板。 allowed-tools: Bash(python *)

Grafana 仪表板分析

认证

重要:凭证通过代理层自动注入。请勿检查环境变量中的 GRAFANA_API_KEY - 它对您不可见。直接运行脚本;认证是透明处理的。

您可以检查的配置环境变量(非机密):

  • GRAFANA_URL - Grafana 实例 URL(例如,https://grafana.company.com

可用脚本

所有脚本位于 .claude/skills/observability-grafana/scripts/

list_dashboards.py - 搜索/列出仪表板

python .claude/skills/observability-grafana/scripts/list_dashboards.py [--query "kubernetes"]

get_dashboard.py - 获取仪表板详情

python .claude/skills/observability-grafana/scripts/get_dashboard.py --uid DASHBOARD_UID

query_prometheus.py - 通过 Grafana 查询 Prometheus

python .claude/skills/observability-grafana/scripts/query_prometheus.py --query "PROMQL" [--time-range 60] [--step 1m] [--datasource-id ID]

# 示例(自动检测 Prometheus 数据源):
python .claude/skills/observability-grafana/scripts/query_prometheus.py --query "rate(http_requests_total[5m])"
python .claude/skills/observability-grafana/scripts/query_prometheus.py --query "up{job='api'}" --time-range 120

# 显式数据源 ID(使用 list_datasources.py 查找):
python .claude/skills/observability-grafana/scripts/query_prometheus.py --query "up" --datasource-id 8

注意:默认自动检测 Prometheus 数据源 ID。如果需要特定数据源,请使用 list_datasources.py

list_datasources.py - 列出配置的数据源

python .claude/skills/observability-grafana/scripts/list_datasources.py

get_alerts.py - 获取活跃警报

python .claude/skills/observability-grafana/scripts/get_alerts.py

create_dashboard.py - 从模板创建仪表板

python .claude/skills/observability-grafana/scripts/create_dashboard.py \
  --title "我的仪表板" \
  --template .claude/skills/observability-grafana/templates/vercel-overview.json

# 带文件夹:
python .claude/skills/observability-grafana/scripts/create_dashboard.py \
  --title "我的仪表板" \
  --template .claude/skills/observability-grafana/templates/vercel-overview.json \
  --folder-uid FOLDER_UID

# 覆盖现有:
python .claude/skills/observability-grafana/scripts/create_dashboard.py \
  --title "我的仪表板" \
  --template .claude/skills/observability-grafana/templates/vercel-overview.json \
  --overwrite

仪表板模板

预构建模板位于 .claude/skills/observability-grafana/templates/

模板 描述
vercel-overview.json 4 面板 Vercel 监控:错误计数、错误率、日志流、请求摘要

PromQL 快速参考

# 请求率
rate(http_requests_total{service="api"}[5m])

# 错误率 %
sum(rate(http_requests_total{status=~"5.."}[5m])) / sum(rate(http_requests_total[5m])) * 100

# P95 延迟
histogram_quantile(0.95, rate(http_duration_seconds_bucket{service="api"}[5m]))

# CPU 使用率
rate(process_cpu_seconds_total{service="api"}[5m])

调查工作流程

1. list_datasources.py                    # 查找可用数据源
2. list_dashboards.py --query "api"       # 查找相关仪表板
3. get_dashboard.py --uid <uid>           # 获取仪表板详情
4. query_prometheus.py --query "rate(http_requests_total{service='api',status=~'5..'}[5m])"
5. get_alerts.py                          # 检查活跃警报