名称: hugging-face-trackio 描述: 使用Trackio跟踪和可视化ML训练实验。在训练期间记录指标(Python API)或检索/分析已记录的指标(CLI)。支持实时仪表板可视化、HF Space同步和JSON输出用于自动化。
Trackio - ML训练的实验跟踪
Trackio是一个用于记录和可视化ML训练指标的实验跟踪库。它同步到Hugging Face Spaces以进行实时监控仪表板。
两个接口
| 任务 | 接口 | 参考 |
|---|---|---|
| 训练期间记录指标 | Python API | references/logging_metrics.md |
| 训练后/期间检索指标 | CLI | references/retrieving_metrics.md |
何时使用每个接口
Python API → 记录
在训练脚本中使用import trackio来记录指标:
- 用
trackio.init()初始化跟踪 - 用
trackio.log()记录指标或使用TRL的report_to="trackio" - 用
trackio.finish()结束
关键概念:对于远程/云训练,传递space_id — 指标同步到Space仪表板,以便在实例终止后持久保存。
→ 参见references/logging_metrics.md了解设置、TRL集成和配置选项。
CLI → 检索
使用trackio命令查询已记录的指标:
trackio list projects/runs/metrics— 发现可用内容trackio get project/run/metric— 检索摘要和值trackio show— 启动仪表板trackio sync— 同步到HF Space
关键概念:添加--json以获取适合自动化和LLM代理的程序化输出。
→ 参见references/retrieving_metrics.md了解所有命令、工作流和JSON输出格式。
最小记录设置
import trackio
trackio.init(project="my-project", space_id="username/trackio")
trackio.log({"loss": 0.1, "accuracy": 0.9})
trackio.log({"loss": 0.09, "accuracy": 0.91})
trackio.finish()
最小检索
trackio list projects --json
trackio get metric --project my-project --run my-run --metric loss --json