名称: phoenix-cli 描述: 使用 Phoenix CLI 调试 LLM 应用。获取跟踪数据、分析错误、审查实验、检查数据集和查询 GraphQL API。在调试 AI/LLM 应用、分析跟踪数据、使用 Phoenix 可观察性或调查 LLM 性能问题时使用。 许可证: Apache-2.0 元数据: 作者: arize-ai 版本: “1.0”
Phoenix CLI
调用
px <command> # 如果全局安装
npx @arizeai/phoenix-cli <command> # 无需安装
设置
export PHOENIX_HOST=http://localhost:6006
export PHOENIX_PROJECT=my-project
export PHOENIX_API_KEY=your-api-key # 如果启用认证
当通过管道传输到 jq 时,始终使用 --format raw --no-progress。
跟踪数据
px traces --limit 20 --format raw --no-progress | jq .
px traces --last-n-minutes 60 --limit 20 --format raw --no-progress | jq '.[] | select(.status == "ERROR")'
px traces --format raw --no-progress | jq 'sort_by(-.duration) | .[0:5]'
px trace <trace-id> --format raw | jq .
px trace <trace-id> --format raw | jq '.spans[] | select(.status_code != "OK")'
跟踪 JSON 结构
Trace
traceId, status ("OK"|"ERROR"), duration (ms), startTime, endTime
rootSpan — 顶层跨度 (parent_id: null)
spans[]
name, span_kind ("LLM"|"CHAIN"|"TOOL"|"RETRIEVER"|"EMBEDDING"|"AGENT")
status_code ("OK"|"ERROR"), parent_id, context.span_id
attributes
input.value, output.value — 原始输入/输出
llm.model_name, llm.provider
llm.token_count.prompt/completion/total
llm.token_count.prompt_details.cache_read
llm.token_count.completion_details.reasoning
llm.input_messages.{N}.message.role/content
llm.output_messages.{N}.message.role/content
llm.invocation_parameters — JSON 字符串(温度等)
exception.message — 如果跨度出错则设置
数据集 / 实验 / 提示
px datasets --format raw --no-progress | jq '.[].name'
px dataset <name> --format raw | jq '.examples[] | {input, output: .expected_output}'
px experiments --dataset <name> --format raw --no-progress | jq '.[] | {id, name, failed_run_count}'
px experiment <id> --format raw --no-progress | jq '.[] | select(.error != null) | {input, error}'
px prompts --format raw --no-progress | jq '.[].name'
px prompt <name> --text --no-progress # 纯文本,适合通过管道传输到 AI
GraphQL
对于上述命令未涵盖的临时查询。输出是 {"data": {...}}。
px api graphql '{ projectCount datasetCount promptCount evaluatorCount }'
px api graphql '{ projects { edges { node { name traceCount tokenCountTotal } } } }' | jq '.data.projects.edges[].node'
px api graphql '{ datasets { edges { node { name exampleCount experimentCount } } } }' | jq '.data.datasets.edges[].node'
px api graphql '{ evaluators { edges { node { name kind } } } }' | jq '.data.evaluators.edges[].node'
# 内省任何类型
px api graphql '{ __type(name: "Project") { fields { name type { name } } } }' | jq '.data.__type.fields[]'
关键根字段:projects, datasets, prompts, evaluators, projectCount, datasetCount, promptCount, evaluatorCount, viewer.