name: llm-tuning-patterns description: LLM 调优模式 user-invocable: false

LLM 调优模式

基于APOLLO和Godel-Prover研究的LLM参数配置证据基础模式。

不同任务需要不同的LLM配置。使用这些基于证据的设置。

基于APOLLO奇偶分析：

在策略之前总是请求一个证明计划：

给定要证明的定理：
[定理陈述]

首先，写一个高层次证明计划解释你的方法。
然后，建议Lean 4策略来实现每个步骤。

证明计划（链式思维）显著提高策略质量。

对于困难证明，使用并行采样：

参数	值	理由
max_tokens	2048	足够用于大多数函数
temperature	0.2-0.4	偏好确定性输出

参数	值	理由
max_tokens	4096	探索空间
temperature	0.8-1.0	最大创造力