内容合规质检模型微调

把一个 14B 的基座模型微调成按既定规则做内容合规质检的工具。技术栈是常规的：Qwen2.5-14B-Instruct 做基座，LoRA（rank=64, alpha=128, target=all）微调，cosine 调度 lr=5e-5，bf16 加 gradient checkpointing，单卡 RTX 4090 上用 DeepSpeed ZeRO-2 扛住 4096 的 cutoff。

跑通训练不难。这个项目真正花时间、也真正长本事的地方，是识破几个看起来很漂亮、实际上在骗我的数字。我把这部分单独写成了一篇文章：微调里那些会骗你的数字。这里讲项目层面的脉络。

一个”完美”的 loss，和它的真相

第一版（exp_005）训练完，train_loss 是 0.0137。低得离谱，像是过拟合，又像是哪里不对。

真相是：当时 cutoff 设成 1024，而很多样本（尤其是长规则的那几个平台）的助手输出被截断了。被截掉的 token 不参与损失计算，于是平均 loss 被人为拉低——这个 0.0137 是个假象。

把 cutoff 放开重训（exp_006），train_loss 变成 0.245。这才是所有 token 都参与计算后的真实数字。关键结论是：不同截断设置下的 loss 根本不能直接比较。 一个更”漂亮”的 loss，可能只是因为它算的是更少的 token。

看到异常好的 loss，先问是不是截断/掩码把它算小了；
看到高准确率，先核对模型实际看到的输入是不是完整的；
线上效果差但指标好，先去比训练分布和推理分布的差异。

模型训练里，最危险的不是明显的报错，而是那些看起来一切正常的指标。

一个”完美”的 loss，和它的真相

一个”很高”的准确率，和它的水分

根因：训练和推理见到的世界不一样

小结