导航菜单
切换主题

SFT评估方法

掌握SFT模型的评估方法和指标,确保微调效果达到预期目标。评估指标:困惑度、准确率、BLEU、ROUGE;能力评估:指令遵循、推理、知识、安全;自动评估方法:基准测试、模型打分;人工评估方法:人类偏好、专家评审;常见评估基准:MMLU、HellaSwag、TruthfulQA。

学习资源(0 个)

📭

没有符合筛选条件的资源