导航菜单
切换主题

SFT概述

全面理解监督微调的核心概念、流程和方法,掌握SFT在LLM对齐中的关键作用。SFT定义:使用标注数据对预训练模型进行监督训练;SFT目标:让模型学会遵循指令、输出期望格式;SFT与预训练区别:数据量、学习目标、训练方式;SFT数据类型:指令数据、对话数据、任务数据;SFT发展阶段:传统微调 → 指令微调 → 对齐微调。