SFT概述

全面理解监督微调的核心概念、流程和方法，掌握SFT在LLM对齐中的关键作用。SFT定义：使用标注数据对预训练模型进行监督训练；SFT目标：让模型学会遵循指令、输出期望格式；SFT与预训练区别：数据量、学习目标、训练方式；SFT数据类型：指令数据、对话数据、任务数据；SFT发展阶段：传统微调 → 指令微调 → 对齐微调。