参数高效微调 PEFT
参数高效微调PEFT分支:PEFT概述、LoRA、QLoRA、适配器方法、前缀微调
知识点(5 个)
PEFT概述
7 资源全面理解参数高效微调的核心概念、优势和方法分类。PEFT定义:仅训练少量参数实现模型适配;PEFT优势:降低计算成本、防止灾难性遗忘;PEFT方法分类:适配器类、提示类、LoRA类;PEFT vs 全量微调:效果对比、适用场景;PEFT框架:Hugging Face PEFT库。
点击查看详细资源列表
LoRA低秩适应
8 资源深入理解LoRA的核心原理和实现,掌握最流行的参数高效微调方法。LoRA原理:低秩矩阵分解近似权重更新;LoRA数学公式:W' = W + BA;LoRA配置:秩(r)、alpha、目标层;LoRA优势:无推理延迟、易于合并;LoRA实践:训练、合并、部署。
点击查看详细资源列表
QLoRA量化微调
5 资源掌握QLoRA量化微调技术,在有限资源下实现高效大模型微调。QLoRA原理:4-bit量化 + LoRA;NF4数据类型:正态浮点量化;双重量化:量化常数再量化;分页优化器:管理显存峰值;QLoRA vs LoRA:内存-效果权衡。
点击查看详细资源列表
适配器方法
11 资源理解适配器类PEFT方法,掌握Adapter系列方法的核心原理。Adapter原理:在Transformer层插入小型模块;Adapter类型:串行Adapter、并行Adapter;AdapterFusion:多任务适配器融合;AdapterHub:适配器生态系统;Adapter vs LoRA:结构对比、性能差异。
点击查看详细资源列表
前缀微调
9 资源掌握前缀微调技术,理解基于提示的参数高效微调方法。Prefix Tuning原理:优化连续前缀向量;前缀位置:输入序列前添加可训练token;前缀长度:虚拟token数量配置;Prefix Tuning vs Prompt Tuning:方法对比;Prefix Tuning应用:生成任务、分类任务。
点击查看详细资源列表