参数高效微调 PEFT

参数高效微调PEFT分支：PEFT概述、LoRA、QLoRA、适配器方法、前缀微调

知识点(5 个)

PEFT概述

全面理解参数高效微调的核心概念、优势和方法分类。PEFT定义：仅训练少量参数实现模型适配；PEFT优势：降低计算成本、防止灾难性遗忘；PEFT方法分类：适配器类、提示类、LoRA类；PEFT vs 全量微调：效果对比、适用场景；PEFT框架：Hugging Face PEFT库。

点击查看详细资源列表

LoRA低秩适应

8 资源

深入理解LoRA的核心原理和实现，掌握最流行的参数高效微调方法。LoRA原理：低秩矩阵分解近似权重更新；LoRA数学公式：W' = W + BA；LoRA配置：秩(r)、alpha、目标层；LoRA优势：无推理延迟、易于合并；LoRA实践：训练、合并、部署。

点击查看详细资源列表

QLoRA量化微调

5 资源

掌握QLoRA量化微调技术，在有限资源下实现高效大模型微调。QLoRA原理：4-bit量化 + LoRA；NF4数据类型：正态浮点量化；双重量化：量化常数再量化；分页优化器：管理显存峰值；QLoRA vs LoRA：内存-效果权衡。

点击查看详细资源列表

适配器方法

11 资源

理解适配器类PEFT方法，掌握Adapter系列方法的核心原理。Adapter原理：在Transformer层插入小型模块；Adapter类型：串行Adapter、并行Adapter；AdapterFusion：多任务适配器融合；AdapterHub：适配器生态系统；Adapter vs LoRA：结构对比、性能差异。

点击查看详细资源列表

前缀微调

9 资源

掌握前缀微调技术，理解基于提示的参数高效微调方法。Prefix Tuning原理：优化连续前缀向量；前缀位置：输入序列前添加可训练token；前缀长度：虚拟token数量配置；Prefix Tuning vs Prompt Tuning：方法对比；Prefix Tuning应用：生成任务、分类任务。

点击查看详细资源列表