导航菜单
切换主题

参数高效微调 PEFT

参数高效微调PEFT分支:PEFT概述、LoRA、QLoRA、适配器方法、前缀微调

知识点(5 个)

PEFT概述

7 资源

全面理解参数高效微调的核心概念、优势和方法分类。PEFT定义:仅训练少量参数实现模型适配;PEFT优势:降低计算成本、防止灾难性遗忘;PEFT方法分类:适配器类、提示类、LoRA类;PEFT vs 全量微调:效果对比、适用场景;PEFT框架:Hugging Face PEFT库。

点击查看详细资源列表

LoRA低秩适应

8 资源

深入理解LoRA的核心原理和实现,掌握最流行的参数高效微调方法。LoRA原理:低秩矩阵分解近似权重更新;LoRA数学公式:W' = W + BA;LoRA配置:秩(r)、alpha、目标层;LoRA优势:无推理延迟、易于合并;LoRA实践:训练、合并、部署。

点击查看详细资源列表

QLoRA量化微调

5 资源

掌握QLoRA量化微调技术,在有限资源下实现高效大模型微调。QLoRA原理:4-bit量化 + LoRA;NF4数据类型:正态浮点量化;双重量化:量化常数再量化;分页优化器:管理显存峰值;QLoRA vs LoRA:内存-效果权衡。

点击查看详细资源列表

适配器方法

11 资源

理解适配器类PEFT方法,掌握Adapter系列方法的核心原理。Adapter原理:在Transformer层插入小型模块;Adapter类型:串行Adapter、并行Adapter;AdapterFusion:多任务适配器融合;AdapterHub:适配器生态系统;Adapter vs LoRA:结构对比、性能差异。

点击查看详细资源列表

前缀微调

9 资源

掌握前缀微调技术,理解基于提示的参数高效微调方法。Prefix Tuning原理:优化连续前缀向量;前缀位置:输入序列前添加可训练token;前缀长度:虚拟token数量配置;Prefix Tuning vs Prompt Tuning:方法对比;Prefix Tuning应用:生成任务、分类任务。

点击查看详细资源列表