LLM蒸馏
大语言模型蒸馏关注如何将大型LLM的知识迁移到小型LLM,包括Token-level蒸馏、Sequence-level蒸馏等技术。LLM蒸馏特点:生成式任务挑战;Token级蒸馏:输出分布匹配;Sequence级蒸馏:整体序列学习;数据增强:教师模型生成数据;典型案例:DistilBERT、TinyBERT。
学习资源(12 个)
📎
百度千帆 - vLLM集成实践
百度千帆vLLM集成
进阶
📎
CSDN - LLM蒸馏实践
LLM蒸馏实践
进阶
📎
SegmentFault - 大模型压缩方案
压缩方案
进阶
📎
掘金 - LLM蒸馏最佳实践
最佳实践
进阶
📎
飞桨Paddle - 大模型蒸馏
飞桨LLM蒸馏
进阶
📎
DistilBERT Paper
DistilBERT论文
高级
📎
TinyBERT Paper
TinyBERT论文
高级
📎
MobileBERT Paper
MobileBERT论文
高级
📎
Alpaca - Stanford Distillation
Stanford Alpaca
入门
📎
Vicuna - LLM Distillation
Vicuna蒸馏
进阶
📎
Orca - Progressive Learning
Orca论文
高级
📎
LLM Distillation Survey
LLM蒸馏综述
高级