导航菜单

切换主题

GGUF

GGUF是llama.cpp项目推出的模型格式，专为CPU推理优化，支持多种量化级别（Q4_0, Q4_K_M, Q5_K_M等）。GGUF格式：文件结构解析；量化级别：Q4/Q5/Q6/Q8；量化选择：精度与大小权衡；工具链：llama.cpp、Ollama；本地部署：CPU推理优化。

资源类型

全部 📄 文章 🎬 视频 💻 代码 📚 官方文档 🤖 大模型官方

难度

全部入门进阶高级专家

学习资源(4 个)

百度千帆 - GGUF格式支持

百度千帆GGUF支持

华为云 - GGUF推理服务

华为云GGUF推理

SegmentFault - GGUF量化选择

量化级别选择

51CTO - GGUF最佳实践

最佳实践