导航菜单
切换主题

INT8/INT4

INT8和INT4分别指8位和4位整数表示,是深度学习量化的主流精度选择,INT4可进一步压缩模型但精度损失更大。INT8量化:精度与性能平衡;INT4量化:极限压缩方案;混合精度:动态精度选择;精度恢复:量化感知训练;硬件支持:NPU/TPU加速。

学习资源(0 个)

📭

没有符合筛选条件的资源