量化

论文阅读:TurboQuant — 近最优失真率的在线向量量化
TurboQuant 论文阅读笔记:如何通过随机旋转 + 逐坐标最优标量量化,在 data-oblivious 的在线设置下达到信息论下界 2.7 倍以内的 MSE 和内积失真。
论文阅读:ARCQuant — 用增强残差通道提升 NVFP4 量化精度
ARCQuant 论文阅读笔记:如何在统一 NVFP4 精度下,通过两次量化达到 FP8 级别的精度,同时保持硬件兼容性。