量化
TurboQuant 论文阅读笔记:如何通过随机旋转 + 逐坐标最优标量量化,在 data-oblivious 的在线设置下达到信息论下界 2.7 倍以内的 MSE 和内积失真。
2026 年 3 月 28 日
ARCQuant 论文阅读笔记:如何在统一 NVFP4 精度下,通过两次量化达到 FP8 级别的精度,同时保持硬件兼容性。
2026 年 3 月 27 日