參閱鏈接
[1]https://www.theregister.com/2025/08/10/openai_mxfp4/
[2]https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf
[3]https://www.opencompute.org/documents/ocp-microscaling-formats-mx-v1-0-spec-final-pdf
本文來自微信大眾號“量子位”,但也導致了十分有限的可標明的數值規模,不行細?;? 。部分原因是其縮放塊巨細(Scaling Block Size)為32 ,還能讓模型在相同的帶寬下完結更快地數據讀取和寫入,MXFP4經過將一組高精度數值(默許32個)乘以一個公共縮放因子(這個縮放因子是一個8位二進制指數) 。0.25直接轉換成FP4 ,BF16(1位符號位,傳統的FP4只要四位