一般規則是,但在推理階段,為了在削減數據量的一起保證必定的精度,
盡管這會在吞吐量上帶來一些進步,
低精度與核算量的取舍
事實上,OCP就在陳述《OCP Microscaling Formats (MX) Specification Version 1.0》中詳細介紹過這一數據類型。早在2023年的陳述中,
值得注意的是,這一操作的直接動機(收益)便是讓模型運轉本錢變得愈加廉價。 OpenAI在最新的開源模型gpt-oss上選用的MXFP4數據類型
,那對你也應該夠用。MXFP4是怎樣完成這一點的