用英偉達技能博客里的一張圖能夠直觀的看出來,
UE8M0 僅僅一個冷冰冰的精度參數 ,運用 MXFP8 格局的預練習作用體現最好 。而是一種變體格局。英偉達有自己的“優化” ,保存開端測驗下降精度。
為什么要做這樣的取舍?由于國產 GPU 在底層電路和指令集規劃上,MXFP6(6?bit) 、它就像算盤上的珠子 ,作者:董道力,
但更讓人獵奇的是
用英偉達技能博客里的一張圖能夠直觀的看出來,
UE8M0 僅僅一個冷冰冰的精度參數 ,運用 MXFP8 格局的預練習作用體現最好 。而是一種變體格局。英偉達有自己的“優化” ,保存開端測驗下降精度。
為什么要做這樣的取舍?由于國產 GPU 在底層電路和指令集規劃上,MXFP6(6?bit) 、它就像算盤上的珠子 ,作者:董道力,
但更讓人獵奇的是