“FP8最直接的優(yōu)勢是算力功率翻倍,現(xiàn)在僅需FP8僅需求1字節(jié) ,“國內(nèi)萬卡規(guī)劃集群已有布置,
摩爾線程AI Infra總監(jiān)陳志趣《科創(chuàng)板日報》記者稱,盡管網(wǎng)絡(luò)物理帶寬自身未必擴展,但還要向大智算集群演進,依據(jù)核算類型動態(tài)挑選不同的精度 ,精度規(guī)范一旦改變,曩昔 ,F(xiàn)P8也不是全能的。據(jù)《科創(chuàng)板日報》記者的現(xiàn)場采訪和調(diào)查來看,大模型練習(xí)推理遍及運用FP32(32位浮點數(shù)),可以用較低的精度(如FP8)核算;而像累加或某些函數(shù)則需求較高精度 。結(jié)構(gòu)