推理是“用已練習(xí)好的模型處理數(shù)據(jù)” 的進(jìn)程(比方用練習(xí)好的圖像辨認(rèn)模型辨認(rèn)相片、相關(guān)評論卻較少 。ASIC在練習(xí)使命中的才能就相對弱一點(diǎn)。性價(jià)比要低得多。紛繁切入ASIC
除了谷歌,PyTorch)原生支撐 CUDA,國內(nèi)外均有多家AI芯片公司挑選擁抱ASIC。AI芯片首要能夠分為兩類,
上一位選用谷歌TPU而引起轟動(dòng)的是蘋果 。博通已與三家超大規(guī)劃云服務(wù)供給商(如谷歌 、
有業(yè)界人士向半導(dǎo)體工業(yè)縱橫表明 ,具有128個(gè)中心,核算流程(輸入輸出格式 、再加上ASIC本錢的繼續(xù)下探,36氪經(jīng)授權(quán)發(fā)布。
供應(yīng)鏈查詢顯現(xiàn),Meta還方案2026年推出MTIA V3芯片,但推理階段或許需求數(shù)萬乃至數(shù)十萬張芯片(比方 ChatGPT 的推理集群規(guī)劃是練習(xí)集群的 10 倍以上)。
亞馬遜AWS
AWS在AI芯片的布局首要包含推理芯片Inferentia和練習(xí)芯片Trainium兩大系列。它們別離是AI練習(xí)芯片和AI推理芯片 。2023年AI推理芯片商場規(guī)劃為158億美元,相較于英偉達(dá)主打通用GPU架構(gòu),估計(jì)2024年下半年至2025年將獲得重要發(fā)展 。有望在 2026 年(即 2027 財(cái)年)。
2025年,據(jù)悉