他進一步提到,被視為國產AI芯片行將邁入新階段的信號 。大模型練習推理的中心瓶頸不僅是算力規劃,上下游廠商也需求聯動優化 。不同核算對精度要求不同 ,
▍Deepseek能否推進新規范
DeepSeek-V3.1運用UE8M0 FP8 Scale 的參數精度 ,可以用較低的精度(如FP8)核算;而像累加或某些函數則需求較高精度
他進一步提到,被視為國產AI芯片行將邁入新階段的信號 。大模型練習推理的中心瓶頸不僅是算力規劃,上下游廠商也需求聯動優化 。不同核算對精度要求不同 ,
▍Deepseek能否推進新規范
DeepSeek-V3.1運用UE8M0 FP8 Scale 的參數精度 ,可以用較低的精度(如FP8)核算;而像累加或某些函數則需求較高精度