關(guān)于 DeepSeek V3.1 呈現(xiàn)這一 bug 的原因,繁體中文中的“極”)
“一開(kāi)端我以為是因?yàn)槲矣昧藰O點(diǎn)的 IQ1_S 量化,
隨后 ,但后來(lái)我用 Fireworks 供給的 FP8 全精度模型測(cè)驗(yàn)時(shí),Qwen3 Coder 480B A35B Instruct 只要在被嚴(yán)峻量化后才呈現(xiàn)相同的問(wèn)題。在 thinking 結(jié)尾循環(huán)出不來(lái)的時(shí)分,該開(kāi)發(fā)者再次懇求官方解決問(wèn)題。忽然蹦出幾個(gè)英文單詞。也有“90000000...0000 極大的數(shù)字” 這種,
他提示