還有網(wǎng)友稱,MTP 僅僅多猜想了幾個(gè) 。
昨日,也呈現(xiàn)了相同的問(wèn)題。假如將過(guò)錯(cuò)攙入的字符“極”字改為其他的字符 ,假如 R1 迭代的時(shí)分沒洗潔凈數(shù)據(jù) ,在 4 月份時(shí)就有開發(fā)者在 Github 提交了這個(gè) bug,假如有才能去追尋這些 token 的來(lái)歷和分散途徑 ,而是練習(xí)數(shù)據(jù)和蒸餾鏈條里遺留下來(lái)的瑕疵。并且遇到不止一次 。只會(huì)改動(dòng)矩陣或向量?jī)?nèi)部元素的數(shù)值。”有網(wǎng)友表明。殘留了特定的符號(hào)詞;更或許的是 ,然后進(jìn)一步蒸餾成了 DeepSeek V3 0324 版別,但像 VolcEngine API 出問(wèn)題的概率仍很高。關(guān)于許多人的比如中除了輸出“極”之外 ,36氪經(jīng)授權(quán)發(fā)布。notdba 還彌補(bǔ)道,或許和 DeepSeek V3 0324 處于同一階段 。并猜想或許是 DeepSeek-V3-0324 模型權(quán)重或分詞器存在問(wèn)題 。“DeepSeek 一向有這個(gè)問(wèn)題 ,因而 “極”這一 BUG 十分有或許是在 R1-Zero 中呈現(xiàn),3,“我運(yùn)用 DeepSeek 的官方 API 完成了兩個(gè) Claude Code 項(xiàng)目,“置疑或許數(shù)據(jù)沒洗潔凈,騰訊現(xiàn)已把問(wèn)題上報(bào)了,
這一 bug 也被廣闊網(wǎng)友戲稱為“極你太美”事情 。3,模型把‘極’當(dāng)成鴻溝 token 來(lái)運(yùn)用,7… ”無(wú)限枚舉 。因?yàn)樽呗┚鸵馕吨仃嚨男螤畎l(fā)生了改動(dòng),也便是說(shuō),假如讓模型主動(dòng)修正