亚洲鲁吧在线视频播放热议,DeepSeek V3.1惊现奥秘「极」字Bug,模型毛病了?-6488avav
該模型的輸出中會(huì)莫名呈現(xiàn)一些「極」字
。這個(gè)猜想的合理之處在于支撐 MTP 的 DeepSeek 官方 API 更不簡(jiǎn)單遇到這種狀況,除了這 3 種「極」 token 在貪婪解碼中成為首選的狀況之外
,這兩者或許被模型混雜了
。有時(shí)這些問(wèn)題會(huì)占到文本的 5%
,u/Kitano_o 共享說(shuō):「我運(yùn)用 3.1 從中文翻譯成俄語(yǔ)時(shí)