具體來說,DeepSeek-V3.1 就現已上線了其網頁、他發現模型會莫名地在某些意料之外的方位輸出如下 token:
- extreme (id:15075)
- 極 (id:2577)
- 極 (id:16411)
很顯然,我觀察到的現象更離譜,該模型的輸出中會莫名呈現一些「極」字。」
他的猜想是該問題或許會被 MTP(多 token 猜想)掩蓋
具體來說,DeepSeek-V3.1 就現已上線了其網頁、他發現模型會莫名地在某些意料之外的方位輸出如下 token:
很顯然,我觀察到的現象更離譜,該模型的輸出中會莫名呈現一些「極」字。」
他的猜想是該問題或許會被 MTP(多 token 猜想)掩蓋