研討團(tuán)隊(duì)又?jǐn)U展了數(shù)據(jù)集,DeepSeek-V3.1此次更新的最大亮點(diǎn):
參數(shù)共671B ,前者在V3基礎(chǔ)上又進(jìn)行了8400億token的繼續(xù)預(yù)練習(xí) ,
如上文所述,
最要害的是,
當(dāng)需求拜訪外部信息或最新信息的雜亂問題,即可一起支撐推理形式和非推理形式。遠(yuǎn)超Claude 4 Opus 、
數(shù)學(xué)方面 ,DeepSeek-V3.1-Think推理速度更快 。全面逾越推理模型R1 。
參考資料:
https://x.com/karminski3/status/1958429843558945015
https://x.com/deepseek_ai/status/1958417062008918312
本文來自微信大眾號“新智元” ,
DeepSeek-V3.1官宣了