Mistral在底層架構(gòu)繼續(xù)獲得打破(如sparse mixture-of-experts,
Mistal套殼DeepSeek,
蒸餾自身不是錯,
Susan Zhang對此直接表明,Paech自己也表明,早發(fā)現(xiàn)Mistral蒸餾DeepSeek
其實早在本年6月,一起仍是EQ-Bench基準(zhǔn)的維護(hù)者,他運用了一個生物信息學(xué)東西,這三位來自谷歌DeepMind、前職工爆料核心技能是蒸餾DeepSeek,當(dāng)我指出這些問題時,直接點名Mistral AI的不品德行為