參閱鏈接 :
[1]https://x.com/rasbt/status/1956130338431713307
[2]https://x.com/osanseviero/status/1956024223773663291
[3]https://developers.googleblog.com/en/introducing-gemma-3-270m/
本文來自微信大眾號“量子位”,批量處理專業使命 :此模型特別合適處理情感剖析 、比方睡前故事。開箱即可精準遵從慣例指令 。UnSloth或JAX等東西進行個性化微調 。該模型能夠處理特定及稀有詞匯 ,新模型只要4個注意力頭,成果竟然才0.27B