智東西8月15日音訊,大模型范疇長期存在 “參數規劃決議功能” 的固有認知,Gemma 3 270M逾越了尺度更大的Qwen2.5 0.5B Instruct ,具有強壯的指令盯梢和文本才能 。該模型共有2.7億個參數
亚洲无乱在线中文字幕仅0.27B参数,谷歌开源史上最小Gemma 3,手机能跑,25次对话耗电不到1%-6488avav
該模型能夠處理特定和稀有的token,Transformer模塊參數有1億個 。可 “開箱即用” 地呼應通用指令。嵌入參數有1.7億個
,該模型同步發布了指令微調版別與預練習檢查點(checkpoint)。Gemma 3 270M展現出小模型遵從指令的才能以及微調后的威力。從輕量而強壯的模型下手,或是有維護隱私的需求,與Llama 3.2 1B才能比肩 。