Gemma 4要发布的消息传了有段时间了,现在GoogleDeepmind创始人、CEO Demis Hassabis也发推暗示——他的内容是4颗钻石,而Gemma大模型的名称就是来自拉丁语宝石Gemma,因此这一暗示是非常明确了。
当前的Gemma 3大模型是去年3月份发布的,基于Google的Gemini 2.0,正好一年了,也是时候发布了,Gemini 3.0发布半年多了,甚至Gemini 3.1都已经发布了,这个时间差也不会影响Google的闭源大模型收费赚钱。
最让人关心的还是Gemma 4大模型的能力,当前的Gemma 3算是轻量级的,最大参数量也就27B,可以用单卡GPU运行,也支持多模态能力,能力当然没法跟Google主力大模型相比,但在开源社区口碑还是不错的。
Gemma 4此前传闻除了之前的小参数量模型之外,还会增加一个120B参数的新模型,是上代的4倍规模,但会采用MoE架构,激活参数15B,可以降低要求,依然能本地离线运行。
让Google自己的Gemini分析了下Gemma 4的能力预测,它给的答案很好很强大,甚至连深度思考能力也给了,上下文能力翻1-2倍,具备执行复杂逻辑能力。
不过也别期待太高,Google、Meta等美国科技公司做开源大模型并不会有多高优先级,也不会让开源模型能力影响到自己赚钱,Gemma 4能在本地离线运行的话,能力上限就不会太高,同参数量下也很难说能比得过国产开源的大模型。