品玩1月14日讯,据智谱官方消息,智谱AI今日联合华为,正式开源新一代多模态图像生成模型GLM-Image。该模型全程在国产昇腾Atlas 800T A2设备与昇思MindSpore框架上完成训练,被认为是首个在此类国产全栈算力底座上实现训练的开源SOTA模型。
其核心创新在于采用了自回归与扩散解码器相结合的混合架构,可实现知识密集型的认知生成。这一设计使其在需要复杂逻辑与精准文字说明的场景中表现出色,例如生成科普插画、多格漫画、商业海报以及社交媒体图文封面。
在文字渲染能力上,模型在多个权威榜单中达到开源最优水平,尤其擅长生成中文汉字。此外,它支持多种分辨率图像的自适应生成,并且具有较高的性价比。目前,通过其API生成一张图片的成本约为0.1元,速度优化版本也即将更新。