百度发布ERNIE-Image模型,开源8B参数文生图技术

Source

品玩4月15日讯,百度文心大模型团队正式开源全新文生图模型ERNIE-Image。

该模型基于单流Diffusion Transformer架构,参数规模仅为8B,仅需24GB显存的消费级显卡即可运行,生成效果媲美顶级商业模型。经国际基准测试验证,ERNIE-Image在通用图像生成、复杂指令跟随及文字渲染等任务中均取得开源模型SOTA成绩,尤其在中英日韩多语言文字渲染能力上表现突出。

目前,模型权重与推理代码已在Hugging Face开源,并上线ComfyUI Workflow及GGUF量化方案。