品玩10月29日讯,据9to5MAC 报道,Apple近日发布Pico-Banana-400K数据集,含40万张精选图像,该数据集依托Google Gemini-2.5系列模型构建,相关研究论文《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》同步公开。
数据集采用非商业研究许可,仅限学术与AI研究使用,不可商用。其构建以OpenImages的真实照片为基础,涵盖35种编辑类型(分8类),经Gemini-2.5-Flash-Image(Nano-Banana)生成编辑图像后,由Gemini-2.5-Pro审核指令合规性与视觉质量。数据集包含单轮编辑、多轮编辑序列及成败结果偏好对。
尽管Apple承认Nano-Banana存在技术局限,但期望该数据集为下一代编辑模型提供训练与基准测试基础。研究论文可在arXiv查阅,数据集于GitHub免费开放。