阿里开源Qwen3-VL双子星模型,革新多模态检索技术

Source

品玩1月9日讯,据通义大模型官方消息,阿里云通义千问团队正式开源多模态检索核心模型Qwen3-VL-Embedding与Qwen3-VL-Reranker。这套双子星模型采取协同工作流程,可以解决图文、视频等跨模态内容的统一理解与高效检索难题。

Embedding模型能将文本、图像、图表乃至视频等多种格式的内容,快速编码为统一的语义向量,实现毫秒级的跨模态内容初筛与召回。Reranker模型可以初筛结果进行深度分析与重排序,通过计算查询与候选内容的深层语义关联,最终输出相关性最高的精准结果。

该系列模型在多项权威基准测试中表现卓越,其8B版本在多模态嵌入和视觉文档检索任务中超越了当前已知的开源模型。

Qwen3-VL-Embedding在 MMEB-v2和MMTEB评测集上的性能对比。
Qwen3-VL-Embedding在 MMEB-v2和MMTEB评测集上的性能对比。