品玩11月18日讯,昆仑万维今天宣布,正式推出轻量级多模态智能体Skywork R1V4-Lite。该模型集成了视觉操作、深度推理与任务规划能力,能够在真实场景中实现“随手拍照、即时理解”,用户无需设计提示词,仅通过拍摄图像即可完成复杂任务。
与传统多模态模型相比,R1V4-Lite具备主动图像操作能力,可自动进行裁剪、放大、旋转等操作,并支持联网搜索与多轮推理,在多项基准测试中表现优异,部分任务甚至超越Gemini 2.5 Pro。同时,模型响应速度极快,延迟仅为Gemini 2.5 Pro的1/19,具备高并发处理能力。
R1V4-Lite的成功得益于“图像操作×深度推理”交织训练新范式,证明了轻量模型同样可具备接近顶级闭源模型的性能。该模型为移动端、实时交互等高并发场景提供了高效低成本的技术方案,标志着多模态智能体从封闭推理迈向开放式交互的重要突破。