昆仑万维发布Skywork R1V4-Lite多模态智能体，开启开放式交互新路径

Source

品玩11月18日讯，昆仑万维今天宣布，正式推出轻量级多模态智能体Skywork R1V4-Lite。该模型集成了视觉操作、深度推理与任务规划能力，能够在真实场景中实现“随手拍照、即时理解”，用户无需设计提示词，仅通过拍摄图像即可完成复杂任务。

与传统多模态模型相比，R1V4-Lite具备主动图像操作能力，可自动进行裁剪、放大、旋转等操作，并支持联网搜索与多轮推理，在多项基准测试中表现优异，部分任务甚至超越Gemini 2.5 Pro。同时，模型响应速度极快，延迟仅为Gemini 2.5 Pro的1/19，具备高并发处理能力。

R1V4-Lite的成功得益于“图像操作×深度推理”交织训练新范式，证明了轻量模型同样可具备接近顶级闭源模型的性能。该模型为移动端、实时交互等高并发场景提供了高效低成本的技术方案，标志着多模态智能体从封闭推理迈向开放式交互的重要突破。