品玩4月30日讯,英伟达正式发布Nemotron 3 Nano Omni开源多模态模型。该模型将视觉、语音与语言能力整合于单一系统,旨在解决现有智能体系统中多模型协作导致的延迟高、上下文丢失及成本昂贵等痛点。
Nemotron 3 Nano Omni基于30B-A3B混合专家架构,在保持领先准确率的同时实现了极低成本。其吞吐量较同类开源全模态模型提升9倍,显著降低了推理成本。该模型支持计算机使用、文档智能及音视频理解等复杂场景,使企业能够构建具备全分辨率视觉推理能力的智能体,实现对数字环境的实时感知与交互。
目前,Aible、Foxconn、Palantir等企业已开始采用该模型,Dell Technologies、Oracle等正在评估中。Nemotron 3 Nano Omni已开放权重与训练技术,支持从本地NVIDIA Jetson硬件到云端的全场景灵活部署,助力企业满足数据主权与合规性要求。