超越 DeepSeek-R1,英伟达开源新推理模型

Source

品玩5月7日讯,据爱范儿报道,英伟达推出了 Llama-Nemotron 系列最新的三款模型,分别为LN-Nano 8B、LN-Super 49B和LN-Ultra 253B。

其中,LN-Ultra 模型通过大规模强化学习(RL)进一步超越了教师模型 DeepSeek-R1,成功突破了性能瓶颈。同时,LN-Ultra 还能在单个 8xH100 节点上运行,并具备更高的推理吞吐量。英伟达还首次推出了推理开关功能,允许用户通过简便的指令在标准聊天模式和推理模式之间动态切换,满足日常对话与复杂推理任务的需求。

性能表现上,LN-Nemotron 系列模型在多个基准测试中取得了领先表现,尤其在推理任务(如 GPQA-Diamond、AIME24、AIME25)和非推理任务(如指令遵循评估)上均显示出了卓越的能力。LN-Ultra 不仅超越了 DeepSeek-R1,还在多个领域的应用上展现了强大的泛化能力。