超越 DeepSeek-R1，英伟达开源新推理模型

Source

品玩5月7日讯，据爱范儿报道，英伟达推出了 Llama-Nemotron 系列最新的三款模型，分别为LN-Nano 8B、LN-Super 49B和LN-Ultra 253B。

其中，LN-Ultra 模型通过大规模强化学习（RL）进一步超越了教师模型 DeepSeek-R1，成功突破了性能瓶颈。同时，LN-Ultra 还能在单个 8xH100 节点上运行，并具备更高的推理吞吐量。英伟达还首次推出了推理开关功能，允许用户通过简便的指令在标准聊天模式和推理模式之间动态切换，满足日常对话与复杂推理任务的需求。

性能表现上，LN-Nemotron 系列模型在多个基准测试中取得了领先表现，尤其在推理任务（如 GPQA-Diamond、AIME24、AIME25）和非推理任务（如指令遵循评估）上均显示出了卓越的能力。LN-Ultra 不仅超越了 DeepSeek-R1，还在多个领域的应用上展现了强大的泛化能力。