DeepSeekMath-V2实现可自验证的数学推理突破

Source

品玩11月28日讯,据huggingface页面显示,DeepSeek团队发布大语言模型 DeepSeekMath-V2,聚焦可自验证的数学定理证明能力。

该模型通过训练一个高精度、高保真的验证器,并以其作为奖励信号引导证明生成器自我修正,形成“生成—验证—优化”闭环。为应对生成与验证能力同步提升的挑战,团队提出扩展验证计算资源以自动标注难验证样本,持续优化验证器性能。

在 IMO 2025、CMO 2024 和 Putnam 2024 等权威赛事中,DeepSeekMath-V2 表现卓越,分别取得金牌水平及118/120的近满分成绩。模型基于 DeepSeek-V3.2-Exp-Base 构建,已按 Apache 2.0 协议开源。