DeepSeekMath-V2实现可自验证的数学推理突破

Source

品玩11月28日讯，据huggingface页面显示，DeepSeek团队发布大语言模型 DeepSeekMath-V2，聚焦可自验证的数学定理证明能力。

该模型通过训练一个高精度、高保真的验证器，并以其作为奖励信号引导证明生成器自我修正，形成“生成—验证—优化”闭环。为应对生成与验证能力同步提升的挑战，团队提出扩展验证计算资源以自动标注难验证样本，持续优化验证器性能。

在 IMO 2025、CMO 2024 和 Putnam 2024 等权威赛事中，DeepSeekMath-V2 表现卓越，分别取得金牌水平及118/120的近满分成绩。模型基于 DeepSeek-V3.2-Exp-Base 构建，已按 Apache 2.0 协议开源。