品玩1月16日讯,据美团LongCat官方消息,美团LongCat团队正式发布并开源了LongCat-Flash-Thinking-2601模型。该模型被称为全球首个开源的“重思考”模型,其在智能体工具调用、搜索及数学推理等多个核心评测基准上均达到开源模型的最高水平。
其核心创新在于其独特的“重思考”模式。面对复杂问题时,模型会先启动并行思考,同时梳理多条独立的推理路径,以确保思路多样;随后进入总结归纳阶段,对多条路径进行优化与合成,并将结果重新输入以形成闭环迭代。美团专门为此设计了强化学习环节来打磨其总结能力。
其工具调用能力在多项评测中均获得开源模型最优成绩,展现出卓越的泛化能力,能大幅降低真实场景中新工具的适配成本。在开启重思考模式后,其数学推理能力也在国际奥数评测中达到了当前最优水平。目前,该模型已面向公众开源,并支持在线免费体验其重思考模式。