阿里开源通义DeepResearch，性能超OpenAI、DeepSeek旗舰模型

Source

　　新浪科技讯 9月17日上午消息，阿里开源旗下首个深度研究Agent模型——通义DeepResearch。该模型在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成绩（State-of-the-art），超越OpenAI Deep Research、DeepSeek-V3.1等Agent模型。目前，通义DeepResearch的模型、框架和方案均已全面开源，用户可在Github、Hugging Face和魔搭社区社区下载模型和代码。

　　据悉，针对现有深度研究种模式在处理长周期任务时，Agent会面临“认知空间窒息”和“不可逆的噪声污染”的挑战，导致推理能力下降，最终难以完成真正长程、复杂的研究任务。通义团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路，显著提升了模型的迭代速度和泛化能力。

　　在Humanity‘s Last Exam（HLE）、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集上，通义DeepResearch模型以3B激活参数，性能超越基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent。（文猛）

责任编辑：江钰涵