品玩3月25日讯,Anthropic Labs团队发布最新研究,通过引入生成器与评估器分离的多智能体架构,大幅提升了Claude在前端设计及长周期自主编程中的表现。
针对模型在长任务中易丧失连贯性及自我评估过于宽容的痛点,该方案采用类似GAN的机制,将主观设计标准转化为可量化指标,并利用Playwright MCP进行实时交互测试与迭代反馈。
实验显示,相较于单智能体模式,新架构虽增加了计算成本与耗时,但能生成具备完整功能的全栈应用。在构建复古游戏制作器与数字音频工作站的案例中,系统成功实现了从需求规划、代码生成到自动化QA的闭环,有效修复了逻辑漏洞并丰富了功能细节。随着Opus 4.6等模型的演进,该研究证实动态调整智能体协作策略仍是挖掘AI工程潜力的关键路径。