MiroMind大模型在FutureX预测基准测试中蝉联榜首

Source

品玩9月23日讯,据 AI Reinvent报道,在全球首个动态实时大语言模型(LLM)智能体未来预测基准FutureX中,陈天桥旗下MiroMind团队打造的大模型成绩亮眼。

搭载GPT-5的MiroFlow智能体框架,在9月第1周和第2周连续登顶,同时,搭载自研模型MiroThinker的MiroFlow也均位列前五,领先众多国际顶尖机构和闭源商业模型。

FutureX由字节跳动SEED团队联合斯坦福大学、复旦大学、普林斯顿大学推出,从全球200多个高质量网站,选取下周才有明确结果的问题,考验AI对未来事件及趋势的预测能力。MiroMind采用记忆驱动机制,专注预测与决策,在测试中成功预测复杂的网球选手排名。其成绩彰显了在AI预测领域的实力,有望推动相关技术在多领域的应用 。