值得注意的是,根据马斯克的说法,早期的评测结果显示,该模型的性能已经接近、甚至可能超越了Anthropic的旗舰模型Claude Opus。目前,强化学习(RL)仍在持续显著地优化该模型,其配套的“Grok Build”测试基准也在日趋完善。
这位亿万富翁企业家还表示,SpaceX计划在今年剩余的时间里每月发布一个“完全从零开始训练”的全新人工智能模型。这番言论暗示,未来的版本可能并非对现有系统的简单改进,而是通过全新训练构建的全新基础模型。
此次更新凸显了领先的人工智能公司在竞相提升模型性能和扩展功能方面,发展步伐日益加快。而马斯克承诺今年每月发布全新的人工智能模型,这表明xAI正在推行积极的研发周期,这可能会加剧与OpenAI、Anthropic和Google等竞争对手之间的竞争。
重视软件开发
据马斯克透露,Grok 4.5基于1.5万亿参数的V9基础模型打造,并在补充训练中特别加入了热门AI编程工具Cursor的数据。
Beta测试是一种有限的试用方式,在新软件产品正式发布之前,将其提供给一部分用户,以便开发人员发现错误、收集反馈并进行改进。
虽然马斯克没有提供关于Grok 4.5功能的详细技术信息,但Cursor训练数据的加入表明,Grok将继续重视软件开发和编码辅助,这是大型语言模型最重要的商业应用之一。
本月16日,SpaceX宣布,将以600亿美元收购AI编程公司Anysphere,该公司是热门AI编程助手Cursor的开发商,此举旨在加快其在企业级人工智能市场的布局。
SpaceX当时表示,预计该并购交易将在2026年第三季度完成。而该公司此前已对Cursor保持数月关注。今年3月,Cursor两名产品工程负责人已加入SpaceX,参与其月球相关项目及xAI的研发工作。
此次公告发布之际,xAI正持续扩展其人工智能基础设施,并将Grok定位为快速发展的生成式人工智能市场中的有力竞争者。在SpaceX和特斯拉内部测试该模型,有望在更广泛部署之前,获得大规模工程、制造和软件开发工作流程的使用经验。