AMD与Intel联合发布ACE白皮书推进x86标准矩阵加速架构指令集

Source

在2024年10月的时候，AMD和Intel联合成立了x86生态系统咨询小组（x86 Ecosystem Advisory Group），汇聚行业领导厂商，共同推动x86计算架构的未来。EAG成立时公布了四项核心特性：FRED、AVX10、ChkTag和ACE，如今AMD与Intel联合发布了ACE白皮书，正式将这一被称为“x86标准矩阵加速架构”的指令集推向开发者社区。

ACE的核心目标很直接：让x86芯片的矩阵乘法性能实现数量级跃升。

矩阵乘法是神经网络和大语言模型的基础运算单元，现有的AVX10等SIMD指令集虽然能完成矩阵运算，但在计算密度和扩展性上存在明显瓶颈。

ACE通过引入基于外积运算的矩阵加速机制，在消耗相同输入向量的前提下，计算密度达到等效AVX10乘累加操作的16倍。

在数据格式支持方面，ACE原生覆盖了当前AI领域的主流精度标准，包括INT8、OCP FP8、OCP MXFP8、OCP MXINT8和BF16。

作为AVX10的扩展指令集，ACE的软件生态适配已在推进中，Deep Learning和HPC底层库、NumPy、SciPy等Python科学计算库，以及PyTorch和TensorFlow等主流机器学习框架均已启动集成工作。

AMD和Intel在白皮书中强调，ACE的设计理念是低摩擦、广覆盖，从笔记本到超级计算机，开发者无需针对不同硬件平台重写代码。

这与将AI计算迁移到专用加速器的方案形成鲜明对比，后者往往需要额外的代码适配和迁移成本。