品玩10月28日讯,据高通官方消息,高通近日宣布推出新一代数据中心AI推理优化解决方案,包括基于AI200、AI250芯片的加速卡及机架系统,依托其NPU技术优势,以高性价比与能效推动生成式AI规模化落地。
AI200为机架级方案,主打低总拥有成本(TCO),单卡支持768GB LPDDR内存,优化大语言及多模态模型推理性能;AI250采用近存计算架构,有效内存带宽提升超10倍且功耗更低,支持分布式推理。两者均配备直接液冷、PCIe/以太网扩展、机密计算功能,机架功耗160kW。
配套超大规模AI软件栈覆盖全链路,支持主流框架及Hugging Face模型一键部署。AI200、AI250预计分别于2026年、2027年商用,高通承诺将按年度迭代数据中心产品路线图。
