品玩11月28日讯,摩尔线程近日推出 PyTorch 框架 MUSA 扩展库 Torch-MUSA 的新版本 v2.7.0,持续完善基于国产全功能 GPU(MUSA 架构)的深度学习生态。
新版本新增动态双精度转换、分布式检查点异步保存等特性,支持 flash_attention、transformer_encoder_layer 等关键算子,专属算子总数超 1050 个;同时默认启用 TF32,并优化 torch.compile、FSDP2 内存占用及性能分析工具。此前 v2.5.0 已集成 muFFT、muSolver 加速库并支持统一内存管理。
该版本兼容最新 MUSA SDK 4.2.0+,未来将跟进 PyTorch 2.9.0,进一步提升训练与推理效率。