品玩2月2日讯,阶跃星辰正式推出开源基座模型Step 3.5 Flash。该模型以“更快、更强、更稳”为核心特点,旨在成为高效的Agent大脑。其推理速度最高达350 TPS,在Agent场景与数学任务上媲美闭源模型,并能稳定处理复杂长链条任务。
模型采用稀疏MoE架构,总参数量1960亿,但每个Token仅激活约110亿参数,显著提升效率。结合MTP-3多Token预测技术与3:1滑动窗口混合注意力机制,可在256K上下文长度中精准聚焦关键信息,降低计算开销。
模型已全量上线,支持通过OpenRouter限免使用、GitHub快速部署及HuggingFace获取权重。针对本地设备优化,可在NVIDIA DGX Spark、Apple M3/M4 Max等工作站流畅运行。同期,阶跃星辰宣布已启动Step 4模型训练,邀请开发者参与共创。