阶跃星辰发布StepAudio 2.5 TTS，重塑语音生成表达边界

Source

品玩4月17日讯，阶跃星辰（StepFun）正式发布新一代语音生成模型StepAudio 2.5 TTS。该模型面向Agent时代构建，突破传统语音合成技术局限，致力于实现从单纯的“复现声音”向深层次的“创造表达”跨越，赋予语音合成模型真正理解人类意图的能力。

StepAudio 2.5 TTS具备三大核心能力：一是全局语境控制，支持通过自然语言定义整段语音的情绪基调、角色状态及场景氛围，确保表达的连贯性与统一性；二是文中语境控制，能够精准调节语气、节奏、停顿及呼吸感，细腻刻画角色的心理活动与潜台词；三是零样本复刻与全音色控制，无需重新训练即可保留目标音色特征，并灵活调节情感与风格。

该模型现已全量上线阶跃星辰开放平台及Step Plan，支持非流式与流式语音合成等多种接口方式，旨在为有声书制作、影视配音及智能交互等场景提供具备真人级表现力的语音解决方案。