阶跃星辰发布StepAudio 2.5 TTS,重塑语音生成表达边界

Source

品玩4月17日讯,阶跃星辰(StepFun)正式发布新一代语音生成模型StepAudio 2.5 TTS。该模型面向Agent时代构建,突破传统语音合成技术局限,致力于实现从单纯的“复现声音”向深层次的“创造表达”跨越,赋予语音合成模型真正理解人类意图的能力。

StepAudio 2.5 TTS具备三大核心能力:一是全局语境控制,支持通过自然语言定义整段语音的情绪基调、角色状态及场景氛围,确保表达的连贯性与统一性;二是文中语境控制,能够精准调节语气、节奏、停顿及呼吸感,细腻刻画角色的心理活动与潜台词;三是零样本复刻与全音色控制,无需重新训练即可保留目标音色特征,并灵活调节情感与风格。

该模型现已全量上线阶跃星辰开放平台及Step Plan,支持非流式与流式语音合成等多种接口方式,旨在为有声书制作、影视配音及智能交互等场景提供具备真人级表现力的语音解决方案。