Google升级Gemini 2.5 TTS模型,强化语音表达能力

Source

品玩12月11日讯,Google今日宣布推出Gemini 2.5 Flash与Pro Text-to-Speech(TTS)预览模型的重大更新,替代今年5月发布的旧版。

新模型在表达力、语速控制及多说话人一致性方面显著提升,支持更精准的风格指令响应、上下文感知的节奏调节,并可在24种语言中保持角色声线稳定。

该技术已应用于Wondercraft等平台,助力其多角色对话与导演模式功能,实现自然语音生成。用户现可通过Google AI Studio和Playground体验新版TTS能力,适用于有声书、教学视频、营销内容等高保真语音场景。