Google升级Gemini 2.5 TTS模型，强化语音表达能力

Source

品玩12月11日讯，Google今日宣布推出Gemini 2.5 Flash与Pro Text-to-Speech（TTS）预览模型的重大更新，替代今年5月发布的旧版。

新模型在表达力、语速控制及多说话人一致性方面显著提升，支持更精准的风格指令响应、上下文感知的节奏调节，并可在24种语言中保持角色声线稳定。

该技术已应用于Wondercraft等平台，助力其多角色对话与导演模式功能，实现自然语音生成。用户现可通过Google AI Studio和Playground体验新版TTS能力，适用于有声书、教学视频、营销内容等高保真语音场景。