Inworld发布低成本低延迟语音合成模型TTS-1.5

Source

品玩1月22日讯，据 GlobeNewswire 报道，人工智能公司Inworld正式发布了最新的文本转语音模型TTS-1.5。该模型能够生成自然且富有表现力的实时语音，同时具备低延迟与多语言支持能力。

据介绍，TTS-1.5在技术上实现了低于250毫秒的实时延迟，意味着在对话应用中用户几乎感觉不到语音生成的滞后。同时，模型在语音的表达力和合成稳定性方面也进行了优化，尤其适用于游戏和虚拟现实等领域的交互系统。

官方宣称，该模型使用成本约为每分钟0.005美元，比市场上的同类产品便宜25倍，这一价格策略预计将吸引大量开发者和企业的关注。