品玩1月22日讯,据 GlobeNewswire 报道,人工智能公司Inworld正式发布了最新的文本转语音模型TTS-1.5。该模型能够生成自然且富有表现力的实时语音,同时具备低延迟与多语言支持能力。
据介绍,TTS-1.5在技术上实现了低于250毫秒的实时延迟,意味着在对话应用中用户几乎感觉不到语音生成的滞后。同时,模型在语音的表达力和合成稳定性方面也进行了优化,尤其适用于游戏和虚拟现实等领域的交互系统。
官方宣称,该模型使用成本约为每分钟0.005美元,比市场上的同类产品便宜25倍,这一价格策略预计将吸引大量开发者和企业的关注。