xAI推出Grok Voice Agent API

Source

品玩12月18日讯,xAI官方宣布,xAI正式发布Grok Voice Agent API,面向开发者开放其在Tesla车辆及移动应用中已验证的语音代理技术。

该API支持数十种语言,具备实时工具调用与网络搜索能力,平均首音频响应时间低于1秒,在Big Bench Audio评测中位列第一。Grok Voice Agent采用自研全栈语音技术,包括语音活动检测、分词器与音频模型,定价为每分钟0.05美元。API兼容OpenAI Realtime规范,并提供Ara、Eve、Leo等多款自然表达语音。

目前支持通过xAI LiveKit插件或浏览器语音沙盒快速接入。