vosk-api:离线语音识别API
vosk-api 是一款适用于 Android、iOS、Raspberry Pi 以及支持 Python、Java、C# 和 Node 的服务器使用的离线语音识别API。本仓库提供的资源文件,将帮助您轻松集成和使用这款强大的开源语音识别工具包。
简介
Vosk 是一个离线开源语音识别工具包,支持 17 种语言和方言的语音识别模型,包括英语、印度英语、德语、法语、西班牙语、葡萄牙语、中文、俄语、土耳其语、越南语、意大利语、荷兰语、加泰罗尼亚语、阿拉伯语、希腊语、波斯语和菲律宾语。Vosk 模型体积小巧(50 Mb),但提供连续的大词汇量转录,具有流 API 的零延迟响应,可重新配置的词汇量和说话者识别功能。
特点
- 支持多种编程语言(如 Python、Java、Node.JS、C#、C++ 等)的语音识别绑定
- 为聊天机器人、智能家电、虚拟助手提供语音识别功能
- 可用于为电影创建字幕,为演讲和访谈创建转录字幕
- 支持从小型设备(如 Raspberry Pi 或 Android 智能手机)扩展到大型集群
安装与使用
有关安装说明、示例和文档,请参考官方资料。
注意: 请遵守相关法律法规,合法使用本API。