语音识别（网络）服务？

问题描述：

我有一个音频缓冲区，我想对它执行语音识别/转录。我在本地限制了CPU和RAM，所以我想在服务器上执行识别。语音识别（网络）服务？

有没有任何（网络）服务，让我这样做？

我搜索迄今已导致无处...

我发现Spinvox创建，太... – 2010-04-22 18:54:42

答

Lumenvox提供这样的服务，但似乎对你的需要昂贵。

这是一个很好的发现，虽然他们的程序员文档是不存在的。看起来它是“先买，后再理解”。我还发现了Spinvox Create，它的文档是可用的 - 但它是一堆可怕的Web API cruft，需要自定义标题，摘要式身份验证，包含XML和64编码音频的多部分帖子，其格式不会过分但不容易转换为从我的设备... – 2010-04-22 18:56:23

答

谷歌刚刚通过HTML5引入了对其语音引擎的基于浏览器的访问。

http://slides.html5rocks.com/#speech-input

为了得到这个页面的工作，我推出了Chromium浏览器中的Ubuntu如下：

$ chromium-browser --enable-speech-input

我认为这个想法是能够构建使用谷歌的语音识别应用，但我没有机会深入研究它。

另一个有趣的项目是从WAMI MIT： http://wami.csail.mit.edu

而且...自从Chromium是OSS，我只是花了一些时间，发现是的，的确，有一个RESTful服务端点，它谈到。建立一个单独的库以调用识别应该不会太难...... – 2011-02-13 04:18:29

戴夫，你有没有在这方面进一步工作？ – 2012-05-15 12:32:05

虽然在Chromium中执行Python/Ruby/etc中的API应该相当简单...假设您可以为您选择的语言找到Speex编解码器API。 – 2012-06-06 04:09:19

语音识别（网络）服务？

相关推荐