语音识别(网络)服务?

问题描述:

我有一个音频缓冲区,我想对它执行语音识别/转录。我在本地限制了CPU和RAM,所以我想在服务器上执行识别。语音识别(网络)服务?

有没有任何(网络)服务,让我这样做?

我搜索迄今已导致无处...

+0

我发现Spinvox创建,太... – 2010-04-22 18:54:42

Lumenvox提供这样的服务,但似乎对你的需要昂贵。

+0

这是一个很好的发现,虽然他们的程序员文档是不存在的。看起来它是“先买,后再理解”。我还发现了Spinvox Create,它的文档是可用的 - 但它是一堆可怕的Web API cruft,需要自定义标题,摘要式身份验证,包含XML和64编码音频的多部分帖子,其格式不会过分但不容易转换为从我的设备... – 2010-04-22 18:56:23

谷歌刚刚通过HTML5引入了对其语音引擎的基于浏览器的访问。

http://slides.html5rocks.com/#speech-input

为了得到这个页面的工作,我推出了Chromium浏览器中的Ubuntu如下:

$ chromium-browser --enable-speech-input 

我认为这个想法是能够构建使用谷歌的语音识别应用,但我没有机会深入研究它。

另一个有趣的项目是从WAMI MIT: http://wami.csail.mit.edu

+2

而且...自从Chromium是OSS,我只是花了一些时间,发现是的,的确,有一个RESTful服务端点,它谈到。建立一个单独的库以调用识别应该不会太难...... – 2011-02-13 04:18:29

+0

戴夫,你有没有在这方面进一步工作? – 2012-05-15 12:32:05

+0

虽然在Chromium中执行Python/Ruby/etc中的API应该相当简单...假设您可以为您选择的语言找到Speex编解码器API。 – 2012-06-06 04:09:19