语音识别(网络)服务?
Lumenvox提供这样的服务,但似乎对你的需要昂贵。
这是一个很好的发现,虽然他们的程序员文档是不存在的。看起来它是“先买,后再理解”。我还发现了Spinvox Create,它的文档是可用的 - 但它是一堆可怕的Web API cruft,需要自定义标题,摘要式身份验证,包含XML和64编码音频的多部分帖子,其格式不会过分但不容易转换为从我的设备... – 2010-04-22 18:56:23
谷歌刚刚通过HTML5引入了对其语音引擎的基于浏览器的访问。
http://slides.html5rocks.com/#speech-input
为了得到这个页面的工作,我推出了Chromium浏览器中的Ubuntu如下:
$ chromium-browser --enable-speech-input
我认为这个想法是能够构建使用谷歌的语音识别应用,但我没有机会深入研究它。
另一个有趣的项目是从WAMI MIT: http://wami.csail.mit.edu
而且...自从Chromium是OSS,我只是花了一些时间,发现是的,的确,有一个RESTful服务端点,它谈到。建立一个单独的库以调用识别应该不会太难...... – 2011-02-13 04:18:29
戴夫,你有没有在这方面进一步工作? – 2012-05-15 12:32:05
虽然在Chromium中执行Python/Ruby/etc中的API应该相当简单...假设您可以为您选择的语言找到Speex编解码器API。 – 2012-06-06 04:09:19
我发现Spinvox创建,太... – 2010-04-22 18:54:42