如何存储语音并从数据库中识别?
问题描述:
我想创建具有节点js的web应用程序并对js进行响应。如何存储语音并从数据库中识别?
这个网页应用程序将会有2个页面,其中一个将记录语音并存储在数据库中,而在第二页面中,任何用户可以在该web应用程序匹配该语音和数据库之后进入并说出任何内容,用用户名返回。
我已经做了记录的一部分保存在文件夹,但不知道是哪个数据库,我应该用它来存储数据,可以匹配第二页中的数据时,用户不需要有名字的时候他们说提前东西..
感谢我新的节点,并发生反应,请这方面的帮助:d
答
可以使用https://firebase.google.com/谷歌的火力为您实时数据库或用于存储音频文件
但匹配两个语音将无法正常工作为你必须使用一些像图书馆https://www.npmjs.com/package/wav-file-info
将语音输入与音频是在数据库
答
你正在试图解决的问题是自动语音识别(ASR)的一部分进行比较。很明显,您无法比较此问题域中的两个音频文件。相反,您需要计算语音的某种特征/指纹并匹配这些特征。 Mel-Frequency Cepstral Coefficients(MFCC)(click here)是一种常见的特征提取算法。对于python,我知道一个名为python_speech_features的库。该库可以提取MFCC功能。为了匹配功能,您可以使用机器学习算法。
保存在数据库中:http://*.com/questions/154707/what-is-the-best-way-to-store-media-files-on-a-database – AddcitedToLearn