如何存储语音并从数据库中识别？

问题描述：

我想创建具有节点js的web应用程序并对js进行响应。如何存储语音并从数据库中识别？

这个网页应用程序将会有2个页面，其中一个将记录语音并存储在数据库中，而在第二页面中，任何用户可以在该web应用程序匹配该语音和数据库之后进入并说出任何内容，用用户名返回。

我已经做了记录的一部分保存在文件夹，但不知道是哪个数据库，我应该用它来存储数据，可以匹配第二页中的数据时，用户不需要有名字的时候他们说提前东西..

感谢我新的节点，并发生反应，请这方面的帮助：d

保存在数据库中：http://*.com/questions/154707/what-is-the-best-way-to-store-media-files-on-a-database – AddcitedToLearn

答

可以使用https://firebase.google.com/谷歌的火力为您实时数据库或用于存储音频文件

但匹配两个语音将无法正常工作为你必须使用一些像图书馆https://www.npmjs.com/package/wav-file-info

将语音输入与音频是在数据库

答

你正在试图解决的问题是自动语音识别（ASR）的一部分进行比较。很明显，您无法比较此问题域中的两个音频文件。相反，您需要计算语音的某种特征/指纹并匹配这些特征。 Mel-Frequency Cepstral Coefficients（MFCC）（click here）是一种常见的特征提取算法。对于python，我知道一个名为python_speech_features的库。该库可以提取MFCC功能。为了匹配功能，您可以使用机器学习算法。

如何存储语音并从数据库中识别？

相关推荐