语音盒中melcepst()中的采样时间和帧重叠,matlab?

问题描述:

我有一个矩阵21000x13 mfccs从一个wav文件。我有一个标签文件,该文件具有文本文件中该时间段的开始时间结束时间和标签。我需要找到mfcc矩阵中每个帧的时间,以便每个帧都可以使用标签。有谁知道采样率(30ms/50ms/20ms)和重叠(30%/ 40%/ 50%)。因此,我可以使用帧数X采样率+/-找到每帧落入的时间,重叠将给出帧的实际时间。例如。 1x20ms = 20ms,下一帧将在时间2x20 = 40,但在这里必须考虑重叠,因此如果50%重叠,则重叠为30。语音盒中melcepst()中的采样时间和帧重叠,matlab?

默认samping率是11025赫兹

默认帧大小是2的最高功率,其小于0.03 *采样率。对于默认的抽样率,帧大小为256个样本。您可以使用此公式进行计算:

pow2(floor(log2(0.03*fs))) 

默认重叠为50%。

所以默认的帧增量是128个样本。要获得偏移量,您需要将帧移位(128)上的帧数乘以采样率(11025)。

你可以在这里找到

http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/doc/voicebox/melcepst.html

+0

头的细节,所以如果我使用在计算MFCC那么这将是在毫秒帧长度默认值? – chris

+0

帧大小23.2ms帧移位是11.6毫秒 –

+0

这意味着如果第一帧在0毫秒开始,下一个将在11.6ms开始? – chris