梅尔频率倒谱系数算法
问题描述:
我想获得一些音频的音色。梅尔频率倒谱系数算法
为了使用我将制作Mel频率倒谱系数算法。
实现看起来很简单(我已经完成了第1步): 1.对信号进行傅立叶变换(窗口化摘录)。 2.使用三角形重叠窗口将上面获得的谱图的能量映射到梅尔尺度上。 3.记录每个mel频率的功率记录。 4.对梅尔日志能量列表进行离散余弦变换,就好像它是一个信号。 5. MFCC是结果频谱的幅度。
在步骤2中我知道如何从频率传递给梅尔规模,但我不知道这是什么三角形的交叠窗口..
如何正确地做到这一步? 三角形重叠窗口是什么意思?