声学特征 PLP
PLP的由来
Linear prediction可以用来获得语音功率谱
由于LP对待所有频率一视同仁,它不符合人耳的听觉机理,比如人耳对于高于800Hz的感知会下降,对于中间频段更敏感。
为了解决这个问题,Hermansky在进行LP之前修改语音的功率谱
PLP流程
在LP之前修改
critical-band spectral resolution
首先在频率轴上将Hz转化为Bark,参考bark scale,500Hz以下跟频率近似线性关系,500Hz以上近似log关系
然后和critial-band masking curve
equal-loudness preemphasis
为了模拟听觉对于不同频带敏感度的不同,使用equal-loudness curve对频谱进行预加重
其中
intensity-loudness power law
为了描述声音强度和感知响度之间的关系
参考
Perceptual linear predictive (PLP) analysis of speech