OLA端点问题实际应用效果
在上个博文中采用的hop_size=frame_size*3/4,这个效果如图:第一个是没有overlap
第二个图是OLA后的图,看起来比较好,但是听起来还是有杂声啊。。。我去,人生艰难啊。。。
而且处理时间是原来的3倍了,卧槽,这个不能忍啊。首先要确认,到底是不是分帧处理产生的,或者还是声音处理没做好?
实际应用中不可能那么大的hopsize,最多一半已经够了,不然没法玩。
另外有相关问题可以加入QQ群讨论,不设微信群
QQ群:868373192
语音深度学习群