Kaldi 报错:** split_data.sh: warning, #lines is (utt2spk,feats.scp) is (502,500); you can ** use uti

问题:使用Kaldi提取音频特征时候发生报错

Kaldi 报错:** split_data.sh: warning, #lines is (utt2spk,feats.scp) is (502,500); you can ** use uti

出现报错:** split_data.sh: warning, #lines is (utt2spk,feats.scp) is (502,500); you can ** use utils/fix_data_dir.sh data_test to fix this.

排除和解决

首先就是怀疑文件命名有问题

果然,在本地仔细排查,发现了两个命名有些“不合群”的音频问题;

可是修改之后依旧报错,再仔细检查还是没有其他发现;

后来发现在Linux服务器上查看文件非常的方便,直接看起排列是否整齐即可,
所以挨个说话人文件夹进行排查,结果发现了神奇的一幕:
Kaldi 报错:** split_data.sh: warning, #lines is (utt2spk,feats.scp) is (502,500); you can ** use uti
直接使用mv命令进行修改:mv 000000guoyingyu3002_1?????????.wav 000000guoyi ngyu3002_1.wav

成功解决了问题!