语音信号处理(赵力)作业答案第6章——说话人识别

1.自动说话人识别的目的是什么?它主要可分为哪两类?说话人识别和语音识别的区别在什么地方?在实现方法和使用的特征参数上和语音识别有什么相同点和不同点?
答:说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。

它主要可分为:自动说话人确认和自动说话人辨认。

说话人识别与语音识别的区别在于:它不注重包含在语音信号中的文字符号以及语义内容信息,而是着眼于包含在语音信号中的个人特征。

说话人识别方法的基本原理与语音识别相同,也是根据从语音中提取的不同特征,通过判断逻辑来判定该语句的归属类别。但它也具有其特点:
(1) 语音按说话人划分,因而特征空间的界限也应按说话人划分;
(2) 应选用对说话人区分度大,而对语音内容不敏感的特征参量;
由于说话人识别的目的是识别出说话人而不是所发的语音内容,故采取的方法也有所不同,包括用以比较的帧和帧长的选定、识别逻辑的制定等。

2.什么叫说话人辨认?什么叫说话人确认?两者有何异同之处?
答:说话人辨认是辨认出待识别的语音是来自待考察的N个人中的哪一个,说话人确认是确认一个人的身份。

相同点:本质上它们都是根据说话人所说的测试语句或关键词,从中提取与说话人本人特征相关的信息,再与存储的参考模型比较,做出正确的判断。
不同点:说话人确认只涉及一个特定的参考模型和待识别模型之间的比较,系统只做出“是”或“不是”的二元判决。而说话人辨认在辨认出语音来自哪一个人外,有时还要对这N个人以外的语音做出拒绝的判别。

3.怎样评价说话人识别特征参数选取的好坏?什么是F比有效性准则?F比的概念是怎样推广到多个特征参量构成的多维特征矢量的?
语音信号处理(赵力)作业答案第6章——说话人识别