【AI测试】智能音箱--自然语言处理,语音语义识别测试
自己目前没有做过自然语言处理,语音语义识别测试,本文为听一场语音语义识别测试分享学习所得,以及结合网上学习资料整理。
语音识别测试
主要考虑距离、噪声、不同手机机型或硬件、不同网络
- 噪音干扰识别测试
- 不同距离识别测试
- 不同机型识别测试
- 不同网络语音识别速度测试
- 监测灵敏度测试
- 竞品对比测试
语义识别测试
测试人员大部分时间会花在构造语义测试数据阶段。尽可能的收集各种语境和语义输入。
构造语义测试数据的方法:
发布前
语义测试开展(构造语义测试数据的四个阶段)
-
人工脑暴数据
-
实体扩充
- 模板库 + 实体库自动化生成数据
- 热门实体库更新(实体库为FM节目、FM专辑、音乐热歌、音乐新歌等)
-
针对人说话特点以及音箱场景做专项定制化数据增长
- 同音字替代
- 实体少字
- 模糊音替代
- 干扰语气词
- 重叠字
- 实体颠倒
- 实体含英文,数字等
-
同义词扩充(同义词替代增长测试数据)
- 训练ngram来判断语句是否通顺
- 提升ngram模型能力
举个栗子:
发布后
- 线上真实用户句子
- 人工标注,反哺测试数据
- 相似度聚类问法,找出新的问法
测试驱动开发
- 总结分析问题(把出错的样本逐一分析原因并归类)
- 发现规律,解决某一类问题
- 主动去发现和挖掘问题