查看原文
其他

【AI测试】智能音箱的语音语义识别测试

凌晨点点 软件质量报道 2022-06-03


1. 语音识别测试

主要考虑距离、噪声、不同手机机型或硬件、不同网络

  • 噪音干扰识别测试

  • 不同距离识别测试

  • 不同机型识别测试

  • 不同网络语音识别速度测试

  • 监测灵敏度测试

  • 竞品对比测试


2. 语义识别测试

测试人员大部分时间会花在构造语义测试数据阶段。尽可能的收集各种语境和语义输入。


3. 构造语义测试数据的方法

1)发布前

语义测试开展(构造语义测试数据的四个阶段)

a. 人工脑暴数据

b. 实体扩充

  • 模板库 + 实体库自动化生成数据

  • 热门实体库更新(实体库为FM节目、FM专辑、音乐热歌、音乐新歌等)


c. 针对人说话特点以及音箱场景做专项定制化数据增长

  • 同音字替代

  • 实体少字

  • 模糊音替代

  • 干扰语气词

  • 重叠字

  • 实体颠倒

  • 实体含英文,数字等


d. 同义词扩充(同义词替代增长测试数据)

  • 训练ngram来判断语句是否通顺

  • 提升ngram模型能力

举个例子:


2)发布后

  • 线上真实用户句子

  • 人工标注,反哺测试数据

  • 相似度聚类问法,找出新的问法


4. 实际上没有那么简单,还有更多的测试维度:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存