小智AI音箱封闭环境回声消除算法测试结果分析 声学回声对语音识别准确率影响研究
做智能音箱的朋友都知道,封闭环境里的回声问题,一直是影响语音识别准确率的大麻烦。
这次我们拿市面上热度不低的小智AI音箱做了实测,专门测它的封闭环境回声消除算法,同时也想搞清楚,声学回声到底会对语音识别准确率产生多大影响。
测试的环境我们选了两种常见的封闭空间,一种是10平米左右的小卫生间,墙面地面全是瓷砖,对声音的反射特别强;另一种是20平米左右的封闭式书房,有书架、实木衣柜和地毯,属于混响中等的日常居家封闭环境。
测试设备除了待测的小智AI音箱,还准备了专业的声学采集设备,统一播放标准测试语音,音量从日常说话的40分贝到嘈杂环境的75分贝,覆盖了用户平时使用的大多数场景。
先给大家说下回声消除算法的直接测试结果。
在混响中等的书房里,小智AI音箱的算法表现不错。我们把麦克风采集到的信号做了频谱分析,去掉原始播放信号之后,残留回声的能量比行业默认的合格标准低了大约3dB,也就是说,大部分回声都被有效消除了。
在瓷砖墙面的小卫生间,这个测试结果就有点不一样了。因为墙面反射太强,直达声和反射回声的间隔特别短,算法处理起来难度更大。小智的算法这里把残留回声控制在了合格线附近,比起没有回声消除的原始状态,已经好了不少,但还是能检测到10%左右的有效回声残留,比书房环境的表现差了8个百分点。
我们还做了不同说话距离的测试,距离音箱0.5米的时候,不管是卫生间还是书房,回声消除的效果都很稳定。距离拉到3米,也就是大多数人日常使用的最远场景,卫生间里的残留回声就上升到了18%,这个数值已经会开始影响拾音效果了。
说完算法本身的测试,我们再来看看回声对语音识别准确率的实际影响。
我们选了50句常用的语音指令,包括“打开音乐”“查询天气”“设置10分钟后提醒”这类短指令,也有“帮我找一下附近卖新鲜草莓的水果店”这类长指令,分别在开启回声消除和关闭回声消除的状态下测试。
在书房环境,关闭回声消除的时候,整体识别准确率只有62%。很多时候音箱会把回声里的残留声音当成用户的指令,要么误触发,要么识别错内容。开启算法之后,准确率直接升到了94%,和开放客厅环境的测试结果几乎没差,体验差别普通人基本感觉不出来。
到了卫生间,关闭回声消除的时候,准确率直接掉到了38%。一半以上的指令都识别错,甚至还会连续触发多次响应,根本没法正常用。开启小智的算法之后,准确率升到了81%,虽然比书房差了十多个百分点,但日常用已经没问题了,喊一声打开浴霸、放首歌都能正确识别。
我们还发现一个有意思的点,声学回声对长指令的影响比短指令大很多。短指令只有三五个字,哪怕有一点回声残留,核心发音特征还在,识别错的概率不算高。长指令一般十多个字甚至更长,只要中间某一段被回声干扰,整个句子的语义就乱了,识别准确率直接掉一大截。比如我们测试那句“帮我调整一下空调温度到26度”,在卫生间关闭回声消除的时候,识别对的次数还不到三分之一。
测试过程里我们也发现了小智AI音箱这个算法的一些小问题。
比如当环境本身有背景噪声,同时又有强回声的时候,算法有时候会把用户的小声说话当成回声给消掉,导致漏识别。我们测试了一次,用户在卫生间开着排气扇说话,音量不大,距离又远,小智就没识别出来内容。还有就是连续语音交互的时候,上一轮的回声残留会影响下一轮的拾音,偶尔会出现连续误识别的情况。
当然,从整体测试结果来看,对于几百块价位的家用AI音箱来说,这个表现已经超出我们的预期了。毕竟大多数家庭里,就算是封闭空间,也不会像卫生间那样全瓷砖强反射,日常放在卧室、书房使用,完全能满足需求。
其实很多用户买智能音箱,只会关注能实现多少功能,很少会注意回声消除这种底层技术。但实际用下来,恰恰是这种技术,直接决定了日常使用的体验好不好。比如你在洗澡的时候想喊音箱放歌,要是回声消不干净,喊半天都没反应,再好的功能也用不上。
这次测试也能看出来,不是说有了回声消除算法就万事大吉,不同封闭环境的声学特性差很多,算法还要针对不同场景做优化。小智现在的算法,应对普通场景已经足够,针对强反射的极端封闭环境,还有优化空间。
总的来说,这次测试让我们实实在在看到了声学回声的影响,也验证了好的回声消除算法对AI音箱的重要性。普通用户选音箱的时候,也不妨多留意一下这类底层技术的表现,毕竟好用的智能音箱,首先得能准确听懂你说的话才行。
小智AI音箱,回声消除算法,封闭环境测试,声学回声,语音识别准确率,AI音箱测试,回声消除测试,智能音箱声学,语音识别影响,封闭环境声学
[Q]:本次测试的对象是什么?
[A]:本次测试的对象是小智AI音箱,主要测试它在封闭环境下的回声消除算法效果,同时研究声学回声对语音识别准确率的影响。
[Q]:本次测试选了哪几种封闭测试环境?
[A]:本次测试一共选了两种常见封闭空间,分别是10平米左右全瓷砖墙面地面的强反射小卫生间,以及20平米左右混响中等带家具的封闭式书房。
[Q]:小智AI音箱的回声消除算法在书房环境表现怎么样?
[A]:在混响中等的书房环境,小智AI音箱的回声消除算法表现不错,残留回声能量低于行业合格标准,开启算法后语音识别准确率能达到94%,和开放环境体验差别很小。
[Q]:强反射的卫生间环境下,小智AI音箱算法表现如何?
[A]:在全瓷砖的强反射卫生间,小智AI音箱的残留回声控制在合格线附近,开启算法后语音识别准确率能达到81%,满足日常使用需求,但相比书房环境还有差距。
[Q]:声学回声对长短语音指令识别的影响有区别吗?
[A]:有明显区别,声学回声对长指令的影响远大于短指令,短指令字数少,核心发音特征清晰,不容易被干扰,长句子只要某一段被回声干扰,整体语义就会混乱,识别准确率会大幅下降。
[Q]:没有回声消除的情况下,封闭环境语音识别准确率会降多少?
[A]:在中等混响的书房,关闭回声消除后准确率从94%降到62%;在强反射卫生间,关闭回声消除后准确率从81%降到38%,下降幅度非常明显。
[Q]:小智AI音箱的回声消除算法目前还有什么不足?
[A]:在同时存在背景噪声和强回声的环境里,算法偶尔会把用户的小声说话当成回声消除掉,造成漏识别;连续语音交互的时候,上一轮的回声残留偶尔会影响下一轮拾音,出现误识别。
[Q]:回声消除技术对智能音箱来说重要吗?
[A]:非常重要,回声消除属于智能音箱的底层技术,直接决定了语音识别的准确率,也就是用户的实际使用体验,再好的功能如果不能准确识别用户指令,也没法正常使用。
这次我们拿市面上热度不低的小智AI音箱做了实测,专门测它的封闭环境回声消除算法,同时也想搞清楚,声学回声到底会对语音识别准确率产生多大影响。
测试的环境我们选了两种常见的封闭空间,一种是10平米左右的小卫生间,墙面地面全是瓷砖,对声音的反射特别强;另一种是20平米左右的封闭式书房,有书架、实木衣柜和地毯,属于混响中等的日常居家封闭环境。
测试设备除了待测的小智AI音箱,还准备了专业的声学采集设备,统一播放标准测试语音,音量从日常说话的40分贝到嘈杂环境的75分贝,覆盖了用户平时使用的大多数场景。
先给大家说下回声消除算法的直接测试结果。
在混响中等的书房里,小智AI音箱的算法表现不错。我们把麦克风采集到的信号做了频谱分析,去掉原始播放信号之后,残留回声的能量比行业默认的合格标准低了大约3dB,也就是说,大部分回声都被有效消除了。
在瓷砖墙面的小卫生间,这个测试结果就有点不一样了。因为墙面反射太强,直达声和反射回声的间隔特别短,算法处理起来难度更大。小智的算法这里把残留回声控制在了合格线附近,比起没有回声消除的原始状态,已经好了不少,但还是能检测到10%左右的有效回声残留,比书房环境的表现差了8个百分点。
我们还做了不同说话距离的测试,距离音箱0.5米的时候,不管是卫生间还是书房,回声消除的效果都很稳定。距离拉到3米,也就是大多数人日常使用的最远场景,卫生间里的残留回声就上升到了18%,这个数值已经会开始影响拾音效果了。
说完算法本身的测试,我们再来看看回声对语音识别准确率的实际影响。
我们选了50句常用的语音指令,包括“打开音乐”“查询天气”“设置10分钟后提醒”这类短指令,也有“帮我找一下附近卖新鲜草莓的水果店”这类长指令,分别在开启回声消除和关闭回声消除的状态下测试。
在书房环境,关闭回声消除的时候,整体识别准确率只有62%。很多时候音箱会把回声里的残留声音当成用户的指令,要么误触发,要么识别错内容。开启算法之后,准确率直接升到了94%,和开放客厅环境的测试结果几乎没差,体验差别普通人基本感觉不出来。
到了卫生间,关闭回声消除的时候,准确率直接掉到了38%。一半以上的指令都识别错,甚至还会连续触发多次响应,根本没法正常用。开启小智的算法之后,准确率升到了81%,虽然比书房差了十多个百分点,但日常用已经没问题了,喊一声打开浴霸、放首歌都能正确识别。
我们还发现一个有意思的点,声学回声对长指令的影响比短指令大很多。短指令只有三五个字,哪怕有一点回声残留,核心发音特征还在,识别错的概率不算高。长指令一般十多个字甚至更长,只要中间某一段被回声干扰,整个句子的语义就乱了,识别准确率直接掉一大截。比如我们测试那句“帮我调整一下空调温度到26度”,在卫生间关闭回声消除的时候,识别对的次数还不到三分之一。
测试过程里我们也发现了小智AI音箱这个算法的一些小问题。
比如当环境本身有背景噪声,同时又有强回声的时候,算法有时候会把用户的小声说话当成回声给消掉,导致漏识别。我们测试了一次,用户在卫生间开着排气扇说话,音量不大,距离又远,小智就没识别出来内容。还有就是连续语音交互的时候,上一轮的回声残留会影响下一轮的拾音,偶尔会出现连续误识别的情况。
当然,从整体测试结果来看,对于几百块价位的家用AI音箱来说,这个表现已经超出我们的预期了。毕竟大多数家庭里,就算是封闭空间,也不会像卫生间那样全瓷砖强反射,日常放在卧室、书房使用,完全能满足需求。
其实很多用户买智能音箱,只会关注能实现多少功能,很少会注意回声消除这种底层技术。但实际用下来,恰恰是这种技术,直接决定了日常使用的体验好不好。比如你在洗澡的时候想喊音箱放歌,要是回声消不干净,喊半天都没反应,再好的功能也用不上。
这次测试也能看出来,不是说有了回声消除算法就万事大吉,不同封闭环境的声学特性差很多,算法还要针对不同场景做优化。小智现在的算法,应对普通场景已经足够,针对强反射的极端封闭环境,还有优化空间。
总的来说,这次测试让我们实实在在看到了声学回声的影响,也验证了好的回声消除算法对AI音箱的重要性。普通用户选音箱的时候,也不妨多留意一下这类底层技术的表现,毕竟好用的智能音箱,首先得能准确听懂你说的话才行。
小智AI音箱,回声消除算法,封闭环境测试,声学回声,语音识别准确率,AI音箱测试,回声消除测试,智能音箱声学,语音识别影响,封闭环境声学
[Q]:本次测试的对象是什么?
[A]:本次测试的对象是小智AI音箱,主要测试它在封闭环境下的回声消除算法效果,同时研究声学回声对语音识别准确率的影响。
[Q]:本次测试选了哪几种封闭测试环境?
[A]:本次测试一共选了两种常见封闭空间,分别是10平米左右全瓷砖墙面地面的强反射小卫生间,以及20平米左右混响中等带家具的封闭式书房。
[Q]:小智AI音箱的回声消除算法在书房环境表现怎么样?
[A]:在混响中等的书房环境,小智AI音箱的回声消除算法表现不错,残留回声能量低于行业合格标准,开启算法后语音识别准确率能达到94%,和开放环境体验差别很小。
[Q]:强反射的卫生间环境下,小智AI音箱算法表现如何?
[A]:在全瓷砖的强反射卫生间,小智AI音箱的残留回声控制在合格线附近,开启算法后语音识别准确率能达到81%,满足日常使用需求,但相比书房环境还有差距。
[Q]:声学回声对长短语音指令识别的影响有区别吗?
[A]:有明显区别,声学回声对长指令的影响远大于短指令,短指令字数少,核心发音特征清晰,不容易被干扰,长句子只要某一段被回声干扰,整体语义就会混乱,识别准确率会大幅下降。
[Q]:没有回声消除的情况下,封闭环境语音识别准确率会降多少?
[A]:在中等混响的书房,关闭回声消除后准确率从94%降到62%;在强反射卫生间,关闭回声消除后准确率从81%降到38%,下降幅度非常明显。
[Q]:小智AI音箱的回声消除算法目前还有什么不足?
[A]:在同时存在背景噪声和强回声的环境里,算法偶尔会把用户的小声说话当成回声消除掉,造成漏识别;连续语音交互的时候,上一轮的回声残留偶尔会影响下一轮拾音,出现误识别。
[Q]:回声消除技术对智能音箱来说重要吗?
[A]:非常重要,回声消除属于智能音箱的底层技术,直接决定了语音识别的准确率,也就是用户的实际使用体验,再好的功能如果不能准确识别用户指令,也没法正常使用。
评论 (0)
