云蝠智能*近的系统更新中,AI外呼上线了超实用的降噪模块。这一降噪模块使用到了语音活动检测(Voice Activity Detection,VAD),就是检测是否有声音。
降噪的目的在于突出信号本身而抑制噪声影响,在和客户的通话过程中,一个降噪环境可使得对话更加通畅,更有可能达成意向。为什么降噪模型对外呼非常重要?我们从算法、原理的角度来看一下吧。
VAD算法
常规的VAD算法是通过声音音量和频谱特诊来判断是否有声音的,但是无法区分是噪音还是人声,在电话机器人中噪音打断和噪音识别错误的关键词始终是一个痛点。
机器学算法可以通过大量噪音和人声数据训练出判别人声还是噪音的神经网络模型,VAD算法结合深度神经网络就可以彻底解决这个痛点了。
我们的*新VAD算法已经集成了人声噪音判别引擎!
噪音人声识别算法原理
噪音人声识别算法的原理是基于10G的噪音声音文件和10G的正常人声的声音文件,使用TDNN时延神经网络和LSTM长短期记忆网络训练出噪音人声音判别模型。
噪音人声识别的准准确率取决训练数据的准确性,目前的模型大于1秒声音准确率大于99%, 300毫秒以内短时人声和质量很差的人声,有少量识别成噪音的错误率,因为噪音库包含了大量的背景人声。
操作方式
系统内降噪模块开启方式如下:
打开呼叫中台中的呼叫设置,在其他页面打开防干扰等级并保存!
在呼叫系统设置中开启了防干扰等级按钮之后,能够有效降低了对话过程中各类非低音的噪音的打断和识别问题,使得电话通话更加流畅、清晰,完成高效触达!感兴趣的伙伴赶快去试试吧!