连老师都不一定能完全做到的细致口语纠错,AI就可以实现。口语发音的自动检错和诊断是计算机辅助语言学习和测试领域的关键技术之一,也有人称之为智能语音纠错技术。
驰声正式发布新一代英文智能语音纠错技术——诊断纠音内核(MDD)。此技术一经推出,就引起业界和媒体界的极大关注。
研发该内核的初衷,源于驰声智能语音评测实验室的一项发现:英文发音的自我检查其实很难实现,85%的语言学习者总在重复犯错。市场上大多数语音评测内核虽然能提供评分,但往往学习者第1次发音错误的地方,第10次练习依旧会在同样的地方犯错,他们不知道自己的发音错在哪里、如何去正确发音。这样的语言学习方式,明显并不高效。
那么,什么样的智能语音纠错技术才能最直观地提升学习效率?驰声团队研究发现,音素(phone),是根据语音的自然属性划分出来的最小语音单位。书面呈现学习者的实际发音序列,并与标准音标进行比较,进而发现错读、漏读、多读的音素,这样最为直观高效。
为此,驰声研究团队对分类、识别两大主流的误发音检测与诊断(MDD)框架进行整合,弥补了传统方法在发音检测过程中的缺点,从而提升检测诊断性能的准确性,无需添加设计错误规则也能全面覆盖错误情况。
▲诊断纠音内核应用示例
支持单词漏读、多读、错读检测
据了解,驰声这项最新的研发成果已实现商用——名为“诊断纠音内核”,采用音素级发音评价,通过漏读、多读、错读三种算法,可以检测出学习者在发音练习过程中的微小错误,更重要是,这项智能语音纠错技术突破了市面上大多评测引擎只能提供发音得分的瓶颈,可通过直观呈现学习者实际发音的音素序列,让发音问题“看得见”!
▲诊断纠音报告示例