返回顶部

行业新闻

为您实时推荐驰声动态、行业新闻等最新资讯

首页 > 新闻中心 > 行业新闻 > 智能语音识别技术的原理和过程

智能语音识别技术的原理和过程

发布日期:2022-01-12

     随着人工智能领域数据、算法、算力这三驾技术马车的日渐成熟,语音交互已经成为新的交互方式。相比传统的图形化交互方式(GUI),语音交互方式(VUI)无疑更加方便快捷。

今天我们就来了解下机器是如何识别出人们所说的话的。

以下语音识别的主要处理过程:

第一步:语音识别(ASR,Automatic Speech Recognition),就是将麦克风采集到的自然声音转化为文字的过程。搜狗语音输入法、搜狗听写(速记)就是ASR技术的典型应用。

第二步:自然语义理解(NLU,Natural Language Understanding),就是将人的语言(已转为文字)转换为机器能理解的语言,比如将“给张三打电话”和“打电话给张三”理解成同样的意思。

第三步:自然语言生成(NLG,Natural Language Generation),与自然语义理解相反,是将机器的语言转换为人的语言(文字)。

一般将NLG和NLU合并在一起统称为NLP(自然语言处理,Natural Language Processing)。

它塑造出一个虚拟的人,并且有她的知识和性格,让你可以和她自然地交流起来。自动问答机器人是NLP的另一个典型应用,它能根据你所问的问题,去库中搜索相对最准确的答案。

第四步:语音合成(TTS,Text To Speech),将文字合成声音并播放出来,并尽可能的模仿人类自然说话的语音语调,给人以交谈的感觉。开车的朋友经常能听到郭德纲或者林志玲的导航提示,这就是TTS技术的典型应用。

智能语音识别技术.jpg

智能音箱是智能语音识别技术的最典型代表产品。而智能音箱在教室场景中,也正是担任着一种“助教”的赋能,其中的优势有三。

第一,智能音箱能作为及时的资料储备进行更为深度知识扩充。

比如讲苏轼的《赤壁赋》,你需要的不仅仅是改篇文章的知识,不仅仅是苏轼,甚至还要有苏洵、苏辙等唐宋八大家,甚至是苏小妹、佛印等的事迹。这些内容由智能音箱作为即使扩增,会大大环节教师的尴尬与压力。

第二,智能音箱能服务于课外活动,增加学生对科技的敏感度与兴趣度。

教育不止是只有教学活动,还有很多的课外活动,劳逸结合才能健康成长。就比如常见的“课前一支歌”,这个在很多学校都有延续使用,通过上课前一起唱首歌,调动学生的积极性。但是在实际在操作中,很多学生都会偷懒不唱之类的,原因就是对次缺乏兴趣,而如果有智能音箱配乐,允许学生们即时性的挑选一些积极向上的歌曲,那么就能够唤起学生参加集体活动的积极性。

除此之外,在课堂中有代表最先进语音交互技术的智能音箱存在,也能大大加强学生对于这种科学技术的兴趣,从小培养对这种高科技产品的敏感度,对于以后的学习工作都有一定的好处。

第三,智能音箱作为智能设备价格低,易于教室普及。并且对于很对厂商而言,也乐意以更低的价格进行教育投资,不仅是献爱心、做公益,同时也能够增加曝光度,变相的提升自己的品牌形象,可谓是双赢。


  • 苏州工业园区金鸡湖大道人工智能产业园C1-801
  • 电话:0512-62729761
  • 传真:0512-62729761
点击分享: