返回顶部

行业新闻

为您实时推荐驰声动态、行业新闻等最新资讯

首页 > 新闻中心 > 行业新闻 > 智能语音引擎和“鸡尾酒会效应”有什么关系?应用场景有哪些?

智能语音引擎和“鸡尾酒会效应”有什么关系?应用场景有哪些?

发布日期:2022-02-24

最近几年,随着大数据和深度学习技术的发展,智能语音引擎进展颇丰。

想象一下,我们俩坐在餐厅里聊天,街道上有汽车的喇叭声,隔壁桌的两位小姐妹正在聊着明星八卦,不远处有小朋友在嬉戏打闹,头顶还放着不算太好听的流行音乐,突然某个人的手机响了,一连串不自然的尖锐的铃声……而在如此嘈杂的环境下,你还能够听清我的声音,不是因为我的声音比背景音大声,或是声音的性质完全不同,而是因为你的大脑将听觉注意力放在了我的声音上,并进行了过滤。

在多种声音混杂的环境中,注意倾听某一种声音,这种现象,叫作“鸡尾酒会效应”。如今,这种机制也被应用于智能语音引擎AI人声分离技术,这是智能语音识别的技术之一。普通的VAD技术已经可以识别出噪声和人声。

声音本质是携带信息的能量波,为了把你的声音从茫茫的噪声海中pick出来,智能语音引擎可以通过音频降噪和语音识别降噪,共同抑制噪声能量、增强人声能量。

 

应用场景一:语音通话

iPhone iOS 15 新功能「语音隔离」,可以滤掉人声以外的噪音,让人声更清晰、通话更为顺利,即便在通话过程中使用吹风机,对方竟然听不到使用吹风机的声音,只剩下人声,让人直呼神奇。

 

应用场景二:伴奏提取

智能语音引擎AI人声分离技术也被应用在音轨分离软件,将音乐里的人声和各种乐器声分离,快速完成伴奏。从歌曲提取伴奏,高品音质。从歌曲提取人声,高清晰度。

 智能语音引擎.jpg

如今,智能语音引擎的应用场景已越来越广泛,将大大便捷人们的生活。

  • 苏州工业园区金鸡湖大道人工智能产业园C1楼701、801
  • 电话:0512-62729761
  • 传真:0512-62729761
点击分享: