您现在的位置是:首页 > 人工智能 >

Google正在使用机器学习来改善Duo通话的质量

2020-09-15 15:02:13

当一项服务无法保持稳定的连接时,Google推出了一项新技术来改善Duo通话中的音频质量WaveNetEQ。它基于Google DeepMind部门的技术,旨在用人工噪声代替音频抖动,这种人工噪声听起来像使用机器学习生成的人类语音。

如果您曾经通过互联网拨打过电话,则可能会遇到音频抖动的情况。当作为呼叫一部分发送的音频数据包在途中丢失或以其他方式延迟到达或顺序错误时,就会发生这种情况。谷歌表示,有99%的Duo通话遇到数据包丢失:其中20%的音频丢失超过3%,而10%的音频丢失超过8%。有很多音频需要替换。

每个调用应用程序都必须以某种方式处理这种丢包情况,但是Google表示,这些丢包隐藏(PLC)流程可能很难填补60ms或更长的时间,而无需听起来像机器人一样或重复的。WaveNetEQ的解决方案基于DeepMind的神经网络技术,并且已接受来自48种不同语言的100多位演讲者的数据培训。

但是,系统可以替换的音频数量是有限制的。Google的技术旨在取代短声音,而不是整个单词。因此,在120ms之后,它会逐渐消失并产生静音。谷歌表示,已经对该系统进行了评估,以确保不会引入任何重大的新声音。另外,由于默认情况下Google Duo调用是端到端加密的,因此所有处理也都需要在设备上进行。通话的真实音频恢复后,WaveNetEQ将无缝地变回真实状态。

这是一种精巧的技术,可以在互联网出现故障时使通话更加容易理解。由于该手机的12月功能下降,该技术已可用于Pixel 4手机上的Duo通话,Google表示正在将其推广到其他未命名的手机中。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

热点推荐

点击排行

  • · Atlas房地产通过新招聘和促销活动...

    Atlas房地产通过新招聘和促销活动扩展团队专注于投资经纪,物业管理和机构收购的全方位服务房地产公司阿特拉斯房地产公司(Atlas Real Estate)认识到其科罗拉多州和亚利桑那州的团

  • · T-Mobile的Legere被评为美国最佳无...

    T-Mobile的Legere被评为美国最佳无线CEO 排名第四我们经常称赞T-Mobile首席执行官John Legere带领运营商的惊人转变,使其成为美国四大运营商中增长最快,最具创新性的运营商。今天,T-Mobi

  • · 亚马逊推出全新的Kindle Oasis电...

    亚马逊推出全新的Kindle Oasis电子阅读器 前置灯颜色可调推出第二代机型 两年后,亚马逊正在推出第三款电子阅读器Kindle Oasis系列产品。我们不确定亚马逊的命名惯例,但这家美国零售商决定将该

  • · 如何在Chrome for Android中打开黑暗模式

    如何在Chrome for Android中打开黑暗模式三星做到了这一点,华为做到了,谷歌和苹果将在2019年版本的古老移动操作系统中使用它 - 黑暗模式不需要任何演示,因为任何在半夜醒来的

  • · 汤斯维尔的2020年房地产展望

    汤斯维尔的2020年房地产展望这处位于24 50Primrose St,Belgian Gardens的房产每周租金为380美元。 上一年对汤斯维尔地区来说是不寻常的一年,对许多个人和家庭来说是一个创伤。在严峻的经济形势下,一场前所

  • · 为什么设计师们喜欢这种看起来很中...

    为什么设计师们喜欢这种看起来很中性的颜色呢如果有一个微妙的,舒缓的色调设计师最喜欢的是中性,它必须是蓝色的。特别是,一个苍白的,通风的,几乎没有阴影。那么有什么吸引力呢?浅蓝色反射自然光一样美丽的白色,但感觉只是