Facebook研究为空间音频进行更好的信号增强
mhr18 2024-10-20 06:58 36 浏览 0 评论
查看引用/信息源请点击:映维网
语音处理
(映维网 2021年11月04日)近年来,使用空间处理算法从干扰扬声器、混响和/或环境噪声所造成的噪点环境中提取清晰语音的能力一直备受追捧。从仅提取感兴趣信号中获益的常见用例包括自动语音识别、助听器信号增强、在线语音聊天、视频会议及其他众多应用,例如在嘈杂的餐厅中实时增强语音。
业内认为,跨数据方法是降低信号噪点的稳健解决方案。例如,在空间信号增强领域,人们已经广泛研究了波束形成器的算法(如延迟和求和算法)和超定向算法(如最大方向性和差分麦克风阵列)。
其他更为优化的方法需要源和非期望噪点的统计知识。最小方差无失真响应(MVDR)和线性约束最小方差(LCMV)等方法提供了分离两种类型信号的最佳滤波器系数,同时不会使所需信号失真。LCMV公式允许对多个传递函数(如果可用)进行线性约束。仅依赖于期望或非期望的推断以及两者的混合信息的替代公式称为最小功率无失真响应(MPDR)和线性约束最小功率(LCMP)方法。
尽管上述方法能够在已知信号参数的情况下提供最佳解决方案,但仅从信号估计参数依然具有挑战性。业内存在几种空间滤波器参数估计方法,但它们通常假设语音源信号,并通常考虑是否已经发生语音的时间活动和概率。它们通常分类为语音活动检测器或流行的单通道语音存在概率(SPP)。
SPP同时有用于多通道阵列研究,以利用空间域确定不同空间位置的语音概率。所述方法基于这样一个假设:语音要么是感兴趣的目标信号,要么两者兼而有之。这种假设限制了语音方法的能力,特别是当干扰源可能是音乐、交通工具、动物或在时间或频谱上与语音不相似的其他来源时。
其他技术使用长时间历史记录和统计数据来分离数据源,这可能导致实时应用程序中的长延迟。鉴于仅依赖语音信号的局限性,已改名为Meta的Facebook在名为《Adaptive Multi-Channel Signal Enhancement Based on Multi-Source Contribution Estimation》的论文中提出了一种空间信号增强方法。
所述方法独立于期望和非期望源信号的频谱和时间统计,仅利用空间域处理技术进行自适应参数估计。当存在非语音的空间噪声源时,算法对源信号类型的独立性尤为重要。团队假设每个源向接收样本贡献一部分信号,并且相对贡献与样本在估计空间源参数中的有用性相关。在所述假设下,研究人员从初始到达方向(DOA)估计开始,并跟踪以确定源的位置。所述位置用于播种LCMV过程,然后用于确定每个源对当前接收信号的相对源贡献估计(SCE)。SCE值用作自适应学习噪声混响环境中声源统计参数的权重,而所述统计参数同时用于计算最终一组MVDR滤波器的参数。最终滤波器用于执行空间信号增强,从而增强选定的期望声源。用于最终MVDR的参数反馈到第一个LCMV中,因此能够随着时间的推移自适应地细化。
在实验,团队模拟了在不同混响时间内记录语音。房间尺寸为6 m×7 m×3 m,使用Eyring公式调整墙壁吸收系数,使混响时间在0.15 s到0.9 s之间变化。总共有6个不同的RT60值。所述信号是用343ms ?1的声速来模拟,采样频率16 kHz。带有6个等间距话筒的圆形话筒阵列的中心位置为(2,3.5,1.5)。在30 dB SPL的水平上,将高斯白噪声传感器噪声添加到所有接收信号中。三个语音源N=3随机放置在麦克风阵列周围,距离为1米到2米,角度间隔大于20度,方位角和仰角在±10度以内 。然后,团队从20组随机位置分析性能,处理接收到的信号。
当有清晰的语音片段时,空间自适应返回与真实活动密切相关的SCE。算法在混合源信号段中保持稳定性能。特定场景为算法确定正确的参数提供了明确的机会,从而使其能够实现与理想MVDR的紧密匹配。在更困难的场景中,只有一个源处于活动状态,从而限制了算法学习正确参数的能力。所述算法在阵列增益增加的情况下自适应地提高了性能。阵列增益的增加速度如图2所示,当L=8时,在不到2秒的时间内与性能匹配。值得注意的是,在图3中,无论L如何,30s后的值收敛于类似性能。阵列增益都在大约1s内超过“Max Directivity”波束形成器。
图4分析了阵列增益性能。对20组随机位置使用并重复与图2中的方法类似的方法。自适应在12秒后暂停,以确保分析反映了最大性能。所述方法的阵列增益略低于Oracle性能,但明显高于“Max Directivity”情况。所述方法的峰值性能平均达到17 dB,比“Oracle”方法的18 dB低1 dB。对于宽带语音范围,所述方法的平均性能仍比“Oracle”方法低1 dB至2 dB,且始终比“Max Directivity”方法的阵列增益高4 dB至9 dB。另外,作为RT60函数的性能显示了阵列增益和混响的反向相关性。对于所有混响级别,所述方法的最大性能与“Oracle”MVDR相似,因为它暴露于部分时间分离的源信号中。这一方法比等效的“Max Directivity”波束形成器(900毫秒的RT60)的阵列增益高7 dB以上。
总的来说,团队在这项研究中提出了一种方法来自动估计统计参数的空间滤波过程。所述方法估计环境中被跟踪源的空间能量贡献,并使用所述贡献乖离环境的统计表示。然后,研究人员从自适应行为、自适应速度和阵列增益收敛性能等方面对所述方法进行了分析。
相关论文:Adaptive Multi-Channel Signal Enhancement Based on Multi-Source Contribution Estimation
结果表明,所述方法能够正确地适应给定的一般初始化条件和噪点环境。自适应可以匹配理想空间滤波器的性能,并且当使用较小的缓冲区大小时,可以在不到两秒钟的时间内产生优于最大方向性波束形成器的阵列增益。由此产生的空间滤波器具有无失真约束,并且所述方法不限于语音源。
---
原文链接:https://news.nweon.com/91235
相关推荐
- 【预警通报】关于WebLogic存在远程代码执行高危漏洞的预警通报
-
近日,Oracle官方发布了2021年1月关键补丁更新公告CPU(CriticalPatchUpdate),共修复了包括CVE-2021-2109(WeblogicServer远程代码执行漏洞)...
- 医院信息系统突发应急演练记录(医院信息化应急演练)
-
信息系统突发事件应急预案演练记录演练内容信息系统突发事件应急预案演练参与人员信息科参与科室:全院各部门日期xxxx-xx-xx时间20:00至24:00地点信息科记录:xxx1、...
- 一文掌握怎么利用Shell+Python实现完美版的多数据源备份程序
-
简介:在当今数字化时代,无论是企业还是个人,数据的安全性和业务的连续性都是至关重要的。数据一旦丢失,可能会造成无法估量的损失。因此,如何有效地对分布在不同位置的数据进行备份,尤其是异地备份,成为了一个...
- docker搭建系统环境(docker搭建centos)
-
Docker安装(CentOS7)1.卸载旧版Docker#检查已安装版本yumlistinstalled|grepdocker#卸载旧版本yumremove-ydocker.x...
- 基础篇:数据库 SQL 入门教程(sql数据库入门书籍推荐)
-
SQL介绍什么是SQLSQL指结构化查询语言,是用于访问和处理数据库的标准的计算机语言。它使我们有能力访问数据库,可与多种数据库程序协同工作,如MSAccess、DB2、Informix、M...
- Java21杀手级新特性!3行代码性能翻倍
-
导语某券商系统用这招,交易延迟从12ms降到0.8ms!本文揭秘Oracle官方未公开的Record模式匹配+虚拟线程深度优化+向量API神操作,代码量直降70%!一、Record模式匹配(代码量↓8...
- 一文读懂JDK21的虚拟线程(java虚拟线程)
-
概述JDK21已于2023年9月19日发布,作为Oracle标准Java实现的一个LTS版本发布,发布了15想新特性,其中虚拟线程呼声较高。虚拟线程是JDK21中引入的一项重要特性,它是一种轻量级的...
- 效率!MacOS下超级好用的Linux虚拟工具:Lima
-
对于MacOS用户来说,搭建Linux虚拟环境一直是件让人头疼的事。无论是VirtualBox还是商业的VMware,都显得过于笨重且配置复杂。今天,我们要介绍一个轻巧方便的纯命令行Linux虚拟工具...
- 所谓SaaS(所谓三维目标一般都应包括)
-
2010年前后,一个科技媒体的主编写一些关于云计算的概念性问题,就可以作为头版头条了。那时候的云计算,更多的还停留在一些概念性的问题上。而基于云计算而生的SaaS更是“养在深闺人未识”,一度成为被IT...
- ORA-00600 「25027」 「x」报错(报错0xc0000001)
-
问题现象:在用到LOB大对象的业务中,进行数据的插入,失败了,在报警文件中报错:ORA-00600:内部错误代码,参数:[25027],[10],[0],[],[],[],[],[...
- 安卓7源码编译(安卓源码编译环境lunch失败,uname命令找不到)
-
前面已经下载好源码了,接下来是下载手机对应的二进制驱动执行编译源码命令下载厂商驱动https://developers.google.com/android/drivers?hl=zh-cn搜索NGI...
- 编译安卓源码(编译安卓源码 电脑配置)
-
前面已经下载好源码了,接下来是下载手机对应的二进制驱动执行编译源码命令下载厂商驱动https://developers.google.com/android/drivers?hl=zh-cn搜索NGI...
- 360 Vulcan Team首战告捷 以17.5万美金强势领跑2019“天府杯“
-
2019年11月16日,由360集团、百度、腾讯、阿里巴巴、清华大学与中科院等多家企业和研究机构在成都联合主办了2019“天府杯”国际网络安全大赛暨2019天府国际网络安全高峰论坛。而开幕当日最激荡人...
- Syslog 日志分析与异常检测技巧(syslog发送日志配置)
-
系统日志包含有助于分析网络设备整体运行状况的重要信息。然而,理解并从中提取有效数据往往颇具挑战。本文将详解从基础命令行工具到专业日志管理软件的全流程分析技巧,助你高效挖掘Syslog日志价值。Gr...
- 从Oracle演进看数据库技术的发展(从oracle演进看数据库技术的发展的过程)
-
数据库技术发展本质上是应用需求驱动与基础架构演进的双向奔赴,如何分析其技术发展的脉络和方向?考虑到oracle数据库仍然是这个领域的王者,以其为例,管中窥豹,对其从Oracle8i到23ai版本的核...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (74)
- oracle基目录 (50)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (53)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)