n)为加混响的远端参考信号x(n)+近端语音信号s(n)。理论上NLMS在处理这种纯线性叠加的信号时,可以不用非线性部分出马,直接干掉远端回声信号。图7(a)行为近端信号d(n),第二列为远端参考信号x(n),线性部分输出结果,黄色框中为远端信号。WebRTCAEC中采用固定步长的NLMS算法收敛较慢,有些许回声残留。但是变步长的NLMS收敛较快,回声抑制相对好一些,如图7(b)。线性滤波器参数设置#defineFRAME_LEN80#definePART_LEN64enum{kExtendedNumPartitions=32};staticconstintkNormalNumPartitions=12;FRAME_LEN为每次传给音频3A模块的数据的长度,默认为80个采样点,由于WebRTCAEC采用了128点FFT,内部拼帧逻辑会取出PART_LEN=64个样本点与前一帧剩余数据连接成128点做FFT,剩余的16点遗留到下一次,因此实际每次处理PART_LEN个样本点(4ms数据)。默认滤波器阶数为kNormalNumPartitions=12个,能够覆盖的数据范围为kNormalNumPartitions*4ms=48ms,如果打开扩展滤波器模式(设置extended_filter_enabled为true),覆盖数据范围为kNormalNumPartitions*4ms=132ms。随着芯片处理能力的提升,默认会打开这个扩展滤波器模式,甚至扩展为更高的阶数。
介绍双耦合声学回声消除算法。内蒙古自主可控声学回声设计
他的是线性回声传递函数。基于这样的数学假设,我们收到的信号y就可以表示成发射的信号x分别跟这样两个传递函数进行卷积之后的结果。接下来我们对这个模型进行了适当的简化,简化主要是基于数学分解,我们假设非线性的传递函数,可以分解成线性跟非线性这样两个系统函数的组合形式,就会得到中间的方程。接下来对中间的方程进行变量替换,就得到这个表达式,这个表达式它的物理意义很清晰,我们从可以看到,整个回声路径是可以表示成线性回声路径跟非线性回声路径二者之和的形式,这是它的物理意义。2.双耦合自适应滤波器,基于这样一个数学模型,接下来我们就构建了一种新的滤波器结构,称之为双耦合自适应滤波器。这个滤波器跟传统线性的自适应滤波器相比,主要有两个方面的不同,个不同是传统的线性滤波器只有一个学习单元,而我们的这个滤波器有两个学习单元,分别是这里的线性回声路径滤波器,我们用Wl来表示。还有非线性的回声路径滤波器,我们用Wn来表示。第二个不同就是,我们在这两个滤波器之间还加入了一个耦合因子,这个耦合因子目的就是为了协同二者更好的工作,让二者能够发挥出比较大的效能,甚至能够起到1+1>2的效果。
内蒙古自主可控声学回声设计在构建滤波器模型的过程中结合了非线性声学回声的一些特性。
再次回授、无限循环而产生反馈现象,而系统在均衡声场后,该现象其实是可以得到明显改观的。但话筒的拾音灵敏度是不是可以无限大呢?不是,在足够电平条件下,它始终会因拾取到具有相干性频率相位关系的输入信号而建立起回授。该图片源于网络上述啸叫现象并不是本文重点,但它为我们讨论接下来的话题提供了一个前提,那就是(同一个声场环境中)话筒和音箱无论怎么摆都无法做到完全的隔离,更别说空间声场条件有限的小中型会议室了。在一套有扩声、有拾音的远程会议系统中,为了防止信号回授,我们通常会有意识地将远端输入信号不再路由给远端输出。然而无法抗拒的是,本地话筒因拾取到远端传送至本地扩声的信号,仍可将声音重新传送至远端。这也是一种回授,明显的远程回授现象可使得系统发生自激震荡。该图片经我司设计员制作后作者再编辑通过一个简易的远程音频传输示意图,能帮助我们更容易地理解声音信号是怎样的流向。也能够更清楚地看到这里面可能存在的回授现象。部分工程师在调试远程会议系统时也许遇到过啸叫,那可不一定是本地系统没调好所造成的,你会发现,关掉终端一切非常正常。为什么绝大多数的远程系统没有啸叫呢?这还得感谢您还不算非常质量的网络。
23.避免厅堂音质缺陷的方法主要是从厅堂的体形设计和吸声材料布置两方面入手,消除产生音质缺陷的条件。例如,为了消除回声,应在可能引起回声的部位布置强吸声材料,使反射声减弱经;另一种方法是调整反射面角度,将后墙与顶棚交接处作成比较大的倾角,将声音反射给后区观众,彻底消除回声,取得化害为利的效果。为了消除声聚集现象,应尽量控制厅堂界的曲面弧度,采用凸形结构,并在弧面上布置合适的吸音材料。为了消除音质缺陷,可根据厅堂内声源的位置。采用几何作图法,用声线的分布找出各种声缺陷的条件和部位,再采取必要的措施进行抑制。24.回声指强度和时间差大到足可以引起听觉将它与直达声区分开来的反射声。从单一声源产生的一连串可分辩的回声则叫多重回声,当室内两个界面之间距离大于一定数值,且吸声量不足时,在其中间声源发出的声音就可能产生多重回声。回声会影响听音注意力,影响声音的清晰度,破坏立体声聆听的声像定位效果。25.颤动回声当声源在平行界面或一平面与一凹面之间发生反射,界面距离大于一定数值时会出现颤动回声。发生颤动回声时,声音有连续的重叠声,并有颤抖的感觉。颤动回声会引起听力疲劳,使人感到厌烦。
右边的非线性声学回声场景。
为什么又这么冷呢?我能想到的一个答案是它太难了,它非常有挑战性。下面就来看一下它的技术难点。5非线性声学回声消除的技术难点,我从6个不同的维度比较了线性的和非线性这两种回声消除问题。个维度,系统传递函数。在线性系统里面,我们认为系统传递函数是一个缓慢时变的系统,我们可以通过自适应滤波的方式去逼近这个传递函数,来有效抑制回声。而在非线性系统里面,系统传递函数通常是快变、突变的,我们如果用线性的方法去逼近的话,会出现滤波器的更新速度,跟不上系统传递函数变化的速度,就会导致声学回声消除不理想。第二个维度是优化模型,在线性里面我们是有一套非常完备的线性优化模型,从目标函数的构建到系统优化问题的求解,整个脉络是很清晰的。而在非线性的系统里面,目前是缺少一种有效的模型来对它进行支撑的。接下来的四个维度对应4个问题,它们是线性回声消除领域普遍存在的4个难点问题,这些问题在非线性领域也同样存在。比如强混响问题,我们如果在一个小型会议室里开视频会议,那么声音会经过多次墙壁反射,带来很强的混响,混响的拖尾时间会很长。如果想抑制这样的强混响回声,就需要把线性滤波器的长度加长。
非线性的声学回声消除问题,在实际声学系统里面非常普遍也非常棘手。内蒙古自主可控声学回声设计
对于耳机来讲,主要是声学回声,表现为收发环路的隔离度不好。内蒙古自主可控声学回声设计
而正是这两级客观存在的物理声学现象,造就了我们所讨论的内容。在远程会议系统的终端(本地),为了实现多人互动、多人拾音等目的,系统声音免不了被放大还原,而在诸如此类的放大系统中,为本地音箱能够听到远端声音,并能把本地拾音信号传送到远端而互通。众所周知,话筒在拾取到放大后的音箱信号后,再次回授、无限循环而产生反馈现象,而系统在均衡声场后,该现象其实是可以得到明显改观的。但话筒的拾音灵敏度是不是可以无限大呢?不是,在足够电平条件下,它始终会因拾取到具有相干性频率相位关系的输入信号而建立起回授。上述啸叫现象并不是本文重点,但它为我们讨论接下来的话题提供了一个前提,那就是(同一个声场环境中)话筒和音箱无论怎么摆都无法做到完全的隔离,更别说空间声场条件有限的小中型会议室了。在一套有扩声、有拾音的远程会议系统中,为了防止信号回授,我们通常会有意识地将远端输入信号不再路由给远端输出。然而无法抗拒的是,本地话筒因拾取到远端传送至本地扩声的信号,仍可将声音重新传送至远端。这也是一种回授,明显的远程回授现象可使得系统发生自激震荡。通过一个简易的远程音频传输示意图。能帮助我们更容易地理解声音信号是怎样的流向。
内蒙古自主可控声学回声设计