麦克风算法仿真及实验台搭建 - V1

更新时间:2024-01-21 19:20:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

麦克风算法仿真及平台搭建

1. 基础知识

1.1阵列信号系统模型

dsin θ θ d d M-1

d 3

?? 1 2 M

图1.1:麦克风等间距线阵示意图

我们考虑等间距摆放的麦克风线性阵列,其示意图见图1.1。考虑到语音信号为宽带信号,我们在窄带信号模型的基础上,引出宽带信号模型。 1.1.1窄带信号模型

在信号处理中,窄带信号与宽带信号是相对而言的。设信号s(t)的带宽为B,中心频率为f0,若信号s(t)满足相对带宽条件,即:

f0B1,一般取

f0?10 (1) B则信号s(t)为窄带信号,反之为宽带信号。其中f0定义为

f0????????w|S(w)|2dw|S(w)|dw2? (2)

??B定义为

B??????(w?f0)2|S(w)|2dw?????|S(w)|dw2 (3)

式中S(w)为s(t)的频谱。

中心频率为f0的窄带信号s(t),其实数形式的表达式为:

s(t)?u(t)cos[2?f0t??(t)] (4)

为了推导方便写成复数形式,即

s(t)?u(t)ej[2?ft??(t)] (5)

0式中,u(t)为基带信号,其最高频率fh远小于正弦信号的频率f0,

cos[2?f0t??(t)]为载波信号,其中?(t)是正弦信号的初相位,假定为一

个常数。

为了简化模型,通常我们做如下假设:

(1)麦克风阵列位于信号源的远场,则接收到的信号为平面波; (2)传输介质是无损的、线性的、非扩散性的、均匀的且各向同性;

(3)麦克风的孔径远小于入射波的波长,而且麦克风无指向性,可近似认为麦克风是点元;

(4)麦克风阵列的间距远大于麦克风孔径,各麦克风之间的相互影响可以忽略不计。

现在考虑当信号源为单个窄带信号时,对于间距为d的均匀线阵(如图1.1),窄带信号s(t)的入射角度为? ,麦克风数为M个,声速为c?340m/s。由于信号到达各个麦克风的时间不同,第m个麦克风接收到的信号为

xm(t)?s(t??m)?nm(t) m?0,1,...,M?1 (6)

?m?d?sin?m为信号到达第m个麦克风相对其到达参考麦克风的时间c延迟,nm(t)为加性噪声。

由式(6)可知,信号到达第m个麦克风相对于到达参考麦克风只发生了一个相移e?j2?f?0m(?),则式(6)可变为:

xm(t)?e?j2?f0?m(?)s(t)?nm(t) (7)

将麦克风接收到的信号写成M?1维的向量形式,则麦克风输出为:

?e?j2?f0?0(?)??x0(t)???n(t) (8) ??s(t)? x(t)?? ??j2?f?(?)???0M?1x(t)???M?1??e?设a(f0,?)?[e?j2?f?(?)00e?j2?f0?M?1(?)]T为方向矢量,则

x(t)?a(f0,?)s(t)?n(t) (9)

对于D个窄带入射信号,设入射角为?d,d?1,2,,D,则方向矢量为

A(f0,?)?[a(f0,?1),a(f0,?2),...,a(f0,?D)] (10)

则麦克风输出可表示为:

x(t)?A(f0,?)s(t)?n(t) (11)

其中,s(t)?[s1(t),s2(t),...,sD(t)]T为

x(t)?x[0D

个窄带入射信号。

T为麦t(1)x,t(M?),x,()克]风接收到的信号。1...tn(t)?[n0(t),n1(t),...,nM?1(t)]T为加性噪声向量。

1.1.2宽带信号模型

根据阵列信号处理理论,如果用窄带波束形成方法来处理宽带语音信号会导致信号畸变,且信号的带宽越大,畸变越严重。因此,需

要用宽带波束形成方法来进行语音增强。

假定宽带信号s(t)是由J个窄带信号叠加而成,即

s(t)??sfm(t) (12)

m?1J式中sf(t)是以fm为中心频率的窄带信号。假设收到的为单个宽带信

m源,对于由M个麦克风组成的麦克风阵列,其输出为

x(t)??a(fj,?)sfj(t)?n(t) (13)

j?1J式中a(fj,?)?[e?j2?f?(?)j0e?j2?fj?M?1(?)T其中?m(?)为宽带信号到达第m个],

麦克风相对其到达参考麦克风的时间延迟。

当有D(M?D?1)个远场信号,分别来自?1,?2,...,?D方向,则第m麦克风阵列输出为

xm(t)??si(t??m(?i))?nm(t) (14)

i?1D式中,?m(?i)是第i个信号到达第m个麦克风相对其到达参考麦克风的时间延迟,Nm(t)为加性噪声。 对式(14)进行傅里叶变换,得到

xm(fj)??ei?1D?j2?fj(d/c)sin(?i)(m?1)si(fj)?nm(fj) (15)

令s(fj)?[s1(fj),s2(fj),...,sD(fj)]T表示D个远场宽带信号的傅里叶变换,n(fj)?[N0(fj),N1(fj),...,NM?1(fj)]T表示加性噪声信号的傅里叶变换,

A(fj)?[a(fj,?1),a(fj,?2),...,a(fj,?D)]表示D个远场信号的方向矢量。则麦

克风阵列输出宽带频域模型的矩阵形式表示为:

x(fj)?A(fj)s(fj)?n(fj) (16)

1.2噪声场

在麦克风阵列语音增强中,噪声来源取决于实际的应用环境,噪声场是一个很重要的概念,不同的方法可能适用于不同类型的噪声场。

语音信号在封闭环境传输时,由于反射、衍射的影响,会使麦克风阵列接收的语音来自多个路径,这种现象称为混响。混响对语音的影响表现为两个方面:首先,混响使语音信号产生失真;其次,混响改变了噪声场的空间特性。

混响对噪声场空间特性的改变体现为,单一的噪声源被扩展为多个不同方位的镜像源,噪声空间接近于散射噪声场。这一特性借助模平方相干函数来界定。设位于ri和rj的两麦克风接收到的噪声分别为

ni和nj,相应的自功率谱及互功率谱分别?(ri,w)、?(rj,w)和?(?ij,w)。

于是,定义噪声的空时域模平方相干函数为

Cij(w)?|?ij(w)|2?|?(?ij,w)|2?(ri,w)?(rj,w) (17)

根据Cij(w)的值把噪声场分为相干噪声场、非相干噪声场和散射噪声场。

(1)相干噪声场

相干噪声场是指噪声信号直接从噪声源传播到麦克风阵列,而没有经过任何因传播环境而产生的反射、散射和耗散。在相干噪声场中,阵列中的不同麦克风接收到的噪声信号具有强相干性,即|?ij(w)|2?1。在实际环境中,相干噪声场存在于开放的空气环境中,在这种环境的周围没有主要的障碍物影响声音传播,而热湍流的影响也很小。

(2)非相干噪声场

非相干噪声场是指在给定的空间位置的噪声信号与其它所有位置的噪声信号都不相关,也就是说|?ij(w)|2?0。这样理想的非相干噪声场在实际环境中不存在。而在麦克风阵列应用中,麦克风阵列中的电学噪声通常被认为是一种非相干噪声。非相干噪声也被叫做空间白噪声。

(3)散射噪声场

在散射噪声场,相同能量的噪声信号在各个方向同时进行传播。因此,散射噪声场中的麦克风接收到的噪声信号是弱相关的,并且具有近似相同的能量。许多实际的噪声环境都可以被看作是散射噪声场。在散射噪声场中,任何两点的噪声信号之间的相干性可以用麦克风之间的距离函数来表示

?ij(f)|?sinc(2?fdijc) (18)

式(18)中dij是麦克风i和j之间的距离。 2.语音增强算法分析及仿真

语音增强技术是信号处理领域中的主要研究内容, 在现代多媒体通信体技术以及人工智能系统中应用广泛。语音增强方法自提出至今,经历了单麦克风语音增强技术到阵列语音增强技术的转化,因为麦克风阵列语音处理技术采用“电子瞄准”的方法,可以从声源位置获取较高品质的语音因而得到广泛应用。其中波束形成是麦克风阵列语音增强的典型算法,它主要分为三类[4]:固定波束形成、后置滤

波波束形成和自适应波束形成。

固定波束形成语音增强由于采用的滤波器的权值固定不变,因而方法简单,运算量低,容易实现,能够抑制背景噪声,但是不具备自适应抑制强干扰的能力。因此对于可变噪声场效果一般。

后置滤波语音增强方法可以用来去除非相干噪声,但在相干噪声场情况下性能退化,甚至不能应用。

自适应波束形成方法, 例如 Frost提出的线性约束自适应波束形成法[5], 是在某种约束条件下,使输出信号能量达到最小。这是用优化手段实现语音增强的一种方法, 这种算法在相干噪声场情况下,可以得到较高的信噪比改善,但在弱相干噪声场或在散射噪声场中,性能甚至不如传统的固定波束形成方法。 2.1固定波束形成

固定波束形成方法是麦克风阵列语音增强算法中最简单易于实现的一种方法,也是最经典的麦克风阵列语音增强的算法之一。固定波束形成的含义是,是其波束形成器的权值固定不变,与麦克风阵列的接收信号无关。固定波束形成算法通过延时控制来补偿从声源到每个麦克风的延时,对每个麦克风接收到的信号进行延迟补偿,然后使麦克风阵列波束指向有最大输出功率的方向,即波束对准相应空间位置的声源信号,其原理如图2.1所示。

时延补偿x'1(n)x'2(n)?1w1?2w2?y(n)x'M(n)?MwM时延估计

图2.1 固定波束形成原理图

该固定波束形成器是典型的延迟-求和波束形成器,它包含三个部分:时延估计部分,时延补偿部分和加权求和部分。通过麦克风接收到的数据来估计各个麦克风的时延,然后通过时延补偿使麦克风信号同步,再加权相加得到波束形成器的输出。

设麦克风接收到的信号为x'i(t),权系数为w(i),则延迟-求和波束形成输出为:

y(t)??w(i)x'i(t??i) (19)

i?0M?1其中M为麦克风的数目,?i表示由时延估计得到的时延。若转换成数字形式时延为Ti?d?sin?(i?1)fs,其中fs为采样频率。 c该方法适合用来消除非相干噪声或者弱相干噪声,对于相干噪声几乎没有消噪能力。如果用来消除非相干噪声或弱相干噪声,它的消噪能力主要取决于麦克风的数目,麦克风的数目越多,去噪效果越明显。因此,该方法获得去噪效果是以增加麦克风数目为代价的,在实

际中较少单独使用。 2.2后置滤波波束形成

后置滤波可以用来去除声学环境中的非相干噪声,人们提出将波束形成器的输出信号通过后置滤波器以进一步提高输出信号信噪比。1977年Allen利用波束形成的方向性增益和维纳滤波器对非相干噪声抑制能力,提出将后置滤波用于语音增强。1988年Zelinski将其扩展到麦克风阵列中,对延时—求和波束形成的输出端使用自适应维纳滤波器,从而提出基于后置滤波的麦克风阵列语音增强方法,进一步改善了噪声抑制能力。鉴于实际声学环境下噪声类型和噪声场的复杂性,许多学者将性能互补的方法相结合,以改善语音增强方法的噪声抑制能力。1996年,Fischer和Simmer提出了GSC与Wiener滤波相结合的频域麦克风阵列语音增强方法 ,以抑制声学环境中的相干和非相干噪声。2003年Gannot和Cohen提出了基于传递函数GSC和后置滤波的频域麦克风阵列语音增强方法[7][8],以去除噪声场中可能存在的相干噪声、非相干噪声及非平稳噪声。

下面具体介绍一下基本后置滤波算法的原理。

后置维纳滤波是后置滤波和波束形成技术相结合的产物。滤波求和波束形成器的输出由维纳滤波器进行后置滤波处理,其目的是进一步减少己经由固定波束形成器去除不相干的噪声后的残余噪声成分。经典的后置滤波方法是R.Zelinski在1988年提出,其系统结构如图2.2所示。

延时补偿x'1(?)?1x1(?)w1w2?x'2(?)?2x2(?)Y(?)H(?)Z(?)x'N(?)?NxN(?)wN时延估计维纳后置滤波估计图2.2 后置自适应滤波系统框图

其中,固定波束形成器累加之前每个通道的输出为:

yi(n)?wi(n)xi(n) (20)

因此,固定波束形成器的输出为

y(n)??wi(n)xi(n) (21)

i?0M?1其中M为麦克风的数目。

信号经过固定波束形成器后,进行维纳滤波的后置处理。 维纳滤波方法就是按照最小均方误差的准则对期望信号s(t)进行估计,即选取s(t)的估计值s(t),使均方误差如式(22)最小。

??E{[s(t)?s(t)]2}?E{e2(t)} (22)

也即要设计一个数字滤波器h(t),当输入为x(t)时(x(t)?s(t)?n(t)),滤波器输出:

s(t)?x(t)?h(t) (23)

满足式(22)。

根据正交性原理,最佳h(t)必须满足对所有k有下式成立:

E{[s(t)?s(t)]x(t?k)}?0 (24)

将式(23)代入式(24),并对式子两边取傅里叶变换,得到我们常说的维纳-霍夫方程

H(?)?Rsx(?) (25) Rx(?)式中Rx(?)为x(t)的功率谱密度,Rsx(?)为s(t)与x(t)的互功率谱密度。 由于s(t)和n(t)不相关,即Rsn(?)?0,则可得

Rsx(?)?Rs(?) (26) Rxx(?)?Rs(?)?Rn(?) (27)

于是,式(25)变为

H(?)?Rs(?) (28)

Rs(?)?Rn(?)式(28)即为维纳滤波器。

采用维纳滤波最大的好处是增强后的残留噪声类似于白噪声,而不是有节奏起伏的音乐噪声。但是维纳滤波只是在平稳条件下才能保证在最小均方误差意义下的最优估计。而语音是非平稳的,只在短时间内近似平稳,实际环境中的噪声也是非平稳的,这是维纳滤波的缺陷所在。

由于维纳滤波器可以实现理论上的最优滤波,因此,如果把波束形成方法与维纳滤波相结合,可以进一步减少固定波束形成器去除不相干噪声后残留的噪声成分,使得处理的效果得到进一步的加强。

图2.2为具有后置滤波的语音增强系统的结构图。该系统首先对

各个麦克风接收到的信号进行延时估计和补偿,并进行了FFT变换;随后计算接收信号的自功率谱和互功率谱,由这些短时功率谱可以得到自适应维纳滤波系数;最后将相加平均后的信号输入到维纳滤波器中,从而得到所求语音信号的估计值。这种算法要求假定麦克风阵列的间距比较大,同时要求所求语音信号源于麦克风的距离不小于各噪声源与麦克风的距离,这时可认为语音和噪声,各通道噪声之间是彼此不相干的。

每个通道的信号经过延时估计和补偿后的信号为

xi(?)?s(?)?ni(?) (29)

即该信号包括所期望的有用信号s(?)和噪声信号ni(?)。

h(?)为后置滤波的传递函数,其最优解可以表示为

hopt(?)??ss(?) (30)

?ss(?)??nn(?)其中,?ss(?)是所期望的有用信号的自功率谱密度,?nn(?)是噪声信号的自功率谱密度。

对于随机过程来说,由于功率谱和相关函数互为傅里叶变换对,于是通过计算,我们有第i和第j声道上信号的自功率谱和互功率谱密度分别如下:

?xx(?)??ss(?)??nn(?)??sn(?)??ns(?) (31)

iiiiii?xx(?)??ss(?)??nn(?)??sn(?)??ns(?) (32)

ijijji假定:

1. 信号与噪声是不相关的(即?ns(?)?0,?i);

i2. 每个麦克风上的噪声信号是不相关的(?nn(?)?0,?i?j);

ij3. 所有麦克风上的噪声信号有着相同的功率谱(?nn(?)??nn(?),?i)。

ii那么式子(13)和式(14)可简化为:

?xx(?)??ss(?)??nn(?) (33)

ii?xx(?)??ss(?) (34)

ij将式(33)、(34)代入式(30)中,则可以得到后置滤波的传递函数。通过对所有麦克风组合的谱密度估计进行平均,就可以得到更加准确的估计值:

N?1N2??Re(?xixj(?))N(N?1)i?1j?i?1hz(?)? (35) N1?xixi(?)?Ni?1其中Re()表示取实部的运算符,由于?xx(?)实际上代表期望信号的自

ij功率谱,所以它应该是一个实数值。因此取?xx(?)的实部,以减少估

ij计误差。另外对于随机过程来说,由于功率谱和相关函数互为傅里叶

*2变换对,所以有?xx(?)?Xi(?)X*j(?),?xx(?)?Xi(?)Xi(?)?|Xi(?)|。

ijii后置维纳滤波算法需要假定阵列中麦克风间的距离比较大,同时要求所求语音信号源与麦克风的距离小于各噪声源与麦克风的距离,这时可以认为语音和噪声、各通道噪声之间彼此是不相干的。后置维纳滤波算法的性能与噪声的相干场有关,对于相干噪声场,后置维纳滤波器几乎没有消噪能力,而对于非相干场则效果明显。 2.3自适应波束形成:线性约束最小方差波束形成算法

线性约束最小方差(linearly constrained minimum variance, LCMV)波束形成算法可以实时地对所求信号进行处理,同时又可有效抑制噪

声干扰。这种算法对宽带麦克风阵列处理系统的滤波系数不断进行迭代更新,在保持期望信号方向上的频响不变的条件下,使输出的噪声功率达到最小。该算法实质上是一种带约束的LMS算法。这种算法需要知道所求语音信号的方向,并对其事先设定一个固定的频响。在阵列作完时间延迟补偿后,对于所求信号而言,各麦克风在对应延迟线上的波形是完全相同的,其总的处理效果相当于一个单独的阶数为K的滤波器,其系数等于对应M个延迟抽头系数之和。所以,这MK个系数的选择,应当满足事先给定的滤波系数值,即需要满足K个线性约束等式。这K个约束同时也将所求信号的功率输出保持在一定量值上。这样,对于这些系数的选择,自由度还有MK-K,它们用来使输出总功率最小。由于事先保证了所求信号的功率,总功率最小也就意味着系统输出的噪声功率达到最小,所以它对其它方向上的干扰噪声能够进行有效消除。

这种算法的一个主要优点在于它具有自纠正功能,不会由于程序在运行过程中的舍入误差或截取误差的累积而偏离约束值。该处理系统见图2.3。

延时补偿x'1(n)?1x1(n)?x1(n?1)?x1(n?2)x1(n?(K?1))?w2M?w(K?1)M?w0x'2(n)?2x2(n)wM??w1?wM?1??w2M?1?w(K?1)M?1??y(n)x'N(n)?N时延估计xN(n)?wM?1?w2M?1????w3M?1??wKM?1???f1?f2??f3?fK?

图2.3:LCMV算法-基本宽带波束形成系统框图

麦克风阵列接收信号为:

x(n)?s(n)?n(n) (36)

其中:

x(n)?[x0(n),x1(n),,xM?1(n?(K?1))]T (37)

s(n)?[s(n),,s(n),M个,s(n?(K?1)),,s(n?(K?1))]T (38)

M个n(n)?[n0(n),n1(n),,nM?1(n?(K?1))]T (39)

假定所求信号和干扰噪声的均值均为0,并且期望方向所求信号与其它方向上的干扰噪声互不相关,即

E[s(n)nT(n)]?0 (40)

阵列的输出

y(n)?wTx(n)?xT(n)w (41)

其中w为权系数向量

w?[w0,w1,,wMK?1]T (42)

进而输出功率可以通过下式来计算

E[y2(n)]?E[wTx(n)xT(n)w]?wTRxxw (43)

约束条件要求麦克风阵列中延时相同的抽头上的权系数之和满足事先给定的滤波系数,即

cT,...,K?1 (44) kw?fk,k?0,1这里MK维向量ck表示如下

ck?[0,...,0,...,0,...,0,1,...,1,0,...,0,...,0,...,0]T (45)

MM第k组(M个1)MM定义约束矩阵

CMK?K?[c0,c1,,cK?1] (46)

及滤波系数向量

F?[f0,f1,,fK?1]T (47)

式(43)中的线性约束条件可以表示为

CTw?F (48) 常见的一种约束形式(即无失真约束)如下

f0?1,fk?0(k?1,...,K?1) (49)

由于阵列注视方向上的频响由K个约束完全确定,因此所求信号的输出功率也完全确定。这样,减少非注视方向的干扰噪声功率等同于要求使全部输出功率最小,所以这里优化问题的目标就是使式(43)达到最小。最后,关于MK个权系数的求解问题就变为带约束的LMS优化问题

TTwRw s..tCw?F (50) xxminw根据拉格朗日乘子法可以得到上述优化问题的解为

1?1wopt?RxxC[CTR?C]F (51) xx这样就构造出一个在空间上和频域上的滤波器。将上式代入式(41),得到信号估计值为

yopt(n)?wToptx(n) (52)

在上述过程中,输入相关矩阵Rxx假定是已知的,而实际情况下它只能通过自适应学习方法获得。如果直接代入自相关矩阵的估计值,由于需要求解它的逆矩阵,这就使得运算量很大,所以一般利用梯度下降方法来求解带约束的LMS问题。

对于滤波器的权系数向量初始值,首先应该满足约束条件

w(0)?C[CTC]?1F (53)

利用梯度下降法,迭代公式应为

w(n?1)?w(n)??[Rxxw(n)??(n)C] (54)

其中?(n)为拉格朗日乘子,?为步长。新的权系数向量仍需满足约束条件,从而可得

w(n?1)?w(n)??[I?C(CTC)?1CT]Rxxw(n)?C(CTC)?1[F?CTw(n)] (55)

上式右边最后一项中的因子[F?CTw(n)]在理想情况下等于零,但在应用中由于存在舍入误差或截取误差,这一项实际上并不等于零。加入该项可以避免误差累积,使权系数向量在迭代后不致偏离优化解。令:

??C(CTC)?1F (56)

P?I?C(CTC)?1CT实际迭代中,利用每次输入信号向量的外积来作为自相关矩阵的估计值。最后该算法归结为:

w(0)?? (57) T?1w(n?1)?P[w(n)??y(n)x(n)]?C[CC]F式(57)即为LCMV算法求解权矢量的表达式。

实验证明,线性约束自适应波束形成方法对于相干噪声场有比较好的消噪性能,而对于非相干噪声场,去除噪声的效果并不比延迟-求和波束形成的效果好。 2.4 仿真验证

仿真条件:8单元均匀线阵,阵元间距d=7cm,期望信号来向38°,干扰信号(噪声语音信号)来向5°,SNR=-3dB,INR=5dB,干扰信号和期望信号同时到达第一个阵元(参考阵元)。

纯净语音信号(期望信号)、噪声语音信号(干扰信号)及噪声时域波形见图2.4。

纯净语音信号1幅度0-100.511.52Time/sed噪声语音信号2.533.51幅度0-100.511.52Time/sed噪声信号2.533.51幅度0-100.511.52Time/sed2.533.5

图2.4:各信号时域波形

阵列接收到的信号,延时-求和法、后置滤波法及LCMV法处理后的语音信号如图2.5所示。其中LCMV算法中滤波器阶数为J=24,步长为??0.009。

纯净语音信号11阵列接收的语音信号幅度0-1234Time/sed延时-求和处理后的语音信号10-1012Time/sed3401幅度0-10234Time/sed后置滤波处理后的语音信号11幅度幅度0-1023Time/sedLCMV处理后的信号141幅度0-1012Time/sed34

图2.5:各算法处理后的语音信号

由上图可见:延时-求和算法结构简单,能有效消除相干噪声,但不具有自适应干扰抑制能力,且对非相干噪声消除作用有限;后置滤波法在延时-求和的基础上进行滤波处理,效果好于延时-求和法,能有效消除非相干噪声,但经过播放处理后的语音,可以发现信号有一定的失真;LCMV自适应算法,适合时变的声学环境,对相干噪声有很好的消除能力,对非相干噪声的消除作用有限(这里滤波器的阶数比较大J=24,如果变小性能会变差,小到一定程度时,消噪效果

还不如后置滤波法)。

3.麦克风实验平台的搭建[1]

自适应天线是当前信号处理和通信领域最热门的技术之一,它的应用可以充分利用无线资源的空间可分割性,有效地抑制干扰,提高无线通信系统对无线资源的利用率,从根本上提高系统容量和服务质量。为了使这项技术能够尽快实用化,进行自适应天线实物的研究已经迫在眉睫。因此,在对自适应天线算法进行理论分析和仿真的基础上,有必要进行一些实际的测试。为此,可以通过搭建一种自适应天线系统的实验平台,以验证各种智能天线阵列和控制算法的有效性和实用性。但是,鉴于自适应天线系统的天线阵元加工难度较大、成本较高,还要制作相应的射频单元,同时还需要根据实验情况适时地调整阵元和算法,因此,在实际的电磁环境下实验和测试各种天线阵列、自适应天线控制算法的性能存在较大的难度。为了验证自适应算法的有效性,我们可以通过麦克风阵列来验证。 3.1 麦克风阵验证DBF算法的可行性分析

下面提出了一种用工作原理与“自适应天线系统”相同的“麦克风阵”来构建实验平台的想法。因为自适应天线是采用一定阵元数的阵列天线,各阵元的空间位置不同,同一无线电信号到达各个阵元波程差也不同,因而可用于波达估计(DOA)。而不同方向的信号通过阵列天线后产生不同的阵列响应,自适应天线接收系统可采取一定的算

法(可在射频、中频或基带实现)把不同方向的信号区分开来,从而降低干扰,提高系统性能。因此,在自适应天线系统中,天线阵列结构和控制算法对整个系统的性能起着重要的影响,同时也是自适应天线系统的研究核心。

麦克风阵系统也是基于麦克风阵列结构和自适应算法两大核心内容的系统。虽然自适应天线系统与麦克风阵系统接收的信号分别是射频信号和语音信号,两者存在较大的差异,但是,对于两个系统所研究的核心内容却是相同的,不管是射频信号还是语音信号,在系统中都只是当作一个信号来进行分析和处理,其最终目的是为了选择最好的阵列和最优的算法。因此,可以用麦克风阵列来代替自适应天线阵列,在计算机平台中进行算法处理,来测试不同的自适应天线系统中的天线阵列和控制算法。

自适应天线是由多个天线单元组成的,自适应的含义就是其通过反馈控制方式恰当的改变调整加权系数,从而连续调整自适应天线本身方向图。有时为了使其同时具有空域和时域的处理能力,在结构上,可以在自适应天线阵的每个天线后接一个延时抽头加权网。而自适应麦克风阵在结构上与自适应天线类似,也是通过连续调整自适应麦克风阵的加权系数,实现辨识信号的方向和降低干扰。所以,完全可以用麦克风阵元来代替天线阵元,利用自适应麦克风阵作为自适应天线的实验平台,基于麦克风阵列来寻求较佳的自适应天线的天线阵列结构和自适应算法。

此外,用麦克风阵列替代天线阵列,可以大大减少了研制费用、周期,降低制作难度,同时还不需要射频部分。一旦要进行自适应天线系统的实验只需更改天线阵列、接入射频部分即可,也可以根据需要在计算机中修改算法,具有通用性和灵活性。 3.2 实验平台的搭建

下面主要介绍基于麦克风阵的自适应天线实验平台的原理、结构、功能及主要技术指标。 3.2.1实验系统的原理与实现

基于麦克风的自适应天线实验平台的信号处理结构图见3.1。

干扰声源麦克风阵列噪声处理系统放大滤波电路采集卡 图3.1 基于麦克风的自适应天线实验平台的信号处理结构图

系统各模块功能:

(1) 麦克风阵列。在构建系统时,本系统拟选用8个阵元的阵列,并且采用间距为0.07m的均匀线列阵,较为适合于语音频段的空间采样。

(2) 放大滤波电路。该电路用来提高系统的灵敏度,滤除部分噪声以及提供采集卡正常工作所需的阻抗和信号,包括阻抗匹配和动态范围的匹配。

(3) 采集卡。选用8通道的数据采集卡,将放大滤波后的信号进行采集转换,并通过一定的方式传至处理系统,然后在处理系统进行语音增强。对于采集卡有一个采样率设置问题。为了使采样后输出的离散时间序列信号能无失真地复现原输入信号, 由采样定理可知采样频率fs至少应为输入信号最高有效频率fmax的 2 倍, 否则会出现频率混淆误差。实际系统为了保证数据采样精度, 一般有下列关系:

fs?(7~10)fmax?N

式中N为多通道数采集系统的通道数。考虑到实际语音信号90%~95%的频率集中在300Hz~3kHz频段,则对于16路的语音采集系统可设定采样频率为216kHz。

(4)处理系统。处理系统完成语音信号的处理。接收到数据采集卡传来的数据后,利用一定的自适应算法,对数据进行处理(如语音增强等),验证算法及天线结构的有效性。对于处理系统可以采用计算机作为数据处理平台。系统以计算机作为数据处理平台即处理系统,可以根据不同自适应天线实验的需要,采用不同的阵列结构,选

用不同的自适应算法,能够达到通用平台的效果。

另外,考虑到数据传输的稳定性及传输速度,考虑采用计算机的PCI总线作为数据输入接口,由进行具体编程的数据采集卡来实现。

由以上对实验系统各个模块的分析,用麦克风阵列实验平台验证DBF算法的实验过程可表述为:设置信号源(声源)和干扰源(语音信号),图3.1中的噪声为背景噪声;然后声音信号经过传播,到达麦克风阵列。麦克风将声音信号转换成模拟的电信号,该模拟电信号经过放大滤波后传至数据采集部分,数据采集部分又将模拟电信号转换成计算机平台可以处理的数字信号,然后该数字信号经过输出送至计算机平台,计算机平台采用一定的自适应算法对信号进行处理,验证自适应算法的有效性。

具体实验中,可设置声源来自38°方向,干扰源来自5°方向,其中干扰源也为语音信号。选用DBF中常用的自适应算法LCMV算法对语音数据采集卡采集到的语音信号进行处理,以验证LCMV算法。

3.2.2 实验平台各模块的设计

由上节知该实验平台主要包括4个模块:麦克风阵列、放大器滤波、数据采集卡和计算机处理平台。简化的实验系统结构如图3.2所示。本节对各个模块的设计和功能进行详细介绍。

1声源S(?0,r)r?/223放大滤波电路数据采集卡干扰源I(?i,l)?il?0M-2M-1MPCI计算机平台

图3.2 麦克风阵实验系统框图

(1)麦克风阵

麦克风阵完成语音数据的采集,其功能等同于自适应天线系统的天线阵元,可以灵活地采用不同的结构。一般采用4~16天线阵元结构,相邻阵元间距取接收信号中心频率波长的1/2。阵元间距过小,降低接收信号相关度;阵元间距过大,将在方向图上引起不必要的波瓣,因此阵元半波长间距通常是优选的。天线阵列形式主要有直线形阵列、圆环形阵列或者平面阵。不同的阵列结构,它们的空间位置(方位或仰角)也是不相同的。当然,在实际的自适应天线实验中,该阵列结构的选择将根据所使用的自适应天线的天线阵元来决定,对于不同的实验可以灵活地调整麦克风阵的阵列结构来进行测试,从而使该实验平台能对不同的自适应天线系统进行实验,具有很高的通用性和灵活性。

在这里,我们使用全方向性驻极体传声器——松下公司的WM-61。一个底面直径为6mm、高3.4mm的圆柱体。其灵敏度达到

-35分贝,信噪比高达62分贝。并且,在20Hz--200Hz这一频段内,

WM-61的灵敏度非常稳定,确保了语音信号转化为电信号的准确性。

(2)前置放大器

前置放大的作用在于提高系统的灵敏度以及提供采集卡正常工作所需的阻抗和信号,包括阻抗匹配和动态范围的匹配。

前置放大以两块LM324集成运放为主体。每块LM324包含4个放大单元,将每个放大单元设计为反相放大器,由2个放大单元对一路麦克风信号进行放大,增益设计为20dB。对于16路语音信号,需要8块LM324。

(3)数据采集卡

数据采集单元主要是将阵结构从各个方位收到的信号采集到计算机平台中去,以便进一步的处理。由于输入的数据流量非常大,故采用计算机的PCI总线作为计算机的数据输入接口。

可以采用NI公司的多功能数据采集卡NI PCI-6220,如图3.3所示。它具有16位的AD采样精度,16路模拟输入,总带宽速度为250k/s。如同时采集8路声音信号。每个通道分配的AD采样速率达30k/s。完全能够满足语音信号采样的要求。

另外,数据采集卡需要通过软件对其进行设置。注册采集卡,让计算机识别采集卡并获得采集卡号;设置采样频率采样的通道数、采集卡号以及输入动态范围等。设置完成后开始采集数据,并将将采集到的数据以二进制形式写入预定好的文件。

图3.3 N1PCI-6220数据采集卡

(4)计算机平台部分

计算机平台主要完成两部分工作,一是对采集的数据选用好的自适应算法进行自适应处理,来控制和调整麦克风阵列加权网的加权系数,改变阵列的方向性,实现对信源的定位和对信号的增强,;二是可以将数据生成语音文件,完成对信号的复原。

自适应天线系统的核心是自适应算法,因此重要的是选择较好算法实现波束的自适应控制。目前已提出很多著名的自适应天线算法,可以分为两类。一是在时域获得天线的最优加权,有最小均方算法(LMS),取样协方差矩阵的直接求逆(DMI),递归最小均方误差算法(RLS)等;二是在空间域对频谱进行分析,以获得DOA的估计。其中DFT和最大熵估计(MEM)可以直接从空间频谱中估计到达角度,而多信号分类法(MUSIC)算法和旋转不变技术参数估计法(ESPRIT)是基于特征分解法的谱估计算法。由计算机对采集到的阵列信号进行自适应处理,可以根据不同自适应天线实验的需要选用不同的自适应算法,达到通用平台的效果。

由采集卡采集到的语音信号,通过计算机的自适应处理后生成.WAV文件。而自适应处理以前的语音信号也是以数据文件形式存储在计算机内,也可以生成.WAV文件。此功能便于对自适应处理前后的语音信号进行对比和分析,考察自适应算法处理的效果,以用于指导进一步的调整阵结构和自适应算法。 3.3实验平台的应用价值

该实验平台能够有利于开展基于实测数据的自适应天线实验,具有一定的应用价值。

首先,在实际工作中,不同的自适应算法可能会导致自适应天线的结构不同,例如“旁瓣对消”、“高分辨谱估计”、“开环结构的智能天线”和“闭环结构的智能天线”等。而“自适应天线实验平台”以计算机为处理核心,所有计算功能都由计算机完成,不同的算法只是使计算机进行不同的运算,计算机的结构是始终都不需要改变的,能够满足实验平台的通用性、灵活性等要求。

其次,自适应天线阵列形式主要有圆环形阵列、直线形阵列、平面阵等多种形式,对应于自适应天线系统不同的天线阵元结构,本“自适应天线实验平台”不必进行不同天线阵元的加工,而是用麦克风阵元代替天线阵元,只需改变麦克风阵的阵元结构就可以实现对不同自适应天线系统的实验和测试。

最后,不同自适应天线的应用场合不同,要求A/D的采样速率也不一样,致使不同自适应天线需要不同的采样单元。而“自适应天

线实验平台”的采样频率可由软件控制,进行不同的自适应天线实验只需通过软件调整采样频率即可,不需要硬件的改动。由于“自适应天线实验平台”具有上述优点,所以“自适应天线实验平台”可以方便、灵活的开展自适应天线实验。 参考文献

[1] 王世清,崔晓东,张群飞. 基于麦克风阵列的声源定向教学实验系统设计. 实验技术与管理,第27卷,第6期,2010年6月. [2] 刘鹍鹏. 麦克风阵列语音增强技术的研究与实现. 大连理工大学硕士学位论文,2007年.

[3] M. Omologo, M. Matassoni, P. Svaizer, D. Giuliani. Experiments of Hands-Free Connected Digit Recognition Using a Microphone Array. Automatic Speech Recognition and Understanding, 1997. Proceedings., 1997

IEEE

Workshop

on,

Digital

Object

Identifier:

10.1109/ASRU.1997.659128, pp: 490-497, 1997.

[4] M. Safayani, B. Babaali, H. Sameti, H. R. Abutalebi. Experiments of Distant Talking Command Speech Recognition Based on a Microphone Array and Robustness Methods. Information and Communication Technologies, 2006. ICTTA '06. 2nd, Vol. 1, Digital Object Identifier: 10.1109/ICTTA.2006.1684554, pp: 1236-1241, 2006.

[5] 全太锋,牟颖,何小海.一种基于自适应麦克风阵的智能天线实验平台, 2006年

本文来源:https://www.bwwdw.com/article/cvro.html

Top