声源基于麦克风阵列声源定位聚焦算法研究

阵列  时间:2021-04-29  阅读:()

基于麦克风阵列的声源定位聚焦算法研究

基于麦克风阵列的声源定位聚焦算法研究

//.paper.edu.cn

- 1 -

中国科技论文在线

基于麦克风阵列的声源定位聚焦算法研究#

居太亮彭启琮*

基金项目:高等学校博士学科点专项科研基金(2007><70614048)

作者简介:居太亮(19<74) 男讲师主要研究方向:语音信号处理、通信信号处理和实时信号处理

(电子科技大学通信与信息工程学院成都611<731)

摘要:基于麦克风阵列的声源定位技术在通信、控制、声纳等领域已经受到广泛关注宽带

聚焦类算法是解决宽带信号定位问题的重要算法。常规的宽带聚焦算法需要进行预估计以及

多次迭代算法的实时性较低。本文根据宽带聚焦算法的思想结合语音信号的特点以各

频率点的频域相关矩阵与聚焦频率点的相关矩阵聚焦误差最小为准则提出了一种不需要预

估计和迭代的宽带聚焦声源定位算法。根据语音信号能量的分布该算法把

语音信号分为若

干个子带在每个子带内使用频率聚焦方法使得聚焦算法的在较小的子带

数目时就可获得

优异的定位性能。仿真验证了该算法在均匀圆阵情况下具有良好定位性能。

关键词:信息与信号处理;声源定位;宽带频率聚焦算法;麦克风阵列

中图分类号:TN911

Speech Source Localization Focusing Algorithm Based on

Microphone Arrays

JU Tailiang,Peng Qicong

(School of Communication and Information

Engineer,UESTC,ChengDu,611<731)

Abstract:The speech source localization based on microphone array has attractedincreasing attentionin commutation, control and sonar etc.The wideband focusing algorithm is the key tosolve thewideband signal localization problem.To classical wideband focusing DOA estimationalgorithm,aninitial estimate of the DOA&#039;s and several iterations are required,and theperformance of real time is bad.

A speech source localization algorithm based on wideband focusing theory is presentedin this paper,and it doesn’ t require initial estimate and iterative.The error criterion of this algorithmis settominimum between the each frequency bin correlation matrix and focused frequencycorrelation matrix.

The speech signal divided into several subband signals according to their powers, andthe focusing

method was adopted in every sunband signal.This algorithm can gain the goodperformance as the caseof less number of subbands.Simulation results show the high performance of thelocalizationestimation is obtained when the proposed algorithm is used in planar uniform circlearray.

Key words:Information and signal Processing;Speech source localization;WidebandFrequencyfocusing algorithm;Microphone arrays

0引言

麦克风阵列技术已经广泛用于高质量语音通信系统、远程音/视频通信系统、医学(助

2]。高精度、小运算量的声源定位算法是麦克风阵列应用听器)等领域[1-的关键点之一。 目

前广泛采用时延估计(TDE)类算法该算法估计声源到达不同麦克风的时间差然后根据

时间差求出声源的位臵。这类算法运算量较小但是定位精度受到阵列几何结构的限制只

能应用在一些低端设备上[3]。第二类定位算法是以空间分解为代表的算法如MUSC类算

法[4-6] 可以实现较高精度但是这类算法直接把宽带语音信号通过离散傅立叶变换对每

个频点直接采用经典的窄带MUSIC算法算法复杂度较高。宽带聚焦类算法把频带内不重

//.paper.edu.cn

-2-

中国科技论文在线

叠的频率点上的信号空间聚焦到参考频率点聚焦后得到一个单一频率点(参考频率)的数

据协方差矩阵再用窄带信号处理的方法进行DOA估计[<7-10]。本文根据宽带聚焦算法的思

想根据信号的能量把语音信号分为若干个子带在每个子带内使用聚焦算法仿真表明

本文提出的算法性能优于普通聚焦类算法。

1基于任意拓扑结构的信号接收模型

假设空间有D个声源S1  S2…… SDM个全向无差异麦克风(声压传感器)

P1,P2,……,PM组成一个M元的麦克风阵列则阵列接收到的信号在频域可以表示为[9-10]:

212

1

11

122

21212

22

1 1

( )1 1 ( )

( )

( ) ( , , ,) ( ) ( )

( )

( )

D

MdMj fj fD

Mj fj fMMDD

FfnfrereFfffrffnfrereFf

πτπτ

πτπτ

θυ

?? ??

????

?? ???? ?? ?? ???? ???? ?? ?????? ???? ??=+=+

=?? ???? ???? ?? ?? ???? ???? ?? ??7????7?? ??7??

F A S N AS+N

;

; ;; ; ; ; ;

(1)

在错误未找到引用源。式中: f代表信号频率可以通过FFT或者DFT变换得到

ijτ为第i个传感器接收到第j个信号源发出的信号的相对时延 1, , ;i M=;

1, ,j=; 1,0jDτ=; ijr为第i个传感器接收到第j个信号源发出的信号的相对幅度衰减因子

1, , ;iM=; 1, ,j=; 1, 1jDτ=; 1 ( )jFf为第一个传感器接收到来自第j个信号源并且经过

DFT或FFT变换后的离散频域信号 ( )iN f为第i个传感器上收到的噪声信号。假设第j个

信号源的位臵矢量为jS  第i个传感器的位臵矢量为iP 且

*[sin cos sin sin cos ]Tj j j j j j jrθυθυθ=?? ????S

参考传感器设在坐标原点则( , ,)i ii ixyz=P

时延ijτ为( )ij j i j cτ=?? ??S P S;相对幅度衰减因子ijr为ij j i jr=??S P S  c是声波波速

在室温下取343m/s jθ表示第j个信源与Z轴的夹角 jυ表示第j个信源在XO Y平面的投

影与X轴的夹角 jr表示第j个信源距坐标原点的距离。

当声源与麦克风阵列的距离较远时即j iS P??7  ijr可以近似为1 即两个麦克风之

间的幅度衰减差异很小可以近似认为相等。此时麦克风接收信号之间的幅度差异很小可

以忽略则错误未找到引用源。式可以简化为:

212

1

11

122

12

22

1

( )1 1 ( )

( )

( ) ( , , ) ( ) ()( )

( )

D

MMDj fj f

Mj fj f

D

Ffnf

FfeeffffnfeeFf

πτπτ

πτπτ

θυ

?? ??

?? ??

?? ???? ?? ?? ???? ???? ?? ?????? ???? ??=+=+

=?? ???? ???? ?? ?? ???? ???? ?? ??7????7?? ??7??

F A S N AS+N

;

;#; ; ; ; ;

(2)

当麦克风阵列系统应用于一般会议室等室内环境时声源与麦克风阵列的距离在大部

分情况下小于500厘米麦克风阵列信号接收模型应采用精确的近场模型信号波前为球面

波波前接收信号在频域可以用错误未找到引用源。式来描述。当麦克风阵列系统应用于

室外或大型会议室等环境声源与麦克风阵列相距较远时信号模型可以采用简化的

错误未找到引用源。式来描述。但两式均有共同的数学形式在算法原理上没有区别。

在错误未找到引用源。或错误未找到引用源。式中的频域数据在实现时一般采用

DFT变换来获得。为了获得准确的频域数据需要用更长的时域数据 FFT或

但是语音信

号是短时平稳信号长的数据导致信号不平稳。为了保证信号的平稳性一帧数据长度不能

超过40毫秒。

//.paper.edu.cn

-3-

中国科技论文在线

2基于相关矩阵的宽带聚焦算法

对于语音信号而言信号能量一般集中在100Hz,4000Hz之间为了获得更高的语音

质量采样频率可以使用16 KHz甚至44.1 KHz的CD采样频率处理信号的频率范围将达

到100Hz,22KHz直接采用聚焦算法很难得到理想的效果。设信号的频率范围为:[ , ]l hf f

把宽带信号按能量相等的原则分成P个子带信号即: 1 1{[ , ], ,[, ], ,[ , ]}lppPhf f f f f f+; ;每个

子带还是宽带信号 只是分数带宽较小而已。假设错误未找到引用源。或

错误未找到引用源。式中的数据是通过N点FFT获得的 由于语音信号是实信号有用数据

有N/2点(其余为对称数据)  则每一个子带对应只

的离散频率为:

1 1{[ , ], ,[ , ], ,[ , ]}l p p P hN N N N N N+; ; 。对于任意一频率点k均有下式成立[9-10]:

( ) ( ) ( ) (), 1,2, ,/2kkkkkN=+=FASN; (3)

定义频域相关矩阵()kR为:

( ) { ()* ( )}HkEkk=RFF(4)

则接收信号的相关矩阵为:

2( ) () { ()* ()} () { ()* ( )} ( ) ( ) () , 1,2, ,/2H H H

HsskkEkkkEkkkkkkNσ=+=+=RASSANNARAI; (5)

Virmach 3.23美元可用6个月的VPS主机

Virmach 商家算是比较久且一直在低价便宜VPS方案中玩的不亦乐乎的商家,有很多同时期的商家纷纷关闭转让,也有的转型到中高端用户。而前一段时间也有分享过一次Virmach商家推出所谓的一次性便宜VPS主机,比如很低的价格半年时间,时间到服务器也就关闭。这不今天又看到商家有提供这样的产品。这次的活动产品包括圣何塞和水牛城两个机房,为期六个月,一次性付费用完将会取消,就这么特别的产品,适合短期玩玩...

速云:深圳独立服务器,新品上线,深港mpls免费体验,多重活动!

速云怎么样?速云是一家国人商家。速云商家主要提供广州移动、深圳移动、广州茂名联通、香港HKT等VDS和独立服务器。目前,速云推出深圳独服优惠活动,机房为深圳移动机房,购买深圳服务器可享受5折优惠,目前独立服务器还支持申请免费试用,需要提交工单开通免费体验试用,次月可享受永久8折优惠,也是需工单申请哦!点击进入:速云官方网站地址活动期限至 2021年7月22日速云云服务器优惠活动:活动1:新购首月可...

Megalayer(48元)新增 美国CN2优化线路特价服务器和VPS方案

Megalayer 商家算是新晋的服务商,商家才开始的时候主要是以香港、美国独立服务器。后来有新增菲律宾机房,包括有VPS云服务器、独立服务器、站群服务器等产品。线路上有CN2优化带宽、全向带宽和国际带宽,这里有看到商家的特价方案有增加至9个,之前是四个的。在这篇文章中,我来整理看看。第一、香港服务器系列这里香港服务器会根据带宽的不同区别。我这里将香港机房的都整理到一个系列里。核心内存硬盘IP带宽...

阵列为你推荐
支持ipad支持ipadxp如何关闭445端口系统怎么关闭445端口重庆宽带测速重庆联通宽带测速的网址是好多呢?tcpip上的netbiostcp 协议里的 netbios . 在哪,找不到用itunes备份如何用iTunes备份iPhone数据360chrome360的chrome浏览器进程有点多哦???win7关闭135端口win7系统怎么关闭135端口?网上很多方法都不好用!迅雷下载速度迅雷下载速度与什么有关?google统计怎样获得google ga 统计代码
qq域名邮箱 广州服务器租用 inmotionhosting 腾讯云数据库 payoneer typecho 国内加速器 777te gtt ca187 超级服务器 qq金券 网站加速 腾讯数据库 北京主机托管 免费主页空间 阿里云邮箱怎么注册 塔式服务器 cdn加速技术 apachetomcat 更多