声源基于麦克风阵列近场和远场混合声源定位

阵列  时间:2021-04-29  阅读:()

基于麦克风阵列的近场和远场混合声源定位可编辑

基于麦克风阵列的近场和远场混合声源定位

密级:公开

国内图书分类号:

国际图书分类号: .

西南交通大学

研究生学位论文

二零一三年六月

一夺一二,平/、 月

: . .: . . . :

: :

.

: .

.西南交通大学

学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保

留并向

国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西

南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、

缩印或扫描等复印手段保存和汇编本学位论文。

本学位论文属于

.保密口,在年解密后适用本授权书;

.不保密彭使用本授权书。

请在以上方框内打‚、 /‛

指导老师签名:

学位论文作者签名:差锯五

虿趁嚷

参。计

日期:沙?.日期: .易.?毕西南交通大学硕士学位论文主要工作贡献声明

本人在学位论文中所做的主要工作或贡献如下:

.为了得到时域上的对数能量和频域上的子带谱熵这两种方法各自的优点,本文采

用了一种新的对数能量子带谱熵法。

.分析了对于宽带信源的近远场混合模型,给出了用算法在混合场中对语

音宽带信号进行定位的算法,并在平台上进行了仿真。

.给出用稀疏分解的方法对信源在近远混合场的情况下进行声源定位的方法,即根

据近远场混合模型,构造适合麦克风阵列混合场的原子库,再用匹配追踪算法得到混合

场的声源方位估计,通过仿真实验验证了该算法具有较强的抗噪性。

本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。

除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的

研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。本人完全

了解违反上述声明所引起的一切法律责任将由本人承担。

学位论文作者签名:芸锋么

日期:砂. .骅西南交通大学硕士研究生学位论文第页

摘要

声源的定位是实现语音识别和语音增强的前提和基础,它具有广阔的应用前景。随

着数字信号处理与阵列信号处理技术的发展和进步,麦克风阵列已广泛应用于声源定位

中,但当前大多数基于麦克风阵列的声源定位技术中,要么信源完全处于近场源,要么

信源完全处于远场源,另多数假设信源为窄带信号,而实际生活中语音信号为宽带信号。

针对这些问题,本文深入研究了在混合近场和远场的情况下基于麦克风阵列

的声源定位

技术。主要内容如下:

第一、分析了语音信号的特性,介绍了传统的窄带信号处理模型和宽带信号处理模

型,研究了麦克风阵列均匀线阵在远场和近场的两种模型。

第二、 由于麦克风阵列不仅接收有用语音信号,还有其他各种各样的噪声,因此需

要对得到的数据进行预处理,包括预滤波、预加重,归一化,加窗分帧,短时能量检测,

和语音降噪等,本文对语音活动检测进行了研究,为了得到时域上的对数能量和频域上

的子带谱熵这两种方法各自的优点,文中采用了一种新的对数能量子带谱熵法。

第三、研究了近场算法,分析了假若信号源既有处在远场又有处在近场时

的信号模型,给出了用算法在混合场中对语音宽带信号进行定位的算法,该算

法首先将信号源的到达角和距离进行分离,推算出一个只含有到达角信息的新的方向矩

阵,然后运用算法得到所有信号源的到达角,最后基于已得到的到达角信息和

远场距离特性,再次通过算法获得对远场与近场声源的定位。

第四、研究了在近场和混合场两种不同情况下基于稀疏分解的声源定位算法,

当信

源处在混合场时,本文根据混合场的信号模型,给出了构造适合麦克风阵列

混合场的原

子库的方法,然后使用匹配追踪算法完成在混合场的声源方位估计。通过实

验仿真可知

该算法在低信噪比情况下有较好的鲁棒性。关键词:声源定位;麦克风阵列;算法;混合源定位;稀疏分解第

西南交通大学硕士研究生学位论文页. . ’ , , ,

.

,.

,. : ,

, ., .面,

, , ,.

.

: .

,

,

,

试. ,.

,

., ., .

, ,

西南交通大学硕士研究生学位论文第页, . .?

: ; ; ;

;西南交通大学硕士研究生学位论文第页目录

第章绪论?

.本文研究背景及意义.

.声源定位的国内外研究现状.

.本文主要工作及内容.

第章语音信号及阵列模型特征?. .语音信号特性分析?.. .语音信号的时域波形和频谱特性?. . . .语音信号的语谱图?. ..阵列信号处理模型?.

. .窄带信号处理模型?。

. .宽带信号处理模型?。

.麦克风阵列信号处理模型?.

. .近场模型与远场模型..

. .远场麦克风阵列均匀线阵模型??。 . .近场麦克风阵列均匀线阵模型.小结?..第章语音信号预处理.预滤波??..

.预加重.

.归一化??。

.加窗分帧?..

.语音活动检测??、 .. .

. .短时能量与短时对数能量?

. .谱熵特征..自适应子带谱熵..对数能量子带谱熵? .小波语音降噪

. .小波阈值去噪

. .改进的小波阈值去噪

.小结?。

第章基于算法的麦克风阵列声源定位. .经典算法?西南交通大学硕士研究生学位论文第页

.基于算法的近场声源定位研究?.

. .近场语音信号的算法??. .

. .仿真分析.基于算法的近远混合场声源定位研究?. ..混合场的信号模型?

. .混合源语音信号的算法?一

. .仿真分析..计算复杂度分析.小结?..第章基于稀疏分解的麦克风阵列声源定位.信号稀疏分解理论?

. .稀疏分解基本理论?

. .

稀疏分解.

.基于分解的近场声源定位研究

. .原子库的构造

. .算法描述..仿真分析??.

.基于分解的近远混合场声源定位研究

. .原子库的构造

. .算法描述..仿真分析..计算复杂度分析.小结?. .

总结与展望?。

弱【射.

参考文献攻读硕士学位期间发表的论文及科研成果.西南交通大学硕士研究生学位论文第页

第章绪论

.本文研究背景及意义

相比传统的单一麦克风,麦克风阵列的拾音范围更广阔,由于多个麦克风同时采集,

使得接收到的信号受室内混响的影响较小,也就是其信噪比较高。近年来,麦克风阵列

广泛运用到含有语音信号处理的系统中,如工业智能检测及监控系统【】 、音/视频会议系

统【】 、机器人听觉系统【】 、语音识别腔制系统等,在这些系统中,麦克风阵列技术不仅

仅只用到语音采集,而且还需对采集到的信源进行定位、提取人们感兴趣的

有用信息、

对采集到的信号进行识别等等,要实现这些功能,传统的语音信号处理是不能达到要求

的,所以随着这些技术的广泛发展,麦克风阵列运用到语音信号处理中成为近年来的热

点【】 。

在语音信号处理技术中,声源的位臵信息有着及其重要的作用:在语音增强中,可

按照确定的说话人的方向来调整麦克风阵列的波束方向,从而达到对接收到的语音信号

的增强;在视频或者音频会议中,由于说话人不一定一直处在某一位臵,所以可设臵一

系统,使得摄像头或者麦克风能根据正在说话的人的位臵信息而自动对准他/她;当同时

有多个说话人,而只需提取某个说话人的言语时,则可将麦克风阵列的波束方向对准这

个待提取的说话人等。基于麦克见阵列的声源定位就是利用由多个麦克风组成的麦克风

阵列拾取待定位的语音信号,即信源,然后运用语音信号处理技术和阵列信号处理技术

等来分析和处理麦克风阵列接收到的说话人所说的信号,最后得到说话人所处的位臵信

息,包括角度参数和距离参数。麦克风阵列的语音声源定位技术综合了数据融合【】 、人

工智能【】和阵列信号处理【】等多方面的内容,另由于麦克风阵列是由多个麦克风阵元按

一定的拓扑结构布设组成的一个系统,它能对各个语音信源到每个麦克风阵元时产生的

差异幅度和相位进行分析处理,从而能更好地接收来自不同方位的语音信号,并能

使接收到的信号保持良好的语音特性,所以麦克风阵列的语音声源定位技术广泛应用于

机器人智能听觉【】 、智能安防辅助监控【】 、现代视频会议中的热点聚焦【和不同类型的

语音辅助装臵等方面。

.声源定位的国内外研究现状

年【刁在他的书中将麦克风阵列的声源定位技术分为如下三类:一是

基于到达时间差. ,的声源定位【、二是可控波束形成定位西南交通大学硕士研究生学位论文第页

估计技术【

】 、三是基于高分辨率谱估计声源定位技术【。基于到达时间差的定位方法

相比其他两种方法复杂度较低,计算量小,且在实际系统中易实时实现,所以在实际中

广泛使用。实现该方法需要两步:第一步,运用【】或【】等算法得到信源到

个麦克风阵元的时延差;第二步,根据第一步得到的时延差,结合麦克风阵列的几何结

构,进行数学运算得到声源的定位信息。这种定位方法有如下不足之处:首先,由于该

方法是严格按两步来实现的,所以会产生误差积累,即第一步的误差会传递到第二步中;

麻花云-香港CN2云服务器,安徽BGP线路,安徽移动大带宽!全系6折!

一、麻花云官网点击直达麻花云官方网站二、活动方案优惠码:专属优惠码:F1B07B 享受85折优惠。点击访问活动链接最新活动 :五一狂欢 惠战到底 香港云主机 1.9折起香港特价体验云主机CN2 云服务器最新上线KVM架构,,默认40G SSD,+10G自带一个IPv4,免费10Gbps防御,CPU内存带宽价格购买1核1G1M19元首月链接2核2G 2M92元/3个月链接2核4G3M112元/3个月...

pacificrack:VPS降价,SSD价格下降

之前几个月由于CHIA挖矿导致全球固态硬盘的价格疯涨,如今硬盘挖矿基本上已死,硬盘的价格基本上恢复到常规价位,所以,pacificrack决定对全系Cloud server进行价格调整,降幅较大,“如果您是老用户,请通过续费管理或升级套餐,获取同步到最新的定价”。官方网站:https://pacificrack.com支持PayPal、支付宝等方式付款VPS特征:基于KVM虚拟,纯SSD raid...

Hostodo(年付12美元)斯波坎VPS六六折,美国西海岸机房

Hostodo是一家成立于2014年的国外VPS主机商,现在主要提供基于KVM架构的VPS主机,美国三个地区机房:拉斯维加斯、迈阿密和斯波坎,采用NVMe或者SSD磁盘,支持支付宝、PayPal、加密货币等付款方式。商家最近对于上架不久的斯波坎机房SSD硬盘VPS主机提供66折优惠码,适用于1GB或者以上内存套餐年付,最低每年12美元起。下面列出几款套餐配置信息。CPU:1core内存:256MB...

阵列为你推荐
enter苹果5版本itunes支持ipad支持ipadwin10445端口win7系统不能被telnet端口号,端口、服务什么全都开了win7telnetwindows7旗舰版中telnet在哪重庆电信宽带管家中国电信电脑管家是什么?怎么样?win7关闭135端口如何用命令关闭135端口迅雷下载速度为什么 迅雷下载速度太慢联通合约机iphone5iphone5联通合约机是怎么回事
cc域名 n点虚拟主机管理系统 如何注册中文域名 liquidweb 老鹰主机 美元争夺战 163网 godaddy域名优惠码 info域名 免费个人博客 最好的空间 100m免费空间 godaddy域名证书 服务器干什么用的 酷番云 t云 能外链的相册 新睿云 服务器是干什么用的 美国凤凰城 更多