百度语音识别再获突破 DeepCNN能翻出
多大的浪花
近日百度在语音识别技术方面再获突破将图像识别技术成功“跨界”到语音领域利用深层卷积神经网络
Deep CNN应用于语音识别声学建模中将其与基于长短时记忆单元LSTM和连接时序分类CTC的端对端语音识别技术相结合错误率相对降低10%大幅度提升语音识别产品性能是继端对端语音识别后取得的另一次重大技术突破。
Deep CNN语音识别的建模过程
近年来运用CNN技术的图像识别成果颇丰越来越深的CNN不断刷新着图像识别的精准度以人脸识别为例识别准确率高达99.7%。但CNN的进展在语音识别方面没有
得到充分的应用。作为一家在语音技术上有着深入研究的人工智能公司百度将Deep CNN视为语音识别技术的下一个突破口。
Imag eN et竞赛中越来越深的CNN不断刷新着其性能
在商用领域的端对端语音识别技术中百度首次尝试引入更深层的CNN神经网络使错误率相对降低10%。端对端技术则使用一个单独的学习算法来完成从任务输入端到输出端的所有过程减少了中间单元以及人为干预在海量数据的支持下模型效果提升明显。 目前百度的端对端技术处于业界领先水平。值得一提的是语音识别都是基于时频分析后的语音谱完成的将整个语音信号分析得到的时频谱当作一张图像就可以采用图像中已广泛应用的CNN进
行识别克服了语音信号多样性的问题且通过引入更深层的CNN使语音识别性能得到显著提升正如百度语音技术部识别技术负责人李先刚博士所言 ‘The Deeper TheB etter’ 。
与学术研究不同百度语音的研发立足点聚焦于技术的实际应用技术难度和实现程度更高。针对语音识别产品而言必须具备在大规模语音数据库上体现性能提升以及具有适合语音在线识别产品运行的模型。百度采用数千小时进行实验的研究并在近十万小时的产品语音数据库中进行验证且充足的语音数据资源使基于端对端技术的语音识别系统明显优于以往的框架性能。
百度语音识别技术每年迭代算法模型
除此之外百度语音技术在数据、计算能力、算法等三方面优势显著。百度拥有约10万小时的精准标注语音数据 以及基于数百个GP U的高性能计算平台。在算法方面
百度每年都在不断优化、迭代模型算法语音识别效果显著提升领先业界。
此前百度便利用端对端技术研发了Deep Speech 2深度语音识别技术用于提高在嘈杂环境下语音识别的准确率。在噪音环境下其错误率低于谷歌、微软以及苹果的语音系统。 目前百度语音识别准确率高达97%并被美国权威科技杂志《麻省理工评论》列为2016年十大突破技术之
一。另据李先刚博士透露 目前的确正在加紧Deep Speech 3的研发工作而本次公布的Deep CNN不排除将会是DeepSpeech 3的核心组成部分。
除了技术突破百度还积极推动用户使用语音交互的普及手机百度、百度输入法、百度地图、度秘等产品都已支持语音输入功能而此次“跨界”的Deep CNN相信很快会应用到拥有庞大用户体量的百度产品中。
使用此源码可以生成QQ自动跳转到浏览器的短链接,无视QQ报毒,任意网址均可生成。新版特色:全新界面,网站背景图采用Bing随机壁纸支持生成多种短链接兼容电脑和手机页面生成网址记录功能,域名黑名单功能网站后台可管理数据安装说明:由于此版本增加了记录和黑名单功能,所以用到了数据库。安装方法为修改config.php里面的数据库信息,导入install.sql到数据库。...
企鹅小屋:垃圾服务商有跑路风险!企鹅不允许你二次工单的,二次提交工单直接关服务器,再严重就封号,意思是你提交工单要小心,别因为提交工单被干了账号!前段时间,就有站长说企鹅小屋要跑路了,站长不太相信,本站平台已经为企鹅小屋推荐了几千元的业绩,CPS返利达182.67CNY。然后,站长通过企鹅小屋后台申请提现,提现申请至今已经有20几天,企鹅小屋也没有转账。然后,搞笑的一幕出现了:平台账号登录不上提示...
以前我们在参与到云服务商促销活动的时候周期基本是一周时间,而如今我们会看到无论是云服务商还是电商活动基本上周期都要有超过一个月,所以我们有一些网友习惯在活动结束之前看看商家是不是有最后的促销活动吸引力的,比如有看到阿里云年中活动最后一周,如果我们有需要云服务器的可以看看。在前面的文章中(阿里云新人福利选择共享性N4云服务器年79.86元且送2月数据库),(LAOZUO.ORG)有提到阿里云今年的云...