百度开放四大全新语音技术将提升用户人
机交互体验
11月22 日百度宣布在其语音开放平台上线三周年之际 向公众开放四项全新语音技术的接口 以使用户在使用语音与机器进行交流时享受到更奇妙的交互体验。
百度公司首席科学家吴恩达简单介绍了这四项深具革命性的语音技术 即情感合成、远场方案、唤醒二期技术和长语音方案并宣布即日起百度将这几项技术免费开放给用户和开发者共享。
“这些技术有很大的潜力去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会将为人机交互带来巨大的改变。 ”吴恩达表示。
这些技术旨在解决用户在使用语音交互的场合时普遍感到困扰的一些关键问题。例如百度情感合成技术主要聚焦在为合成语音“加入情感” 目前可达到接近真人发声效果百度今年早些时候曾利用此技术复原已逝明星张国荣的声音。
类似地开发者还可以利用新的接口使语音识别距离增加到3-5米将设备的语音唤醒率提升到95%以上同时更省电误报更少或提升长时间语音识别的准确率问题。这
将为语音技术带来远比现在更多的想象空间而不只是遥控电视或解锁手机。
例如前两者的代表是百度的“小度机器人人机语音交互点餐”已在上海肯德基旗舰店投入应用可远距离随时应答点餐。后者则已经在诸多内容记录、智能客服、视频转写等应用场景表现出巨大的想象空间。
在这场名为“极智开放·共语未来”的庆典上来自斯坦福大学的人工智能专家James Landay也分享了一项与百度合作的最新研究成果该研究发现智能手机在语音输入时输入速度比键盘输入快3倍。他表示 “近两年受益于大数据和深度学习技术的不断发展语音识别技术突飞猛进速度及准确性都有了长足进步。 ”
吴桂林打开视频应用“爱奇艺”的手机客户端说“VIP续费”系统准确跳转到了相应的充值页。这位爱奇艺技术总监指出借助百度语音开放平台每天有百万以上的爱奇艺用户使用语音搜索其中80%以上转化为有效点击。
读者甘肃数码科技有限公司总经理金大时认为语音开放平台的价值并不止于商业。 “读者数字农家书屋”已在甘肃庆阳市试点成功完成了65个新农村“数字农家书屋”。他表示 “很多不识字的老年人和留守儿童语音合成让他们也享受到了阅读的乐趣。 ”
目前百度语音开放平台的合作伙伴已涵盖多个领域
和场景包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、 SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、手机QQ阅读等。
“语音是人类交流最自然的方式通过开放语音技术百度希望可以引领语音功能产品的繁荣发展。 ”吴恩达表示。
据悉百度语音开放平台自2013年10月上线以来每日在线语音识别要求从2013年的500万上升到今天的1亿4千万在线语音合成每日请求达2亿开发者数量超过
14万。
在技术指标方面百度语音识别准确率目前已高达97%居于全球领先。今年2月百度深度语音识别系统DeepSpeech 2入选MIT 2016十大突破技术。包括语音技术在内的
百度大脑入选2016第三届乌镇世界互联网大会15大领先科技成果成为国内唯一入选的综合型人工智能技术。
以前我们在参与到云服务商促销活动的时候周期基本是一周时间,而如今我们会看到无论是云服务商还是电商活动基本上周期都要有超过一个月,所以我们有一些网友习惯在活动结束之前看看商家是不是有最后的促销活动吸引力的,比如有看到阿里云年中活动最后一周,如果我们有需要云服务器的可以看看。在前面的文章中(阿里云新人福利选择共享性N4云服务器年79.86元且送2月数据库),(LAOZUO.ORG)有提到阿里云今年的云...
digital-vm怎么样?digital-vm在今年1月份就新增了日本、新加坡独立服务器业务,但是不知为何,期间终止了销售日本服务器和新加坡服务器,今天无意中在webhostingtalk论坛看到Digital-VM在发日本和新加坡独立服务器销售信息。服务器硬件是 Supermicro、采用最新一代 Intel CPU、DDR4 RAM 和 Enterprise Samsung SSD内存,默认...
RackNerd今天补货了3款便宜vps,最便宜的仅$9.49/年, 硬盘是SSD RAID-10 Storage,共享G口带宽,最低配给的流量也有2T,注意,这3款补货的便宜vps是intel平台。官方网站便宜VPS套餐机型均为KVM虚拟,SolusVM Control Panel ,硬盘是SSD RAID-10 Storage,共享G口带宽,大流量。CPU:1核心内存:768 MB硬盘:12 ...