百度开放四大全新语音技术将提升用户人
机交互体验
11月22 日百度宣布在其语音开放平台上线三周年之际 向公众开放四项全新语音技术的接口 以使用户在使用语音与机器进行交流时享受到更奇妙的交互体验。
百度公司首席科学家吴恩达简单介绍了这四项深具革命性的语音技术 即情感合成、远场方案、唤醒二期技术和长语音方案并宣布即日起百度将这几项技术免费开放给用户和开发者共享。
“这些技术有很大的潜力去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会将为人机交互带来巨大的改变。 ”吴恩达表示。
这些技术旨在解决用户在使用语音交互的场合时普遍感到困扰的一些关键问题。例如百度情感合成技术主要聚焦在为合成语音“加入情感” 目前可达到接近真人发声效果百度今年早些时候曾利用此技术复原已逝明星张国荣的声音。
类似地开发者还可以利用新的接口使语音识别距离增加到3-5米将设备的语音唤醒率提升到95%以上同时更省电误报更少或提升长时间语音识别的准确率问题。这
将为语音技术带来远比现在更多的想象空间而不只是遥控电视或解锁手机。
例如前两者的代表是百度的“小度机器人人机语音交互点餐”已在上海肯德基旗舰店投入应用可远距离随时应答点餐。后者则已经在诸多内容记录、智能客服、视频转写等应用场景表现出巨大的想象空间。
在这场名为“极智开放·共语未来”的庆典上来自斯坦福大学的人工智能专家James Landay也分享了一项与百度合作的最新研究成果该研究发现智能手机在语音输入时输入速度比键盘输入快3倍。他表示 “近两年受益于大数据和深度学习技术的不断发展语音识别技术突飞猛进速度及准确性都有了长足进步。 ”
吴桂林打开视频应用“爱奇艺”的手机客户端说“VIP续费”系统准确跳转到了相应的充值页。这位爱奇艺技术总监指出借助百度语音开放平台每天有百万以上的爱奇艺用户使用语音搜索其中80%以上转化为有效点击。
读者甘肃数码科技有限公司总经理金大时认为语音开放平台的价值并不止于商业。 “读者数字农家书屋”已在甘肃庆阳市试点成功完成了65个新农村“数字农家书屋”。他表示 “很多不识字的老年人和留守儿童语音合成让他们也享受到了阅读的乐趣。 ”
目前百度语音开放平台的合作伙伴已涵盖多个领域
和场景包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、 SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、手机QQ阅读等。
“语音是人类交流最自然的方式通过开放语音技术百度希望可以引领语音功能产品的繁荣发展。 ”吴恩达表示。
据悉百度语音开放平台自2013年10月上线以来每日在线语音识别要求从2013年的500万上升到今天的1亿4千万在线语音合成每日请求达2亿开发者数量超过
14万。
在技术指标方面百度语音识别准确率目前已高达97%居于全球领先。今年2月百度深度语音识别系统DeepSpeech 2入选MIT 2016十大突破技术。包括语音技术在内的
百度大脑入选2016第三届乌镇世界互联网大会15大领先科技成果成为国内唯一入选的综合型人工智能技术。
legionbox怎么样?legionbox是一家来自于澳大利亚的主机销售商,成立时间在2014年,属于比较老牌商家。主要提供VPS和独立服务器产品,数据中心包括美国洛杉矶、瑞士、德国和俄罗斯。其中VPS采用KVM和Xen架构虚拟技术,硬盘分机械硬盘和固态硬盘,系统支持Windows。当前商家有几款大硬盘的独立服务器,可选美国、德国和瑞士机房,有兴趣的可以看一下,付款方式有PAYPAL、BTC等。...
vpsdime怎么样?vpsdime是2013年注册的国外VPS主机商,实际上他还有一系列的其他域名站点如Winity.io, Backupsy,Cloudive, Virtora等等,母公司“Nodisto IT”相对来说还是很靠谱了的商家。VPSDime主要提供各种高配低价VPS套餐,其中Linux VPS和存储VPS基于OpenVZ架构,高级VPS基于KVM。VPSDime在上个季度的Low...
CloudCone的[2021 Flash Sale]活动仍在继续,针对独立服务器、VPS或者Hosted email,其中VPS主机基于KVM架构,最低每月1.99美元,支持7天退款到账户,可使用PayPal或者支付宝付款,先充值后下单的方式。这是一家成立于2017年的国外VPS主机商,提供独立服务器租用和VPS主机,其中VPS基于KVM架构,多个不同系列,也经常提供一些促销套餐,数据中心在洛杉...