语音软硬结合,百度站上人工智能语音赛道

百度语音  时间:2021-02-24  阅读:()

软硬结合百度站上人工智能语音赛道

2月16日有两条关于百度的消息很有意思一条是收购渡鸦团队一条是把度秘团队升级为度秘事业部两边都向陆奇汇报工作。这种软硬融合的战略选择是极其正确的。

这并不是马后炮我在2016年10月发的《虽然很投入但李彦宏可能正在错过人工智能》里核心观点之一就是百度是国内对人工智能投入力度最大的公司但其不碰硬件的战略很可能导致它最终错过人工智能里对它最关键的部分。虽然大方向正确但如果互联网公司真想学亚马逊就还差了那么一点东西。

语音赛道的AI到底需要解决什么问题

国内绝不缺和E c ho类似的产品但此前的命运都是折戟沉沙这里的关键在于对什么是这类产品上要解决的核心问题认知不清。 自由交流唤醒词速度方言 内容 习惯等每个似乎都可以成为要解决的核心问题但实际上所有这个赛道上玩家最核心的问题是在语义、方言这些刚性约束不突破的条件下打造出速度、精度、 内容相匹配的产品。

智能语音也就是说要解决的并非宽适配问题而是要在面对主流人群真在技术上下功夫把体验做好。语音交互上糊弄的空间极小两句话就能感受出体验咋样。这里面最受关注的是语义的问题 因为人们总是向往自由的交流语义肯定是交互的一个瓶颈但我们可以把语音交互根据语义的技术进展分解为两个阶段

第一阶段是语义并没有核心突破也就是说最理想状态也就达到75分。这时候打造产品的根本出发点是不指望自由语言交流而让语音交互偏命令控制但也打造出极为优秀的用户体验。E cho大的定位就是这样一种产品。这时候产品的核心瓶颈是前端的声学麦克风阵列声学算法这是眼下的问题不解决产品体验不可能好。基于这判断我在2015年末开始使了很大力气为公司寻找公司最终这也是我2016年投资声智科技的核心原因 当时逻辑很简单这个问题显然中科院声学所更擅长解决而声智科技几乎是声学所人员所创办的唯一的一家AI企业。

第二阶段是语义真的取得突破这无疑会更大的扩展语音交互的应用范围一旦这个点得以突破语音交互会变的无处不在但我们必须承认什么时候语义能够彻底解决仍然不确定这是属于未来的事情。

这种时间轴上的错乱是很可怕的那样就会在现有产品上挑战不可能解决的问题 比如不用唤醒词指望E cho这类产品什么都能干等。

总结来看我们可以这样讲如果真想做出E c ho那样的产品声学麦克风阵列算法语音识别语义三层里面眼下的瓶颈是声学未来的瓶颈是语义前者影响现在产品卖不卖的出去后者影响适用范围的大小。但即使只是前者这也是一个足以对标Pad的新品类。

差的那么一点点

真走软硬融合的道路显然的关键要素是 良好的产品定义足够成熟的技术要素系统整合产品的能力其实还有通畅的销售渠道。系统整合一项要求一个公司整合软硬团队否则不同利益诉求会导致软硬团队很难高度配合而在产业初期不同层次间接口标准化很差容易导致产品夭折。产品定义则高度依赖于个人就看当事人的能力对公司而言需要一点运气。

这样一来唯一欠缺的是足够成熟的技术要素。这是非常麻烦的一点对于互联网公司尤其艰难 因为真往这条路

上走欠缺的并非是计算机算法上的认识也还牵扯物理这对于互联网公司是个大大的盲点。

从这个视角正好可以理解苹果和Google的差别苹果是要高度关注物理层面的东西的 比如材料、 电池、屏幕、传感器等Google显然会更关注算法。所以苹果的云端技术始终不好而Google做产品就也总是一般。乔布斯万众瞩目所以大家看到的是他的偏执、癫狂乃至艺术气息但实际上他背后是有一坨人在帮他解决物理上的麻烦事的现在的库克就是其中之一。

这并不只是百度一个公司的问题而是新时代趋势对互联网公司的一种系统型挑战。我在之前的文章中曾经提到过一个行业的兴起事实上是三个大的阶段

第一阶段是Enabling技术的成熟类比的话就是手机上的高通和MTK在语音产业链上声智科技扮演类似的角色。

第二阶段是硬件产品的成熟类比的话就是Apple II或者iPhone 1代在语音产业链上就是Echo。需要注意Echo是起点而不是终点是刚跨过可用线的一款产品。

第三阶段才是新硬件平台上软件应用的成熟比如PC上就是Office手机上就是微信。在语音产业链上这点还没展开。

互联网缩短了第一阶段和第二阶段间的过渡过程相

当于两者在同步发生也正因此才需要软硬融合。但互联网公司独自解决第一个问题能力会偏弱这就是欠缺的那一点点。

硝烟会从今日起

也许是为了提振股价百度十分高调的公布了这件事情。这也很有意思因为百度这样做很可能会引起连锁反应。在这之前大家基本都处于观望状态 当其中一个真的下注后别的人就会开始系统考虑这件事情别人做成了对我会有什么样的影响。

这事一旦开始推敲腾讯、阿里就会认识到这是自己输不起的战争。这点我在之前的文章里提到过但很有必要在百度采取行动的时候再次重述

我们先做个基本的假设那就是Alexa获得了巨大成功Echo、智能音箱、Al exa有关联但其实是不同的东西这点在之前文章中有说这里不再重复渗透到各种设备之中包围了人们的生活人们有50的时间在通过语音和设备打交道并且日活逼近Andro i d。

那这时候一定会衍生这样的需求用户会说 Alexa帮我通知下马化腾 明天我不见他了。这时候就需要有一种通讯的IM来实现这种需求。这时候亚马逊就有两个选择第一它接入一种已有IM 比如Whats app或者Skype。第二种是自己做一个嵌在Alexa里面。亚马逊至少有一半的几

率会选择后者而不是把这种基础设施开放给别人 因为前两种要么属于F acebook要么属于微软。如果在中国是阿里巴巴做成了Al exa那估计百分百不会选择对接微信。

这样一来配合一个语音交互的核心特征颠覆性的事情就出现了语音交互背后隐藏的各种应用具有唯一性。

我们很难想象这种语音交互方式 Alexa帮我用What sapp给马化腾留个消息明天我不见他了。在语音交互中WhatsApp这类应用的标识很可能会被优化掉。如果Alexa还只是百万级、千万级D AU的应用时那这个特性还不关键但如果它是10亿D AU的系统那这个特性的影响就会被无限放大也就说搜索、 IM、电商很可能都只有一家而不是像现在虽然少但还有个1  2 3名。

小结

今天几乎已经没人再怀疑语音交互的成立了有意思的事情是这种变化只发生在过去不到半年的时间里。现在看2017年的热闹很可能在这里发生这是件牵连极广的事情它会牵涉人工智能声学、语音语义公司它会升级智能硬件公司原本的智能硬件其实已经被鄙视了但E cho显然不是什么万物互联赛道而是人工智能赛道。好吧想做的要尽快进来不想做这个行业的可以搬个板凳看热闹了。

Digital-VM80美元新加坡和日本独立服务器

Digital-VM商家的暑期活动促销,这个商家提供有多个数据中心独立服务器、VPS主机产品。最低配置月付80美元,支持带宽、流量和IP的自定义配置。Digital-VM,是2019年新成立的商家,主要从事日本东京、新加坡、美国洛杉矶、荷兰阿姆斯特丹、西班牙马德里、挪威奥斯陆、丹麦哥本哈根数据中心的KVM架构VPS产品销售,分为大硬盘型(1Gbps带宽端口、分配较大的硬盘)和大带宽型(10Gbps...

SugarHosts糖果主机六折 云服务器五折

也有在上个月介绍到糖果主机商12周年的促销活动,我有看到不少的朋友还是选择他们家的香港虚拟主机和美国虚拟主机比较多,同时有一个网友有联系到推荐入门的个人网站主机,最后建议他选择糖果主机的迷你主机方案,适合单个站点的。这次商家又推出所谓的秋季活动促销,这里一并整理看看这个服务商在秋季活动中有哪些值得选择的主机方案,比如虚拟主机最低可以享受六折,云服务器可以享受五折优惠。 官网地址:糖果主机秋季活动促...

RackNerd:便宜vps补货/1核/768M内存/12G SSD/2T流量/1G带宽,可选机房圣何塞/芝加哥/达拉斯/亚特拉大/荷兰/$9.49/年

RackNerd今天补货了3款便宜vps,最便宜的仅$9.49/年, 硬盘是SSD RAID-10 Storage,共享G口带宽,最低配给的流量也有2T,注意,这3款补货的便宜vps是intel平台。官方网站便宜VPS套餐机型均为KVM虚拟,SolusVM Control Panel ,硬盘是SSD RAID-10 Storage,共享G口带宽,大流量。CPU:1核心内存:768 MB硬盘:12 ...

百度语音为你推荐
如何免费开通黄钻怎么免费开通黄钻~~~?万网核心代理我想买个域名和空间,我一朋友给我介绍万网代理环宇网络空间商,他们的空间稳定吗,价格怎么样,咨询师的服怎么在qq空间里添加背景音乐如何在qq空间中添加背景音乐怎么在qq空间里添加背景音乐怎么在QQ空间里插入背景音乐??微信如何建群微信怎么建群?安卓应用平台哪个手机应用平台的软件比较正版,安全?lockdowndios8.1怎么激活内置卡贴idc前线钢铁雄心2修改器网页打开很慢如何解决网速正常 网页打开很慢问题安全漏洞什么是安全漏洞攻击??
虚机 老域名 hostmaster 星星海 hawkhost godaddy主机 网站保姆 国外在线代理 京东商城0元抢购 godaddy域名证书 宁波服务器 工信部icp备案号 什么是服务器托管 t云 网游服务器 能外链的相册 爱奇艺会员免费试用 华为云服务登录 域名dns 免费的域名 更多