IDC观点
• 把握市场趋势为制定AI战略提供参考。 技术走向方面机器学习平台、多模态计算、多模型数据库将开
始走向市场。落地实施方面AI部署过程将更加自动化AI也将从主要在数据中心进行计算扩展
至边缘计算。应用价值方面业务流程自动化、人机交互智能化将是优先受益领域。市场生态方面则体
现出两大明显趋势软件及应用引领基础计算架构、生态资源整合制胜。
• 辨识从技术到应用的路径驱劢AI落地。机器学习、深度学习作为最基础最关键的核心技术驱动
图像、视频、语音、语义、知识图谱等技术的应用未来还将向融合语音、语义、视频图像等多模态计算
发展。而从技术到应用 IDC在本次研究中也追踪了16个行业的应用场景。要将这些应用在企业
中落地并发挥效能需要行业参与者共同解决数据资源、硬件适配、云端协同、工程化等诸多环节的
要求。
• 评估AI应用效能促进商业模式重构。全面分析所有AI应用场景可以看到人工智能对企业的影
响深远从产品服务侧到中间的生产模式、运营模式再到决策端人工智能将从降低人力成本、缩
短流程所需时间、降低风险损失、带来增值收入、提高生产效率等方面发挥效能。人工智能在不同行业
不同企业发挥的效能并不均衡本着“早投资早评估早受益”的原则AI系统的早期投资者基本
可在6-24个月内收回投资成本甚至获得更多投资回报。
• 共建合作伙伴网络帮劣各方轻松拓展业务。人工智能生态系统正在经历高度集中-各自为政-各
司其职的演化进程。为充分发挥应用效能行业参与者不应止步于单纯的采用这些技术而应积极
构建和启用有助于促进各方合作的平台与服务从而提升整个生态系统的效率。
• 百度大脑简单易用、全面开放。百度大脑经过两年多的开放和迭代 目前已经升级到30版本
开放超140项AI能力。百度大脑始终致力于为用户提供最丰富最开放、简单易用的AI能力。
• 最后AI行劢计划可以分为六步走1 -10天——制定AI行动计划1 1 -20天——选择合适的启动场
景21 -40天——成立项目小组准备数据并落实预算 41 -60天——开始测试AI系统 61 -80天——
正式开始部署AI系统81 -100天——复制成功实践扩大部署规模。
4
把握趋势2019年AI市场展望
过去两年间人工智能在中国的发展速度可谓一日千里、遍地开花从企业单个业
务场景试用到复制推广到更多部门从先行者的小范围探索到行业企业全面入局
从语音控制、人脸识别、OCR等单点应用到将机器学习应用在各种细分领域。先
行者正在将成功的人工智能系统实践复制到更多领域技术与应用双重创新驱动中
国人工智能市场高速发展。展望2019年以及其后的3年预计人工智能市场将再续
辉煌新技术的渗透率将进一步提高将从智能流程自动化、人机交互智能化等方面
变革性地提升人类生活与工作效率。与此同时市场生态也将更加高度整合。
04 05
低 人
代 工
平 云 软 态
01
5
6
在未来1-3年内人工智能应用将渗入到企业的各项应用程序和业务场景势必将为组织的人力结构、业务流程甚至所在的产业结构带来变革。 IDC预计到2022年中国人工智能市场规模将达到984亿美金。智能化升级是大势所趋如何建立充分的认知和预期如何利用AI为企业带来经济效能如何做好战略部署和行动计划企业在未来一年内均需将这些问题优先纳入战略议程。
图2中国人工智能市场规模预测 2017-2022 百万美元
来源: IDC,20187
辨识路径从技术到应用
把握人工智能发展趋势了解人工智能从技术到应用的落地路径是制定人工智能战略的基础。
IDC将真正具备学习能力的系统称之为人工智能系统。系统通过自然语言、语音、 图像、 视频等
方式与人类交互从交互信息中抽取知识建立知识库并采用机器学习方式建立预测模型基于模
型进行推理给出结果。机器学习是系统实现智能化的最关键、最基础技术支持系统实现智能化、 自
然交互。
8
AI系统基础技术机器学习
机器学习作为实现智能化的关键技术在工业界具体落地过程中又可以分为传统的机器学习和深度学习。传统机器学习算法按照解决问题的类型可分为聚类算法、分类算法和回归算法三大类聚类是一个无监督学习的过程没有给出分类通过相似度得到分类。分类是一个有监督的学习过程 目标数据库中有哪些类别是已知的分类过程需要做的就是把每一条记录归到对应的类别之中。回归是一个有监督学习过程量化因变量受自变量影响的大小建立线性回归方程或者非线性回归方程从而达到对因变量的预测或者解释作用。
深度学习 按照拓扑结构进行分类可以分为卷积神经网络CNN、循环神经网络RNN、对抗生成网络GAN、强化学习。其中CNN常用于图像、视频、音频类数据分析RNN则常见于文本类数据处理。GAN常用于图像合成、 图像数据超像素去噪、语音合成和视频合成等领域。强化学习常见于电子竞技、库存管理、动态定价、动态治疗、机器人和工业自动化等领域。
使用机器学习模型进行图像、视频、语音等类型数据处理如下图所示首先需要在该领域具备一定的数据量有监督、半监督机器学习还需要将数据提前标注。完成数据准备工作后训练模型并对模型参数不断调优至可以上线部署。训练好的模型部署上线后即成为一个个推理引擎支持自然语言处理、图像识别、语音分析、海量结构化数据分析预测等。图3机器学习应用开发过程 图4人工智能开放平台技术能力日渐丰富
来源: IDC, 2018 来源:百度, 20189
构成AI系统的技术能力
由机器学习支撑的人工智能核心技术能力可分成2大类
1 感知技术
智能语音
智能语音是人以自然语音或机器合成语音同计算机进行交互的综合性技术结合了语言学、心理学、工程和计算机技术
等领域的知识。语音交互不仅要对语音识别和语音合成进行研究还要对人在语音通道下的交互机理、行为方式等进行研究。
语音交互过程包括四部分语音采集、语音识别、语义理解和语音合成。语音采集完成音频的录入、采样及编码语音识别完
成语音信息到机器可识别的文本信息的转化语义理解根据语音识别转换后的文本字符或命令完成相应的操作语音合
成完成文本信息到声音信息的转换。
作为人类沟通和获取信息最自然便捷的手段语音交互比其他交互方式具备更多优势能为人机交互带来根本性变
革是大数据和认知计算时代未来发展的制高点具有广阔的发展前景和应用前景。
计算机视觉
计算机视觉是使用计算机模仿人类视觉系统的科学让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列
的能力。 自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近来随着深度学习
的发展预处理、特征提取与算法处理渐渐融合形成端到端的人工智能算法技术。根据解决的问题 计算机视觉可分为图像
理解、三维视觉、动态视觉三大类。
a 图像理解
图像理解是通过用计算机系统解释图像实现类似人类视觉系统理解外部世界的一门科学。通常根据理解信息
的抽象程度可分为三个层次
浅层理解包括图像边缘、图像特征点、纹理元素等
中层理解包括物体边界、区域与平面等
高层理解根据需要抽取的高层语义信息可大致分为识别、检测、分割、姿态估计、图像文字说明等。 目前高层图像理解算
法已逐渐广泛应用于人工智能系统如刷脸支付、智慧安防、图像搜索等。
b 三维视觉
三维视觉即研究如何通过视觉获取三维信息三维重建以及如何理解所获取的三维信息的科学。三维重建可
以根据重建的信息来源分为单目图像重建、多目图像重建和深度图像重建等。三维信息理解即使用三维信息辅助
图像理解或者直接理解三维信息。三维信息理解可分为浅层角点、边缘、法向量等中层平面、立方体等高层物体检测、
识别、分割等。三维视觉技术可以广泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。
c 劢态视觉
动态视觉即分析视频或图像序列模拟人处理时序图像的科学。通常动态视觉问题可以定义为寻找图像元素如像
素、区域、物体在时序上的对应以及提取其语义信息的问题。动态视觉研究被广泛应用在视频分析以及人机交互等方
面。
10
AR/VR
增强现实AR/虚拟现实VR是以计算机为核心的新型视听技术。结合相关科学技术在一定范围内生成与真实环境在视觉、听觉、触感等方面高度近似的数字化环境。用户借助必要的装备与数字化环境中的对象进行交互相互影响获得近似真实环境的感受和体验通过显示设备、跟踪定位设备、触力觉交互设备、数据获取设备、专用芯片等实现。
2认知技术
自然语言处理
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向 研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法涉及的领域较多主要包括机器翻译、阅读理解、智能写作、对话系统、基础技术和语义计算等。
a 机器翻译
机器翻译的目标是利用计算机将一种语言自动翻译为另外一种语言涉及计算机、认知科学、语言学、信息论等学科是人工智能的终极目标之一。基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的局限性翻译性能取得大幅提升。基于深度神经网络的机器翻译使得翻译质量进一步取得跃升显示出巨大的潜力。 同时与语音、视觉等人工智能技术结合的多模翻译也取得一系列进展智能翻译机、 自动同传、 AR翻 译等创新产品的出现进一步提升了用户体验扩展了应用场景。
b 阅读理解
阅读理解旨在让机器像人类一样能够持续的对海量文本进行阅读和知识积累从而不断提升机器的智能水平进行文本理解与问答。阅读理解通过对篇章级文本的深度语义理解分析篇章中的主题、关键信息、核心关系进而完成知识获取、 内容理解、文本问答等任务。
c 智能写作
智能写作是指利用计算机技术进行自动的内容创作或者辅助作者进行内容创作。智能写作技术以自然语言生成技术为核心同时也依赖于文本挖掘、信息抽取、情感分析等关键技术。
d 对话系统
人机对话旨在让人类以自然语言的方式与计算机等智能设备进行交互。人机对话技术以自然语言处理技术为基础有机融合语言理解、语言生成、语音处理、机器学习以及规划推理等重要技术在智能家居、智能客服、智能助理、智能出行等方面都有广泛的应用。
e 基础技术和语义计算
自然语言处理基础技术包括各种文本处理的基本算法如词法分析、句法分析、文本纠错、语言模型、情感识别、文本分类等。语义计算旨在使机器具备文本语义计算能力让机器像人一样思考。语义计算技术包含文本语义表示、语义解析、语义匹配、多模态语义计算等技术。
知识图谱
知识图谱是一种结构化的知识库是一种由节点和边组成的图数据结构是一种将不同种类的信息连接在一起的语义网络。知识图谱符号化地描述了物理世界中的实体及其联系提供了从“关系”的角度去分析问题的能力。
基于解析融合、语义关联、表示理解的能力知识图谱可以沉淀传承知识与智慧更好地理解意图和资源从而优化问答、对话、推荐、推理计算等任务的效果提升认知系统的智能化水平。与行业应用场景结合知识图谱可以广泛应用于智慧医疗、智慧金融、智慧司法、智慧企业服务等方向。
用户理解
在AI应用场景中需要对C端用户有全面的理解用户画像是非常重要的技术方向可以从多个维度去刻画用户特征形成群 体画像用于市场营销、风险控制等领域。
11