英特尔前瞻分析

前瞻分析  时间:2021-04-01  阅读:()
大数据分析解决方案简介—零售英特尔大数据支持—市场营销大型家用电器预测英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为英特尔和Cloudera实施了一项解决方案用以获取多个数据源,使用信息创建变量以预测客户的购买趋势.
为何选择英特尔和Cloudera英特尔和Cloudera能够帮助用户轻松使用Apache*Hadoop*:通过独有的协作方式,在开放标准基础之上,提供了性能出色、高安全性的优质分发版本.
得益于与整个生态系统数百家厂商的合作,我们推出了基于ClouderaEnterprise的解决方案,能够帮助用户避免受限于特定厂商,同时构建强大的大数据解决方案,满足当前和将来的业务需求.
针对软硬件进行专门调整的产品路线图可加速创新,能够创造Hadoop*的多个行业第一.
与数据中心领域的几乎所有提供商均保持紧密合作关系,可大大简化大数据解决方案构建流程.
在推进行业标准发展方面的卓越表现,能够帮助用户避免陷入孤岛困境.
一家法国家用电器销售公司需要一种解决方案来预测以往客户的产品购买行为,洞悉家庭购买更多产品的可能性.
该公司部署了ClouderaHadoop分发版(CDH)获取和处理海量原始客户数据,如购买历史、人口统计数据、服务请求等.
基于Cloudera的全新解决方案可使用复杂的随机预测模型算法,从客户数据中创建100多个确定性变量,CDH可利用贝叶斯流程将这些变量转变为可行的解决方案,以准确预测客户的购买行为,帮助该公司根据数据做出明智的业务决策.
结果这款由英特尔和Cloudera联合设计的解决方案具有如下优势:为该公司提供从客户数据中创建变量的方法,以预测每位客户的购买模式.
使用这些变量准确评估客户在过去一年的购买趋势,做出更准确反映客户实际购买行为的预测.
预测每个家庭组中哪个家庭最可能购买产品.
对于可能性最高的每个家庭,确定他们最可能从哪个产品组中进行购买.
业务推动为了解答下列问题,该公司的高管来寻求英特尔的帮助.
问题包括:如何识别最可能在未来12个月内购买电器的头500个家庭这些家庭最可能购买哪个产品线的产品解答这些问题可帮助该公司更好地针对客户的购买趋势制定业务战略.
解决方案详细信息该公司联系英特尔以帮助满足其大数据需求.
根据英特尔的建议,他们决定使用运行CDH和R统计软件的Hadoop集群(图1).
该CDH集群可加载并处理九个来源的数据.
在经过合并与聚合后,这些数据源的文件被用于创建106个变量,根据定义涵盖下列项目:客户基本信息家庭信息家庭细分过去的购买行为服务和维护请求行为家庭住房政府户籍资料和当地人口统计数据触发服务请求的契机居民活动为确定和选择对客户购买习惯影响最大的变量,我们针对每个客户数据组应用了单独的随机预测算法.
该算法包含1,000个不同的树.
该分析的理论基础为贝叶斯推理,这种推理统计方法可计算客户兴趣的后验概率.
每个变量的重要性取决于随机预测算法为其分配的"平均降低精度"值.
逻辑回归模型按照随机预测算法确定的重要性优先级基于变量而构建.
每个客户具有"购买/不购买"标志,该标志表示家庭购买意向所受到的积极或消极影响.
它还可帮助十分准确地预测客户将会购买哪个产品线的产品.
根据模型计算,各家庭按照从高到低的购买可能性进行排序.
该模型还可预测对于每个家庭,哪个产品供应链具有最高的购买后验概率.
英特尔使用三个HiveQL脚本和九个R脚本,以及一个可有序执行HiveQL和R脚本的shell脚本为该模型开发了代码,并生成了最终的分析结果.
为证明该逻辑回归模型的准确性和强大功能,我们验证了该模型,即使用2015年的结果预测客户购买的可能性,并识别他们会购买哪个产品线的产品.
我们在实际场景中测试了该模型的功能,将我们的预测结果与这年的实际购买结果进行了比较,发现我们的预测准确率为68%(图2).
一些产品线的误预测率大幅高于平均值,但它们在测试组中仅占很小的比率.
英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为2图1减少随机预测.
在处理九个来源的数据后,该解决方案创建了106个变量,以确定客户/家庭后续从各个产品线中购买更多产品的可能性.
该模型执行了Hive查询,将Hive表转换为CSV文件,执行R脚本并以CSV文件格式保存结果.
最后,该模型会根据概率似然得分将选择划分为不同层级.
变量选择变量创建后验概率计算(特定产品供应链购买概率—家庭)最可能购买选择数据加载和处理似然概率估计(产品供应链购买概率—按家庭)边缘似然估算(家庭的购买概率)先验概率估计(产品供应链购买概率)ClouderaEnterpriseCloudera可提供一种安全的容错平台准确预测哪些客户会购买哪个产品线的产品,帮助公司根据数据更快速、高效作出更明智的业务决策.
数据科学家可通过数据挖掘构建可靠的预测分析模型,并创建运行在CDH上的商业智能解决方案.
图2根据以往趋势预测未来.
根据历史和当前数据,该公司预测客户购买行为的准确率达到了68%.
Hadoop支持数据科学家访问Mahout(可扩展机器学习库)和流传输等工具,从而帮助他们Python或其他可执行脚本创建和运行MapReduce任务.
ClouderaHadoop分发版可为大数据解决方案提供经济高效的平台.
总结在部署CDH之前,该公司的预测方法无法提供他们所要的答案.
在英特尔和Cloudera的帮助下,该公司获得了高度一致的高级预测模型的优势.
英特尔帮助为该公司开发的回归模型可使用过去一年的购买数据验证模型函数的准确性,并证明了其准确的预测能力.
借助该模型,该公司现在可准确了解哪个家庭最可能在未来12个月内购买大型家用电器,以及这些电器会选自哪些产品线.
此外,该公司还可一目了然地查看每个家庭的购买次数以及每次购买的平均时间间隔,更清晰地了解客户及其购买习惯,从而制定更有效的计划.
英特尔希望为您的业务提供同样的帮助.
Cloudera的亮点通过提供统一的大数据平台,即一个构建在ApacheHadoop上的企业数据中心,Cloudear正在彻底改变企业数据管理.
Cloudera向企业提供一个统一的地方来存储、访问、处理、保护和分析所有的企业数据,帮助企业扩展其现有的投资的价值,同时又提出完全创新的方法来从企业数据中提炼价值.
Cloudera的开源大数据平台是全球范围内采用最广泛的平台,而且Hadoop是对开源Hadoop生态系统贡献最大的供应商.
作为领先的Hadoop专家的培训机构,Cloudera在全球累计培训了超过40,000位学员.
超过1,900个Cloudera合作伙伴和Cloudera资深专业服务团队帮助客户更快地获取价值.
最后,唯有Cloudera能够提供前瞻性的,预测性的支持,以确保企业数据枢纽无忧地运行.
众多不同行业领先企业和顶尖公共组织都正在全球范围内采用Cloudera作为实际生产平台.
如欲了解更多信息,请访问:www.
cloudera.
com英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为3准确预测数总预测数误预测数23%9,34968%27,50540,342英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为满足您的需求我们希望与您接洽,确定您的要求,满足您的目标.
加快价值实现速度:实现实时成本节约,及时响应市场趋势,并不断推动创新.
保护大数据:部署可持续的大数据计划,确保您的企业或您不会遭遇风险.
维护控制:与能够为您的团队提供培训的合作伙伴合作,成为自给自足的企业.
提高业务潜力:创建并执行一个能够帮助您适应当前和未来需求的计划.
Hadoop选型指南集群规模小型中型大型CPU英特尔至强处理器E5v3存储(TB)570TB节点数量主节点2至3个4至7个≥8从属节点<1212至95个≥96内存(GB)主内存64GB128GB≥256GB从属内存48GB96GB≥128GB网络1Gbps10Gbps10Gbps硬件配置很大程度上依赖于工作负载.
高存储密度集群可能使用4TBJBOD硬盘配置,计算密集型集群可能使用更高的内存配置进行配置.
联系我们联系您的销售代表,或通过电子邮件联系我们:Hadoop-services@intel.
comIntel.
com/bigdata/services本文引用的结果基于英特尔及其客户执行的研究和测试,仅供参考使用.
在特定系统中对组件性能进行特定测试.
硬件、软件或配置的任何差异都可能影响实际性能.
请进行多方咨询,以评估您考虑购买的系统或组件的性能.
关于性能及基准数据的更完整的信息,敬请登陆:http://www.
intel.
com/performance英特尔技术的特性和优势取决于系统配置,并需要兼容的硬件、软件或需要激活服务.
实际性能会因您使用的具体系统配置的不同而有所差异.
任何计算机系统都无法提供绝对的安全性.
请联系您的系统制造商或零售商,或访问www.
intel.
cn了解更多信息,描述的成本降低方案旨在作为举例,说明指定的英特尔架构产品在特定环境和配置下,可能如何影响未来的成本和提供成本节省.
情况各有不同.
英特尔不保证任何成本或成本削减.
如欲获得本文涉及的带编号的文档复印件或其它英特尔文献,可致电1-800-548-4725,或访问英特尔网站:http://www.
intel.
com/design/literature.
htm英特尔和Intel标识是英特尔在美国和/或其他国家的商标.
*其他的名称和品牌可能是其他所有者的资产.
英特尔公司2015年版权所有.
所有权保留.
C请注意环保332921-002

10gbiz首月半价月付2.36美元,香港/洛杉矶VPS、硅谷独立服务器/站群服务器

收到10gbiz发来的7月份优惠方案,中国香港、美国洛杉矶机房VPS主机4折优惠码,优惠后洛杉矶VPS月付2.36美元起,香港VPS月付2.75美元起。这是一家2020年成立的主机商,提供的产品包括独立服务器租用和VPS主机等,数据中心在美国洛杉矶、圣何塞和中国香港。商家VPS主机基于KVM架构,支持使用PayPal或者支付宝付款。洛杉矶VPS架构CPU内存硬盘带宽系统价格单核512MB10GB1...

wordpress专业外贸建站主题 WordPress专业外贸企业网站搭建模版

WordPress专业外贸企业网站搭建模版,特色专业外贸企业风格 + 自适应网站开发设计 通用流行的外贸企业网站模块 + 更好的SEO搜索优化和收录 自定义多模块的产品展示功能 + 高效实用的后台自定义模块设置!采用标准的HTML5+CSS3语言开发,兼容当下的各种主流浏览器: IE 6+(以及类似360、遨游等基于IE内核的)、Firefox、Google Chrome、Safari、Opera...

云如故枣庄高防(49元)大内存2H2G49元8H8G109元

云如故是一家成立于2018年的国内企业IDC服务商,由山东云如故网络科技有限公司运营,IDC ICP ISP CDN VPN IRCS等证件齐全!合法运营销售,主要从事自营高防独立服务器、物理机、VPS、云服务器,虚拟主机等产品销售,适合高防稳定等需求的用户,可用于建站、游戏、商城、steam、APP、小程序、软件、资料存储等等各种个人及企业级用途。机房可封UDP 海外 支持策略定制 双层硬件(傲...

前瞻分析为你推荐
乐划锁屏乐视手机屏幕锁怎么自己就变了Baby被问婚变绯闻终于知道黄晓明为什么会娶baby百度商城百度积分有什么用?18comic.fun18岁以后男孩最喜欢的网站月神谭有没有什么好看的小说?拒绝言情小说!sss17.comwww.com17com.com是什么啊?百度指数词百度指数我创建的新词103838.com39052.com这电影网支持网页观看吗?www.5any.comwww.qbo5.com 这个网站要安装播放器抓站工具一起来捉妖神行抓妖辅助工具都有哪些?
天津虚拟主机 太原域名注册 域名交易网 5折 监控宝 xen typecho 轻量 mysql主机 河南服务器 智能骨干网 有奖调查 厦门电信 域名dns 免费asp空间 免备案cdn加速 hdsky 免费的加速器 压力测试工具 海康流媒体服务器 更多