大数据分析解决方案简介—零售英特尔大数据支持—市场营销大型家用电器预测英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为英特尔和Cloudera实施了一项解决方案用以获取多个数据源,使用信息创建变量以预测客户的购买趋势.
为何选择英特尔和Cloudera英特尔和Cloudera能够帮助用户轻松使用Apache*Hadoop*:通过独有的协作方式,在开放标准基础之上,提供了性能出色、高安全性的优质分发版本.
得益于与整个生态系统数百家厂商的合作,我们推出了基于ClouderaEnterprise的解决方案,能够帮助用户避免受限于特定厂商,同时构建强大的大数据解决方案,满足当前和将来的业务需求.
针对软硬件进行专门调整的产品路线图可加速创新,能够创造Hadoop*的多个行业第一.
与数据中心领域的几乎所有提供商均保持紧密合作关系,可大大简化大数据解决方案构建流程.
在推进行业标准发展方面的卓越表现,能够帮助用户避免陷入孤岛困境.
一家法国家用电器销售公司需要一种解决方案来预测以往客户的产品购买行为,洞悉家庭购买更多产品的可能性.
该公司部署了ClouderaHadoop分发版(CDH)获取和处理海量原始客户数据,如购买历史、人口统计数据、服务请求等.
基于Cloudera的全新解决方案可使用复杂的随机预测模型算法,从客户数据中创建100多个确定性变量,CDH可利用贝叶斯流程将这些变量转变为可行的解决方案,以准确预测客户的购买行为,帮助该公司根据数据做出明智的业务决策.
结果这款由英特尔和Cloudera联合设计的解决方案具有如下优势:为该公司提供从客户数据中创建变量的方法,以预测每位客户的购买模式.
使用这些变量准确评估客户在过去一年的购买趋势,做出更准确反映客户实际购买行为的预测.
预测每个家庭组中哪个家庭最可能购买产品.
对于可能性最高的每个家庭,确定他们最可能从哪个产品组中进行购买.
业务推动为了解答下列问题,该公司的高管来寻求英特尔的帮助.
问题包括:如何识别最可能在未来12个月内购买电器的头500个家庭这些家庭最可能购买哪个产品线的产品解答这些问题可帮助该公司更好地针对客户的购买趋势制定业务战略.
解决方案详细信息该公司联系英特尔以帮助满足其大数据需求.
根据英特尔的建议,他们决定使用运行CDH和R统计软件的Hadoop集群(图1).
该CDH集群可加载并处理九个来源的数据.
在经过合并与聚合后,这些数据源的文件被用于创建106个变量,根据定义涵盖下列项目:客户基本信息家庭信息家庭细分过去的购买行为服务和维护请求行为家庭住房政府户籍资料和当地人口统计数据触发服务请求的契机居民活动为确定和选择对客户购买习惯影响最大的变量,我们针对每个客户数据组应用了单独的随机预测算法.
该算法包含1,000个不同的树.
该分析的理论基础为贝叶斯推理,这种推理统计方法可计算客户兴趣的后验概率.
每个变量的重要性取决于随机预测算法为其分配的"平均降低精度"值.
逻辑回归模型按照随机预测算法确定的重要性优先级基于变量而构建.
每个客户具有"购买/不购买"标志,该标志表示家庭购买意向所受到的积极或消极影响.
它还可帮助十分准确地预测客户将会购买哪个产品线的产品.
根据模型计算,各家庭按照从高到低的购买可能性进行排序.
该模型还可预测对于每个家庭,哪个产品供应链具有最高的购买后验概率.
英特尔使用三个HiveQL脚本和九个R脚本,以及一个可有序执行HiveQL和R脚本的shell脚本为该模型开发了代码,并生成了最终的分析结果.
为证明该逻辑回归模型的准确性和强大功能,我们验证了该模型,即使用2015年的结果预测客户购买的可能性,并识别他们会购买哪个产品线的产品.
我们在实际场景中测试了该模型的功能,将我们的预测结果与这年的实际购买结果进行了比较,发现我们的预测准确率为68%(图2).
一些产品线的误预测率大幅高于平均值,但它们在测试组中仅占很小的比率.
英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为2图1减少随机预测.
在处理九个来源的数据后,该解决方案创建了106个变量,以确定客户/家庭后续从各个产品线中购买更多产品的可能性.
该模型执行了Hive查询,将Hive表转换为CSV文件,执行R脚本并以CSV文件格式保存结果.
最后,该模型会根据概率似然得分将选择划分为不同层级.
变量选择变量创建后验概率计算(特定产品供应链购买概率—家庭)最可能购买选择数据加载和处理似然概率估计(产品供应链购买概率—按家庭)边缘似然估算(家庭的购买概率)先验概率估计(产品供应链购买概率)ClouderaEnterpriseCloudera可提供一种安全的容错平台准确预测哪些客户会购买哪个产品线的产品,帮助公司根据数据更快速、高效作出更明智的业务决策.
数据科学家可通过数据挖掘构建可靠的预测分析模型,并创建运行在CDH上的商业智能解决方案.
图2根据以往趋势预测未来.
根据历史和当前数据,该公司预测客户购买行为的准确率达到了68%.
Hadoop支持数据科学家访问Mahout(可扩展机器学习库)和流传输等工具,从而帮助他们Python或其他可执行脚本创建和运行MapReduce任务.
ClouderaHadoop分发版可为大数据解决方案提供经济高效的平台.
总结在部署CDH之前,该公司的预测方法无法提供他们所要的答案.
在英特尔和Cloudera的帮助下,该公司获得了高度一致的高级预测模型的优势.
英特尔帮助为该公司开发的回归模型可使用过去一年的购买数据验证模型函数的准确性,并证明了其准确的预测能力.
借助该模型,该公司现在可准确了解哪个家庭最可能在未来12个月内购买大型家用电器,以及这些电器会选自哪些产品线.
此外,该公司还可一目了然地查看每个家庭的购买次数以及每次购买的平均时间间隔,更清晰地了解客户及其购买习惯,从而制定更有效的计划.
英特尔希望为您的业务提供同样的帮助.
Cloudera的亮点通过提供统一的大数据平台,即一个构建在ApacheHadoop上的企业数据中心,Cloudear正在彻底改变企业数据管理.
Cloudera向企业提供一个统一的地方来存储、访问、处理、保护和分析所有的企业数据,帮助企业扩展其现有的投资的价值,同时又提出完全创新的方法来从企业数据中提炼价值.
Cloudera的开源大数据平台是全球范围内采用最广泛的平台,而且Hadoop是对开源Hadoop生态系统贡献最大的供应商.
作为领先的Hadoop专家的培训机构,Cloudera在全球累计培训了超过40,000位学员.
超过1,900个Cloudera合作伙伴和Cloudera资深专业服务团队帮助客户更快地获取价值.
最后,唯有Cloudera能够提供前瞻性的,预测性的支持,以确保企业数据枢纽无忧地运行.
众多不同行业领先企业和顶尖公共组织都正在全球范围内采用Cloudera作为实际生产平台.
如欲了解更多信息,请访问:www.
cloudera.
com英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为3准确预测数总预测数误预测数23%9,34968%27,50540,342英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为满足您的需求我们希望与您接洽,确定您的要求,满足您的目标.
加快价值实现速度:实现实时成本节约,及时响应市场趋势,并不断推动创新.
保护大数据:部署可持续的大数据计划,确保您的企业或您不会遭遇风险.
维护控制:与能够为您的团队提供培训的合作伙伴合作,成为自给自足的企业.
提高业务潜力:创建并执行一个能够帮助您适应当前和未来需求的计划.
Hadoop选型指南集群规模小型中型大型CPU英特尔至强处理器E5v3存储(TB)570TB节点数量主节点2至3个4至7个≥8从属节点<1212至95个≥96内存(GB)主内存64GB128GB≥256GB从属内存48GB96GB≥128GB网络1Gbps10Gbps10Gbps硬件配置很大程度上依赖于工作负载.
高存储密度集群可能使用4TBJBOD硬盘配置,计算密集型集群可能使用更高的内存配置进行配置.
联系我们联系您的销售代表,或通过电子邮件联系我们:Hadoop-services@intel.
comIntel.
com/bigdata/services本文引用的结果基于英特尔及其客户执行的研究和测试,仅供参考使用.
在特定系统中对组件性能进行特定测试.
硬件、软件或配置的任何差异都可能影响实际性能.
请进行多方咨询,以评估您考虑购买的系统或组件的性能.
关于性能及基准数据的更完整的信息,敬请登陆:http://www.
intel.
com/performance英特尔技术的特性和优势取决于系统配置,并需要兼容的硬件、软件或需要激活服务.
实际性能会因您使用的具体系统配置的不同而有所差异.
任何计算机系统都无法提供绝对的安全性.
请联系您的系统制造商或零售商,或访问www.
intel.
cn了解更多信息,描述的成本降低方案旨在作为举例,说明指定的英特尔架构产品在特定环境和配置下,可能如何影响未来的成本和提供成本节省.
情况各有不同.
英特尔不保证任何成本或成本削减.
如欲获得本文涉及的带编号的文档复印件或其它英特尔文献,可致电1-800-548-4725,或访问英特尔网站:http://www.
intel.
com/design/literature.
htm英特尔和Intel标识是英特尔在美国和/或其他国家的商标.
*其他的名称和品牌可能是其他所有者的资产.
英特尔公司2015年版权所有.
所有权保留.
C请注意环保332921-002
hosteons当前对美国洛杉矶、达拉斯、纽约数据中心的VPS进行特别的促销活动:(1)免费从1Gbps升级到10Gbps带宽,(2)Free Blesta License授权,(3)Windows server 2019授权,要求从2G内存起,而且是年付。 官方网站:https://www.hosteons.com 使用优惠码:zhujicepingEDDB10G,可以获得: 免费升级10...
mineserver怎么样?mineserver是一家国人商家,主要提供香港CN2 KVM VPS、香港CMI KVM VPS、日本CN2 KVM VPS、洛杉矶cn2 gia端口转发等服务,云服务器网(yuntue.com)介绍过几次,最近比较活跃。现在新推出了3款特价KVM VPS,性价比高,香港CMI/洛杉矶GIA VPS,2核/2GB内存/20GB NVME/3.5TB流量/200Mbps...
桔子数据(徐州铭联信息科技有限公司)成立于2020年,是国内领先的互联网业务平台服务提供商。公司专注为用户提供低价高性能云计算产品,致力于云计算应用的易用性开发,并引导云计算在国内普及。目前公司研发以及运营云服务基础设施服务平台(IaaS),面向全球客户提供基于云计算的IT解决方案与客户服务,拥有丰富的国内BGP、双线高防、香港等优质的IDC资源。 公司一直秉承”以人为本、客户为尊、永...
前瞻分析为你推荐
工信部约谈电信怎么在工信部投诉中国电信vc组合VC 组合框 禁用 破解对对塔为什么不能玩天天擂台?(对对塔)sonicchat国外军人的左胸上有彩色的阁子是什么意思同ip网站同IP的两个网站,做单向链接,会不会被K掉??百度关键词工具常见的关键词挖掘工具有哪些haole018.com为什么www.haole008.com在我这里打不开啊,是不是haole008换新的地址了?336.com求那个网站 你懂得 1552517773@qqwww.zjs.com.cn怎么查询我的平安信用卡寄送情况lcoc.topoffsettop和scrolltop的区别
最新代理服务器ip 个人域名备案 赵容 空间打开慢 外国空间 iis安装教程 xfce 空间服务商 html空间 免费全能空间 linux空间 怎么测试下载速度 789电视网 北京双线 卡巴斯基试用版 世界测速 免费全能主机 稳定免费空间 河南移动m值兑换 昆明蜗牛家 更多