英特尔前瞻分析

前瞻分析  时间:2021-04-01  阅读:()
大数据分析解决方案简介—零售英特尔大数据支持—市场营销大型家用电器预测英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为英特尔和Cloudera实施了一项解决方案用以获取多个数据源,使用信息创建变量以预测客户的购买趋势.
为何选择英特尔和Cloudera英特尔和Cloudera能够帮助用户轻松使用Apache*Hadoop*:通过独有的协作方式,在开放标准基础之上,提供了性能出色、高安全性的优质分发版本.
得益于与整个生态系统数百家厂商的合作,我们推出了基于ClouderaEnterprise的解决方案,能够帮助用户避免受限于特定厂商,同时构建强大的大数据解决方案,满足当前和将来的业务需求.
针对软硬件进行专门调整的产品路线图可加速创新,能够创造Hadoop*的多个行业第一.
与数据中心领域的几乎所有提供商均保持紧密合作关系,可大大简化大数据解决方案构建流程.
在推进行业标准发展方面的卓越表现,能够帮助用户避免陷入孤岛困境.
一家法国家用电器销售公司需要一种解决方案来预测以往客户的产品购买行为,洞悉家庭购买更多产品的可能性.
该公司部署了ClouderaHadoop分发版(CDH)获取和处理海量原始客户数据,如购买历史、人口统计数据、服务请求等.
基于Cloudera的全新解决方案可使用复杂的随机预测模型算法,从客户数据中创建100多个确定性变量,CDH可利用贝叶斯流程将这些变量转变为可行的解决方案,以准确预测客户的购买行为,帮助该公司根据数据做出明智的业务决策.
结果这款由英特尔和Cloudera联合设计的解决方案具有如下优势:为该公司提供从客户数据中创建变量的方法,以预测每位客户的购买模式.
使用这些变量准确评估客户在过去一年的购买趋势,做出更准确反映客户实际购买行为的预测.
预测每个家庭组中哪个家庭最可能购买产品.
对于可能性最高的每个家庭,确定他们最可能从哪个产品组中进行购买.
业务推动为了解答下列问题,该公司的高管来寻求英特尔的帮助.
问题包括:如何识别最可能在未来12个月内购买电器的头500个家庭这些家庭最可能购买哪个产品线的产品解答这些问题可帮助该公司更好地针对客户的购买趋势制定业务战略.
解决方案详细信息该公司联系英特尔以帮助满足其大数据需求.
根据英特尔的建议,他们决定使用运行CDH和R统计软件的Hadoop集群(图1).
该CDH集群可加载并处理九个来源的数据.
在经过合并与聚合后,这些数据源的文件被用于创建106个变量,根据定义涵盖下列项目:客户基本信息家庭信息家庭细分过去的购买行为服务和维护请求行为家庭住房政府户籍资料和当地人口统计数据触发服务请求的契机居民活动为确定和选择对客户购买习惯影响最大的变量,我们针对每个客户数据组应用了单独的随机预测算法.
该算法包含1,000个不同的树.
该分析的理论基础为贝叶斯推理,这种推理统计方法可计算客户兴趣的后验概率.
每个变量的重要性取决于随机预测算法为其分配的"平均降低精度"值.
逻辑回归模型按照随机预测算法确定的重要性优先级基于变量而构建.
每个客户具有"购买/不购买"标志,该标志表示家庭购买意向所受到的积极或消极影响.
它还可帮助十分准确地预测客户将会购买哪个产品线的产品.
根据模型计算,各家庭按照从高到低的购买可能性进行排序.
该模型还可预测对于每个家庭,哪个产品供应链具有最高的购买后验概率.
英特尔使用三个HiveQL脚本和九个R脚本,以及一个可有序执行HiveQL和R脚本的shell脚本为该模型开发了代码,并生成了最终的分析结果.
为证明该逻辑回归模型的准确性和强大功能,我们验证了该模型,即使用2015年的结果预测客户购买的可能性,并识别他们会购买哪个产品线的产品.
我们在实际场景中测试了该模型的功能,将我们的预测结果与这年的实际购买结果进行了比较,发现我们的预测准确率为68%(图2).
一些产品线的误预测率大幅高于平均值,但它们在测试组中仅占很小的比率.
英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为2图1减少随机预测.
在处理九个来源的数据后,该解决方案创建了106个变量,以确定客户/家庭后续从各个产品线中购买更多产品的可能性.
该模型执行了Hive查询,将Hive表转换为CSV文件,执行R脚本并以CSV文件格式保存结果.
最后,该模型会根据概率似然得分将选择划分为不同层级.
变量选择变量创建后验概率计算(特定产品供应链购买概率—家庭)最可能购买选择数据加载和处理似然概率估计(产品供应链购买概率—按家庭)边缘似然估算(家庭的购买概率)先验概率估计(产品供应链购买概率)ClouderaEnterpriseCloudera可提供一种安全的容错平台准确预测哪些客户会购买哪个产品线的产品,帮助公司根据数据更快速、高效作出更明智的业务决策.
数据科学家可通过数据挖掘构建可靠的预测分析模型,并创建运行在CDH上的商业智能解决方案.
图2根据以往趋势预测未来.
根据历史和当前数据,该公司预测客户购买行为的准确率达到了68%.
Hadoop支持数据科学家访问Mahout(可扩展机器学习库)和流传输等工具,从而帮助他们Python或其他可执行脚本创建和运行MapReduce任务.
ClouderaHadoop分发版可为大数据解决方案提供经济高效的平台.
总结在部署CDH之前,该公司的预测方法无法提供他们所要的答案.
在英特尔和Cloudera的帮助下,该公司获得了高度一致的高级预测模型的优势.
英特尔帮助为该公司开发的回归模型可使用过去一年的购买数据验证模型函数的准确性,并证明了其准确的预测能力.
借助该模型,该公司现在可准确了解哪个家庭最可能在未来12个月内购买大型家用电器,以及这些电器会选自哪些产品线.
此外,该公司还可一目了然地查看每个家庭的购买次数以及每次购买的平均时间间隔,更清晰地了解客户及其购买习惯,从而制定更有效的计划.
英特尔希望为您的业务提供同样的帮助.
Cloudera的亮点通过提供统一的大数据平台,即一个构建在ApacheHadoop上的企业数据中心,Cloudear正在彻底改变企业数据管理.
Cloudera向企业提供一个统一的地方来存储、访问、处理、保护和分析所有的企业数据,帮助企业扩展其现有的投资的价值,同时又提出完全创新的方法来从企业数据中提炼价值.
Cloudera的开源大数据平台是全球范围内采用最广泛的平台,而且Hadoop是对开源Hadoop生态系统贡献最大的供应商.
作为领先的Hadoop专家的培训机构,Cloudera在全球累计培训了超过40,000位学员.
超过1,900个Cloudera合作伙伴和Cloudera资深专业服务团队帮助客户更快地获取价值.
最后,唯有Cloudera能够提供前瞻性的,预测性的支持,以确保企业数据枢纽无忧地运行.
众多不同行业领先企业和顶尖公共组织都正在全球范围内采用Cloudera作为实际生产平台.
如欲了解更多信息,请访问:www.
cloudera.
com英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为3准确预测数总预测数误预测数23%9,34968%27,50540,342英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为满足您的需求我们希望与您接洽,确定您的要求,满足您的目标.
加快价值实现速度:实现实时成本节约,及时响应市场趋势,并不断推动创新.
保护大数据:部署可持续的大数据计划,确保您的企业或您不会遭遇风险.
维护控制:与能够为您的团队提供培训的合作伙伴合作,成为自给自足的企业.
提高业务潜力:创建并执行一个能够帮助您适应当前和未来需求的计划.
Hadoop选型指南集群规模小型中型大型CPU英特尔至强处理器E5v3存储(TB)570TB节点数量主节点2至3个4至7个≥8从属节点<1212至95个≥96内存(GB)主内存64GB128GB≥256GB从属内存48GB96GB≥128GB网络1Gbps10Gbps10Gbps硬件配置很大程度上依赖于工作负载.
高存储密度集群可能使用4TBJBOD硬盘配置,计算密集型集群可能使用更高的内存配置进行配置.
联系我们联系您的销售代表,或通过电子邮件联系我们:Hadoop-services@intel.
comIntel.
com/bigdata/services本文引用的结果基于英特尔及其客户执行的研究和测试,仅供参考使用.
在特定系统中对组件性能进行特定测试.
硬件、软件或配置的任何差异都可能影响实际性能.
请进行多方咨询,以评估您考虑购买的系统或组件的性能.
关于性能及基准数据的更完整的信息,敬请登陆:http://www.
intel.
com/performance英特尔技术的特性和优势取决于系统配置,并需要兼容的硬件、软件或需要激活服务.
实际性能会因您使用的具体系统配置的不同而有所差异.
任何计算机系统都无法提供绝对的安全性.
请联系您的系统制造商或零售商,或访问www.
intel.
cn了解更多信息,描述的成本降低方案旨在作为举例,说明指定的英特尔架构产品在特定环境和配置下,可能如何影响未来的成本和提供成本节省.
情况各有不同.
英特尔不保证任何成本或成本削减.
如欲获得本文涉及的带编号的文档复印件或其它英特尔文献,可致电1-800-548-4725,或访问英特尔网站:http://www.
intel.
com/design/literature.
htm英特尔和Intel标识是英特尔在美国和/或其他国家的商标.
*其他的名称和品牌可能是其他所有者的资产.
英特尔公司2015年版权所有.
所有权保留.
C请注意环保332921-002

tmhhost(100元/季)自带windows系统,香港(三网)cn2 gia、日本cn2、韩国cn2、美国(三网)cn2 gia、美国cn2gia200G高防

tmhhost可谓是相当熟悉国内网络情况(资质方面:ISP\ICP\工商齐备),专业售卖海外高端优质线路的云服务器和独立服务器,包括了:香港的三网cn2 gia、日本 cn2、日本软银云服务器、韩国CN2、美国三网cn2 gia 云服务器、美国 cn2 gia +200G高防的。另外还有国内云服务器:镇江BGP 大连BGP数据盘和系统盘分开,自带windows系统,支持支付宝付款和微信,简直就是专...

georgedatacenter:美国VPS可选洛杉矶/芝加哥/纽约/达拉斯机房,$20/年;洛杉矶独立服务器39美元/月

georgedatacenter怎么样?georgedatacenter这次其实是两个促销,一是促销一款特价洛杉矶E3-1220 V5独服,性价比其实最高;另外还促销三款特价vps,大家可以根据自己的需要入手。georgedatacenter是一家成立于2019年的美国vps商家,主营美国洛杉矶、芝加哥、达拉斯、新泽西、西雅图机房的VPS、邮件服务器和托管独立服务器业务。georgedatacen...

湖北22元/月(昔日数据)云服务器,国内湖北十堰云服务器,首月6折

昔日数据怎么样?昔日数据新上了湖北十堰云服务器,湖北十堰市IDC数据中心 母鸡采用e5 2651v2 SSD MLC企业硬盘 rdid5阵列为数据护航 100G高防 超出防御峰值空路由2小时 不限制流量。目前,国内湖北十堰云服务器,首月6折火热销售限量30台价格低至22元/月。(注意:之前有个xrhost.cn也叫昔日数据,已经打不开了,一看网站LOGO和名称为同一家,有一定风险,所以尽量不要选择...

前瞻分析为你推荐
www.kkk.comwww.kkk103.com网站产品质量有保证吗陈嘉垣陈浩民狼吻陈嘉恒是什么时候的事百花百游迎得春来非自足,百花千卉共芬芳什么意思haole018.comhttp://www.haoledy.com/view/32092.html 轩辕剑天之痕11、12集在线观看haole10.comwww.qq10eu.in是QQ网站吗m.yushuwu.org花样滑冰名将YU NA KIM的资料谁有?彪言彪语( )言( )语的词语xyq.cbg.163.com梦幻西游藏宝阁怎么开通怎么用www.seowhy.com哪里有免费学习seo的红玉头冠裂心护肩是哪出的 红玉头冠哪出的
二级域名申请 个人域名备案 免费申请域名和空间 过期域名抢注 vpsio 监控宝 国外在线代理 ibox官网 web服务器的架设 最好的免费空间 789电视 中国电信测网速 美国堪萨斯 空间技术网 cloudlink 移动服务器托管 网站加速软件 汤博乐 wordpress空间 accountsuspended 更多