英特尔前瞻分析

前瞻分析  时间:2021-04-01  阅读:()
大数据分析解决方案简介—零售英特尔大数据支持—市场营销大型家用电器预测英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为英特尔和Cloudera实施了一项解决方案用以获取多个数据源,使用信息创建变量以预测客户的购买趋势.
为何选择英特尔和Cloudera英特尔和Cloudera能够帮助用户轻松使用Apache*Hadoop*:通过独有的协作方式,在开放标准基础之上,提供了性能出色、高安全性的优质分发版本.
得益于与整个生态系统数百家厂商的合作,我们推出了基于ClouderaEnterprise的解决方案,能够帮助用户避免受限于特定厂商,同时构建强大的大数据解决方案,满足当前和将来的业务需求.
针对软硬件进行专门调整的产品路线图可加速创新,能够创造Hadoop*的多个行业第一.
与数据中心领域的几乎所有提供商均保持紧密合作关系,可大大简化大数据解决方案构建流程.
在推进行业标准发展方面的卓越表现,能够帮助用户避免陷入孤岛困境.
一家法国家用电器销售公司需要一种解决方案来预测以往客户的产品购买行为,洞悉家庭购买更多产品的可能性.
该公司部署了ClouderaHadoop分发版(CDH)获取和处理海量原始客户数据,如购买历史、人口统计数据、服务请求等.
基于Cloudera的全新解决方案可使用复杂的随机预测模型算法,从客户数据中创建100多个确定性变量,CDH可利用贝叶斯流程将这些变量转变为可行的解决方案,以准确预测客户的购买行为,帮助该公司根据数据做出明智的业务决策.
结果这款由英特尔和Cloudera联合设计的解决方案具有如下优势:为该公司提供从客户数据中创建变量的方法,以预测每位客户的购买模式.
使用这些变量准确评估客户在过去一年的购买趋势,做出更准确反映客户实际购买行为的预测.
预测每个家庭组中哪个家庭最可能购买产品.
对于可能性最高的每个家庭,确定他们最可能从哪个产品组中进行购买.
业务推动为了解答下列问题,该公司的高管来寻求英特尔的帮助.
问题包括:如何识别最可能在未来12个月内购买电器的头500个家庭这些家庭最可能购买哪个产品线的产品解答这些问题可帮助该公司更好地针对客户的购买趋势制定业务战略.
解决方案详细信息该公司联系英特尔以帮助满足其大数据需求.
根据英特尔的建议,他们决定使用运行CDH和R统计软件的Hadoop集群(图1).
该CDH集群可加载并处理九个来源的数据.
在经过合并与聚合后,这些数据源的文件被用于创建106个变量,根据定义涵盖下列项目:客户基本信息家庭信息家庭细分过去的购买行为服务和维护请求行为家庭住房政府户籍资料和当地人口统计数据触发服务请求的契机居民活动为确定和选择对客户购买习惯影响最大的变量,我们针对每个客户数据组应用了单独的随机预测算法.
该算法包含1,000个不同的树.
该分析的理论基础为贝叶斯推理,这种推理统计方法可计算客户兴趣的后验概率.
每个变量的重要性取决于随机预测算法为其分配的"平均降低精度"值.
逻辑回归模型按照随机预测算法确定的重要性优先级基于变量而构建.
每个客户具有"购买/不购买"标志,该标志表示家庭购买意向所受到的积极或消极影响.
它还可帮助十分准确地预测客户将会购买哪个产品线的产品.
根据模型计算,各家庭按照从高到低的购买可能性进行排序.
该模型还可预测对于每个家庭,哪个产品供应链具有最高的购买后验概率.
英特尔使用三个HiveQL脚本和九个R脚本,以及一个可有序执行HiveQL和R脚本的shell脚本为该模型开发了代码,并生成了最终的分析结果.
为证明该逻辑回归模型的准确性和强大功能,我们验证了该模型,即使用2015年的结果预测客户购买的可能性,并识别他们会购买哪个产品线的产品.
我们在实际场景中测试了该模型的功能,将我们的预测结果与这年的实际购买结果进行了比较,发现我们的预测准确率为68%(图2).
一些产品线的误预测率大幅高于平均值,但它们在测试组中仅占很小的比率.
英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为2图1减少随机预测.
在处理九个来源的数据后,该解决方案创建了106个变量,以确定客户/家庭后续从各个产品线中购买更多产品的可能性.
该模型执行了Hive查询,将Hive表转换为CSV文件,执行R脚本并以CSV文件格式保存结果.
最后,该模型会根据概率似然得分将选择划分为不同层级.
变量选择变量创建后验概率计算(特定产品供应链购买概率—家庭)最可能购买选择数据加载和处理似然概率估计(产品供应链购买概率—按家庭)边缘似然估算(家庭的购买概率)先验概率估计(产品供应链购买概率)ClouderaEnterpriseCloudera可提供一种安全的容错平台准确预测哪些客户会购买哪个产品线的产品,帮助公司根据数据更快速、高效作出更明智的业务决策.
数据科学家可通过数据挖掘构建可靠的预测分析模型,并创建运行在CDH上的商业智能解决方案.
图2根据以往趋势预测未来.
根据历史和当前数据,该公司预测客户购买行为的准确率达到了68%.
Hadoop支持数据科学家访问Mahout(可扩展机器学习库)和流传输等工具,从而帮助他们Python或其他可执行脚本创建和运行MapReduce任务.
ClouderaHadoop分发版可为大数据解决方案提供经济高效的平台.
总结在部署CDH之前,该公司的预测方法无法提供他们所要的答案.
在英特尔和Cloudera的帮助下,该公司获得了高度一致的高级预测模型的优势.
英特尔帮助为该公司开发的回归模型可使用过去一年的购买数据验证模型函数的准确性,并证明了其准确的预测能力.
借助该模型,该公司现在可准确了解哪个家庭最可能在未来12个月内购买大型家用电器,以及这些电器会选自哪些产品线.
此外,该公司还可一目了然地查看每个家庭的购买次数以及每次购买的平均时间间隔,更清晰地了解客户及其购买习惯,从而制定更有效的计划.
英特尔希望为您的业务提供同样的帮助.
Cloudera的亮点通过提供统一的大数据平台,即一个构建在ApacheHadoop上的企业数据中心,Cloudear正在彻底改变企业数据管理.
Cloudera向企业提供一个统一的地方来存储、访问、处理、保护和分析所有的企业数据,帮助企业扩展其现有的投资的价值,同时又提出完全创新的方法来从企业数据中提炼价值.
Cloudera的开源大数据平台是全球范围内采用最广泛的平台,而且Hadoop是对开源Hadoop生态系统贡献最大的供应商.
作为领先的Hadoop专家的培训机构,Cloudera在全球累计培训了超过40,000位学员.
超过1,900个Cloudera合作伙伴和Cloudera资深专业服务团队帮助客户更快地获取价值.
最后,唯有Cloudera能够提供前瞻性的,预测性的支持,以确保企业数据枢纽无忧地运行.
众多不同行业领先企业和顶尖公共组织都正在全球范围内采用Cloudera作为实际生产平台.
如欲了解更多信息,请访问:www.
cloudera.
com英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为3准确预测数总预测数误预测数23%9,34968%27,50540,342英特尔和Cloudera帮助企业使用前瞻分析预测未来购买行为满足您的需求我们希望与您接洽,确定您的要求,满足您的目标.
加快价值实现速度:实现实时成本节约,及时响应市场趋势,并不断推动创新.
保护大数据:部署可持续的大数据计划,确保您的企业或您不会遭遇风险.
维护控制:与能够为您的团队提供培训的合作伙伴合作,成为自给自足的企业.
提高业务潜力:创建并执行一个能够帮助您适应当前和未来需求的计划.
Hadoop选型指南集群规模小型中型大型CPU英特尔至强处理器E5v3存储(TB)570TB节点数量主节点2至3个4至7个≥8从属节点<1212至95个≥96内存(GB)主内存64GB128GB≥256GB从属内存48GB96GB≥128GB网络1Gbps10Gbps10Gbps硬件配置很大程度上依赖于工作负载.
高存储密度集群可能使用4TBJBOD硬盘配置,计算密集型集群可能使用更高的内存配置进行配置.
联系我们联系您的销售代表,或通过电子邮件联系我们:Hadoop-services@intel.
comIntel.
com/bigdata/services本文引用的结果基于英特尔及其客户执行的研究和测试,仅供参考使用.
在特定系统中对组件性能进行特定测试.
硬件、软件或配置的任何差异都可能影响实际性能.
请进行多方咨询,以评估您考虑购买的系统或组件的性能.
关于性能及基准数据的更完整的信息,敬请登陆:http://www.
intel.
com/performance英特尔技术的特性和优势取决于系统配置,并需要兼容的硬件、软件或需要激活服务.
实际性能会因您使用的具体系统配置的不同而有所差异.
任何计算机系统都无法提供绝对的安全性.
请联系您的系统制造商或零售商,或访问www.
intel.
cn了解更多信息,描述的成本降低方案旨在作为举例,说明指定的英特尔架构产品在特定环境和配置下,可能如何影响未来的成本和提供成本节省.
情况各有不同.
英特尔不保证任何成本或成本削减.
如欲获得本文涉及的带编号的文档复印件或其它英特尔文献,可致电1-800-548-4725,或访问英特尔网站:http://www.
intel.
com/design/literature.
htm英特尔和Intel标识是英特尔在美国和/或其他国家的商标.
*其他的名称和品牌可能是其他所有者的资产.
英特尔公司2015年版权所有.
所有权保留.
C请注意环保332921-002

Ceraus24元/月,国庆促销 香港云上新首月五折

Ceraus数据成立于2020年底,基于KVM虚拟架构技术;主营提供香港CN2、美国洛杉矶CN2、日本CN2的相关VPS云主机业务。喜迎国庆香港上新首月五折不限新老用户,cera机房,线路好,机器稳,适合做站五折优惠码:gqceraus 续费七五折官方网站:https://www.ceraus.com香港云内存​CPU硬盘流量宽带优惠价格购买地址香港云2G2核40G不限5Mbps24元/月点击购买...

virmach:AMD平台小鸡,赌一把,单车变摩托?$7.2/年-512M内存/1核/10gSSD/1T流量,多机房可选

virmach送来了夏季促销,价格低到爆炸,而且在低价的基础上还搞首年8折,也就是说VPS低至7.2美元/年。不过,这里有一点要说明:你所购买的当前的VPS将会在09/30/2021 ~ 04/30/2022进行服务器转移,而且IP还会改变,当前的Intel平台会换成AMD平台,机房也会变动(目前来看以后会从colocrossing切换到INAP和Psychz),采取的是就近原则,原来的水牛城可能...

spinservers($179/月),1Gbps不限流量服务器,双E5-2630Lv3/64GB/1.6T SSD/圣何塞机房

中秋节快到了,spinservers针对中国用户准备了几款圣何塞机房特别独立服务器,大家知道这家服务器都是高配,这次推出的机器除了配置高以外,默认1Gbps不限制流量,解除了常规机器10TB/月的流量限制,价格每月179美元起,机器自动化上架,一般30分钟内,有基本自助管理功能,带IPMI,支持安装Windows或者Linux操作系统。配置一 $179/月CPU:Dual Intel Xeon E...

前瞻分析为你推荐
今日油条油条是怎样由来广东GDP破10万亿广东省城市经济排名bbs.99nets.com送点卷的冒险岛私服同ip域名不同域名解析到同一个IP是否有影响同ip站点同IP做同类站好吗?51sese.com谁有免费看电影的网站?www.xvideos.com请问www.****.com.hk 和www.****.com.cn一样吗?本冈一郎只想问本冈一郎的效果真的和说的一样吗?大概多长时间可以管用呢?用过的进!bihaiyinsha碧海银沙中国十大网页?邯郸纠风网邯郸市信访局地址
cn域名价格 hostmaster 息壤主机 美国翻墙 账号泄露 好玩的桌面 华为云主机 dd444 域名接入 百度云1t 免费网页空间 阿里云免费邮箱 国外在线代理服务器 电信宽带测速软件 宿迁服务器 网络速度 云销售系统 789电视剧网 博客域名 小夜博客 更多