olapoltp和olap的异同

olap  时间:2021-08-17  阅读:()

什么是olap,简述其作用及过程

数据挖掘DM与联机分析处理DLAP都属于分析型工具,但两者之间有着明显的区别。

DM是一种挖掘型工具,DM它能自动地发现隐藏在数据中的模式( Pattern)。

DM是一种有效地从大量数据中发现潜在数据模式、作出预测性分析的分析工具,它是现有的一些人工智能、统计学等成熟技术在特定的数据库领域中的应用。

DM与其他分析型工具最大的不同在于:它的分析过程是自动的。

一个成熟的DM系统,除了具有良好的核心的技术外,还应该具有开放性的结构,友好的用户接口。

DM的用户不必提出确切的问题,而只需DM去挖掘隐藏的模式并预测未来的趋势,这样更有利于发现未知的事实。

OLAP是一种自上而下、不断深入的分析工具:用户提出问题或假设,OLAP负责从上至下深入地提取出关于该问题的详细信息,并以可视化的方式呈现给用户。

与DM相比,OGAP更多地依靠用户输入问题和假设,但用户先入为主的局限性可能会限制问题和假设的范围,从而影响最终的结论。

因此,作为验证型分析工具,QLAP更需要对用户需求有全面而深入的了解。

显然,从对数据分析的深度的角度来看,SLAP位于较浅的层次,而Dh}所处的位置则较深。

如果按E.F. Codd的数据分析模型来区分这两者,那么应该说OLAP实现了解释模型和思考模型,而DNd则实现了更深的第四层—公式模型。

所处分析模型层次的不同决定了这两者的分析能力和所能回答的问题种类也不相同。

OLAP具有哪些功能?

联机分析(OLAP)是由关系数据库之父E.F.Codd于1993年提出的一种数据动态分析模型,它允许以一种称为多维数据集的多维结构访问来自商业数据源的经过聚合和组织整理的数据。

以此为标准,OLAP作为单独的一类产品同联机事务处理(OLTP)得以明显区分。

  有点深奥是不是?其实并不复杂,OLAP最基本的概念其实只有三个:多维观察、数据钻取、CUBE运算。

  从动态的多维角度分析数据   我们在平时工作中,会遇到各种问题,在分析问题的时候,同样的现象,我们会从多个角度去分析考虑,并且有时候我们还会从几个角度综合起来进行分析。

这就是OLAP分析最基本的概念:从多个观察角度的灵活组合来观察数据,从而发现数据内在规律。

  OLAP将数据分为两种特征,一种为表现特征,比如一个销售分析模型中的销售额、毛利等;还有一种为角度特征,比如销售分析中的时间周期、产品类型、销售模式、销售区域等。

前者是被观察的对象,OLAP术语称之为“度量数据”,后者为观察视角,OLAP术语称之为“维数据”。

  如果建立这样一个模型,我们就可以根据业务需求,从产品类型角度去观察各个销售地区的销售额数据(以产品类型和销售地区为维、以销售额为度量);或者我们还可以从销售模式的角度去观察各个销售地区的销售额数据(以销售模式和销售地区为维、以销售额为度量)。

  在Max@X Analyser的OLAP模型中,每个模型最多可以设定255个维、1024个度量,也就是说,我们可以从255个角度或者角度组合,去同时观察1024个数据对象的变化。

  对数据进行钻取,以获得更为精确的信息   在分析过程中,我们可能需要在现有数据基础上,将数据进一步细化,以获得更为精确的认识。

这就是OLAP中数据钻取的概念。

  比如,在销售分析中,当我们以产品类型和销售地区为维、以销售额为度量进行分析的时候,可能希望进一步观察某类产品的不同销售模式在各个销售地区的表现,这时我们就可以在产品大类这个数据维下面,再加上一个销售模式维,从而获得相应的信息。

  创建数据CUBE   那么,要满足上述运算,需要什么样的前提呢?   我们可以想像,和报表不同,OLAP分析所需的原始数据量是非常庞大的。

一个分析模型,往往会涉及数百万条、数千万条、甚至更多;而分析模型中包含多个维数据,这些维又可以由浏览者作任意的提取组合。

这样的结果就是大量的实时运算导致的时间延滞。

我们可以设想,一个对于1000万条记录的分析模型,如果一次提取4个维度进行组合分析,那么实际的运算次数将达到4的1000次方的数量:这样的运算量将导致数十分钟乃至更长的等待时间。

如果用户对维组合次序进行调整,或者增加减少某些维度的话,又将是一个重新的计算过程。

  从上面分析,我们可以得出结论,如果不能解决OLAP运算效率问题的话,OLAP将是一个毫无实用价值的概念。

那么,作为一个成熟产品是如何解决这个问题的呢?这就是OLAP中一个非常重要的技术:数据CUBE预运算。

  一个OLAP模型中,度量数据和维数据我们应该实现确定,一旦两者确定下来,那么我们可以对数据进行预先的处理,在正式发布之前,将数据根据维进行最大限度的聚类运算,运算中会考虑到各种维组合情况,运算结果将生成一个数据CUBE,并保存在服务器上。

这样,当最终用户在调阅这个分析模型的时候,就可以直接使用这个CUBE,在此基础上根据用户的维选择和维组合进行复运算,从而达到实时响应的这么一个效果。

  作为一个成熟的产品,Max@X Analyser无论是在CUBE创建还是后续的浏览操作,效率都是非常高的。

测试结果表明:原始数据行数在3200万条记录的时候,包含10个维数据组合、2个度量数据的CUBE,创建周期为132分钟,装载效率是12.5秒。

这样的成绩对比世界上任何一个高端OLAP同类产品,都不逊色。

(需要更为详细的测试报告,可以与炎鼎软件联系)。

  补充说明   上面所说的,是OLAP最基本的概念,除此以外,OLAP通常包括的功能包括数据旋转(变换观察维组合顺序)、数据切片(过滤无关数据,对指定数据进行重点观察),以及对数据进行跨行列运算(如Max@X Analyser中的增加行列差额、等比环比等扩展运算)。

  如果您希望了解更多关于OLAP的信息,请与炎鼎软件技术支持联系。

oltp和olap的异同

检举|2007-09-19 16:30OLTP即联机事务处理,就是我们经常说的关系数据库,意即记录即时的增、删、改、查,就是我们经常应用的东西,这是数据库的基础; OLAP即联机分析处理,是数据仓库的核心部心,所谓数据仓库是对于大量已经由OLTP形成的数据的一种分析型的数据库,用于处理商业智能、决策支持等重要的决策信息;数据仓库是在数据库应用到一定程序之后而对历史数据的加工与分析;是处理两种不同用途的工具而已。

盘点AoYoZhuJi傲游主机商8个数据中心常见方案及八折优惠

傲游主机商我们可能很多人并不陌生,实际上这个商家早年也就是个人主机商,传说是有几个个人投资创办的,不过能坚持到现在也算不错,毕竟有早年的用户积累正常情况上还是能延续的。如果是新服务商这几年确实不是特别容易,问到几个老牌的个人服务商很多都是早年的用户积累客户群。傲游主机目前有提供XEN和KVM架构的云服务器,不少还是亚洲CN2优化节点,目前数据中心包括中国香港、韩国、德国、荷兰和美国等多个地区的CN...

racknerd:美国大硬盘服务器(双路e5-2640v2/64g内存/256gSSD+160T SAS)$389/月

racknerd在促销美国洛杉矶multacom数据中心的一款大硬盘服务器,用来做存储、数据备份等是非常划算的,而且线路还是针对亚洲有特别优化处理的。双路e5+64G内存,配一个256G的SSD做系统盘,160T SAS做数据盘,200T流量每个月,1Gbps带宽,5个IPv4,这一切才389美元...洛杉矶大硬盘服务器CPU:2 * e5-2640v2内存:64G(可扩展至128G,+$64)硬...

香港服务器多少钱一个月?香港云服务器最便宜价格

香港服务器多少钱一个月?香港服务器租用配置价格一个月多少,现在很多中小型企业在建站时都会租用香港服务器,租用香港服务器可以使网站访问更流畅、稳定性更好,安全性会更高等等。香港服务器的租用和其他地区的服务器租用配置元素都是一样的,那么为什么香港服务器那么受欢迎呢,香港云服务器最便宜价格多少钱一个月呢?阿里云轻量应用服务器最便宜的是1核1G峰值带宽30Mbps,24元/月,288元/年。不过我们一般选...

olap为你推荐
破解网有什么可以破解wifi加密的密码初始化磁盘win7系统如何磁盘初始化?cs躲猫猫cs躲猫猫怎么联机 今天在一个视频上看到的,T可以变成地图上的一个物品CT是找,请问怎么和老外联机最好的视频播放器最好的视频播放器有哪些?实数的定义什么是实数?实数的概念是什么小蓝条我现在使用的是迅雷7、看空间的时候总会出现一个小蓝条写着下载,总是误点然后迅雷就弹出来了怎么解决?阶乘函数C语言编写一个求n阶乘的函数,在主函数中输入n,调用函数求n阶乘。。谢谢spinmaster会飞的小仙女玩具什么品牌协亨协亨,话机世界,迪信通哪个买手机更便宜?空间图片QQ空间图片
万网域名 vps安全设置 西部数码vps 域名解析文件 骨干网 siteground 好看的桌面背景图 天互数据 有奖调查 tna官网 南通服务器 百度云1t 卡巴斯基破解版 网游服务器 吉林铁通 新世界服务器 香港亚马逊 申请网站 starry 国外在线代理服务器 更多