数据仓库是什么各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

数据仓库是什么  时间:2021-09-27  阅读:()

数据仓库的主要特征

  • 面向主题: 传统数据库中,最大的特点是面向应用进行数据的组织,各个业务系统可能是相互分离的。

    而数据仓库则是面向主题的。

    主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合、归类并进行分析利用的抽象。

    在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。

  • 集成性: 通过对分散、独立、异构的数据库数据进行抽取、清理、转换和汇总便得到了数据仓库的数据,这样保证了数据仓库内的数据关于整个企业的一致性。

    数据仓库中的综合数据不能从原有的数据库系统直接得到。

    因此在数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:
  • 非易失性(不可更新性) 数据仓库的数据反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于这些快照进行统计、综合和重组的导出数据。

    数据非易失性主要是针对应用而言。

    数据仓库的用户对数据的操作大多是数据查询或比较复杂的挖掘,一旦数据进入数据仓库以后,一般情况下被较长时间保留。

    数据仓库中一般有大量的查询操作,但修改和删除操作很少。

    因此,数据经加工和集成进入数据仓库后是极少更新的,通常只需要定期的加载和更新。

  • 时变性 数据仓库包含各种粒度的历史数据。

    数据仓库中的数据可能与某个特定日期、星期、月份、季度或者年份有关。

    数据仓库的目的是通过分析企业过去一段时间业务的经营状况,挖掘其中隐藏的模式。

    虽然数据仓库的用户不能修改数据,但并不是说数据仓库的数据是永远不变的。

    分析的结果只能反映过去的情况,当业务变化后,挖掘出的模式会失去时效性。

    因此数据仓库的数据需要更新,以适应决策的需要。

    从这个角度讲,数据仓库建设是一个项目,更是一个过程。

    数据仓库的数据随时间的变化表现在以下几个方面: (1) 数据仓库的数据时限一般要远远长于操作型数据的数据时限。

    (2) 操作型系统存储的是当前数据,而数据仓库中的数据是历史数据。

    (3) 数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性。

    为什么企业需要数据仓库

    在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息。

    在以往的操作型数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决策要使用的信息。

    这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策和目标制定的作用甚微。

    但是信息技术资源和操作型数据库系统不能把这些数据转换为企业真正需要的决策信息。

    为什么呢?首先,企业数据分散在多种互不兼容的的结构和系统中,导致数据很难被整合成需要的决策信息;其次,战略决策所需的数据格式必须适合趋势分析,但操作型数据是由事件驱动的,不能直接反映趋势的变化;再次,对于战略决策来说,决策者必须从不同的商业角度观察数据,比如说产品、地区、客户群等不同方面观察数据,操作型数据不适合从不同的角度进行分析。

    提供战略决策信息需要大量的企业数据,能够以合适的格式存放并能快速检索。

    随着计算机技术的快速发展,存储成本迅速降低和计算能力大大提高,使建立数据仓库成为可能。

    数据仓库参照表是什么

    数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。

    数据仓库研究和解决从数据库中获取信息的问题。

    数据仓库的特征在于面向主题、集成性、稳定性和时变性。

    数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

    各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

    DW :data warehouse 翻译成数据仓库 DW数据分层,由下到上为 DWD,DWB,DWS DWD:data warehouse detail 细节数据层,有的也称为 ODS层,是业务层与数据仓库的隔离层。

    DWB:data warehouse base 基础数据层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。

    DWS:data warehouse service 服务数据层,基于DWB上的基础数据,整合汇总成分析某一个主题域的服务数据,一般是宽表。

    扩展资料 数据仓库分层的原因 1、通过数据预处理提高效率,因为预处理,所以会存在冗余数据 2、如果不分层而业务系统的业务规则发生变化,就会影响整个数据清洗过程,工作量巨大 3、通过分层管理来实现分步完成工作,这样每一层的处理逻辑就简单了 标准的数据仓库分层:ods(临时存储层),pdw(数据仓库层),mid(数据集市层),app(应用层) 4、空间换时间。

    通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据。

    5、把复杂问题简单化。

    讲一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。

    而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。

    6、便于处理业务的变化。

    随着业务的变化,只需要调整底层的数据,对应用层对业务的调整零感知 参考资料搜狗百科-数据仓库
  • bluehost32元/月,2核2G/20GB空间,独立ip,新一代VPS美国云主机!

    bluehost怎么样?bluehost推出新一代VPS美国云主机!前几天,BlueHost也推出了对应的周年庆活动,全场海外虚拟主机月付2.95美元起,年付送免费的域名和SSL证书,通过活动进入BlueHost中文官网,购买虚拟主机、云虚拟主机和独立服务器参与限时促销。今天,云服务器网(yuntue.com)小编给大家介绍的是新一代VPS美国云主机,美国SSD云主机,2核2G/20GB空间,独立...

    Virtono:€23.7/年,KVM-2GB/25GB/2TB/洛杉矶&达拉斯&纽约&罗马尼亚等

    Virtono最近推出了夏季促销活动,为月付、季付、半年付等提供9折优惠码,年付已直接5折,而且下单后在LET回复订单号还能获得双倍内存,不限制付款周期。这是一家成立于2014年的国外VPS主机商,提供VPS和服务器租用等产品,商家支持PayPal、信用卡、支付宝等国内外付款方式,可选数据中心包括罗马尼亚、美国洛杉矶、达拉斯、迈阿密、英国和德国等。下面列出几款VPS主机配置信息,请留意,下列配置中...

    小欢互联19元/月起, 即日起至10月底 美国CERA 促销活动 美国/香港八折

    小欢互联成立于2019年10月,主打海外高性价比云服务器、CDN和虚拟主机服务。近期上线了自营美国CERA机房高速VPS,进行促销活动,为客户奉上美国/香港八折优惠码:Xxc1mtLB优惠码适用于美国CERA一区/二区以及香港一区/二区优惠时间:即日起至10月底优惠码可无限次使用,且续费同价!官网:https://idc.xh-ws.com购买地址:美国CERA一区:https://idc.xh-...

    数据仓库是什么为你推荐
    信息系统等级测评什么是信息安全等级保护,评测标准??平顶山教务管理系统平顶山市第十三中学好吗?天津职业大学地址天津职业大学怎么样?l六间房6间房视频美女主播 小虎牙的真名叫什么?l六间房六间房在什么城市直播l六间房六间房秀场怎么赚钱建筑工地管理系统建筑工地管理系统、做账系统,怎么做工地的帐北京理工大学图书馆谁知道北京理工大学图书馆读者研究室怎么预定?postgresql安装怎么将postgresql安装目录bin加入到环境变量中的"path"变量中,具体点,谢谢静态代码检查用Eclipse提交代码前,对代码规范强制检查,不通过则无法提交代码到版本控制器(如Git等),怎么实现?
    免备案虚拟空间 贝锐花生壳域名 mediafire下载 42u机柜尺寸 监控宝 阿里云浏览器 免费测手机号 789电视剧 吉林铁通 net空间 湖南idc supercache privatetracker 蓝队云 accountsuspended restart linux命令vi vim命令 g6950 更多