数据仓库是什么各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

数据仓库是什么  时间:2021-09-27  阅读:()

数据仓库的主要特征

  • 面向主题: 传统数据库中,最大的特点是面向应用进行数据的组织,各个业务系统可能是相互分离的。

    而数据仓库则是面向主题的。

    主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合、归类并进行分析利用的抽象。

    在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。

  • 集成性: 通过对分散、独立、异构的数据库数据进行抽取、清理、转换和汇总便得到了数据仓库的数据,这样保证了数据仓库内的数据关于整个企业的一致性。

    数据仓库中的综合数据不能从原有的数据库系统直接得到。

    因此在数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:
  • 非易失性(不可更新性) 数据仓库的数据反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于这些快照进行统计、综合和重组的导出数据。

    数据非易失性主要是针对应用而言。

    数据仓库的用户对数据的操作大多是数据查询或比较复杂的挖掘,一旦数据进入数据仓库以后,一般情况下被较长时间保留。

    数据仓库中一般有大量的查询操作,但修改和删除操作很少。

    因此,数据经加工和集成进入数据仓库后是极少更新的,通常只需要定期的加载和更新。

  • 时变性 数据仓库包含各种粒度的历史数据。

    数据仓库中的数据可能与某个特定日期、星期、月份、季度或者年份有关。

    数据仓库的目的是通过分析企业过去一段时间业务的经营状况,挖掘其中隐藏的模式。

    虽然数据仓库的用户不能修改数据,但并不是说数据仓库的数据是永远不变的。

    分析的结果只能反映过去的情况,当业务变化后,挖掘出的模式会失去时效性。

    因此数据仓库的数据需要更新,以适应决策的需要。

    从这个角度讲,数据仓库建设是一个项目,更是一个过程。

    数据仓库的数据随时间的变化表现在以下几个方面: (1) 数据仓库的数据时限一般要远远长于操作型数据的数据时限。

    (2) 操作型系统存储的是当前数据,而数据仓库中的数据是历史数据。

    (3) 数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性。

    为什么企业需要数据仓库

    在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息。

    在以往的操作型数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决策要使用的信息。

    这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策和目标制定的作用甚微。

    但是信息技术资源和操作型数据库系统不能把这些数据转换为企业真正需要的决策信息。

    为什么呢?首先,企业数据分散在多种互不兼容的的结构和系统中,导致数据很难被整合成需要的决策信息;其次,战略决策所需的数据格式必须适合趋势分析,但操作型数据是由事件驱动的,不能直接反映趋势的变化;再次,对于战略决策来说,决策者必须从不同的商业角度观察数据,比如说产品、地区、客户群等不同方面观察数据,操作型数据不适合从不同的角度进行分析。

    提供战略决策信息需要大量的企业数据,能够以合适的格式存放并能快速检索。

    随着计算机技术的快速发展,存储成本迅速降低和计算能力大大提高,使建立数据仓库成为可能。

    数据仓库参照表是什么

    数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。

    数据仓库研究和解决从数据库中获取信息的问题。

    数据仓库的特征在于面向主题、集成性、稳定性和时变性。

    数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

    各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

    DW :data warehouse 翻译成数据仓库 DW数据分层,由下到上为 DWD,DWB,DWS DWD:data warehouse detail 细节数据层,有的也称为 ODS层,是业务层与数据仓库的隔离层。

    DWB:data warehouse base 基础数据层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。

    DWS:data warehouse service 服务数据层,基于DWB上的基础数据,整合汇总成分析某一个主题域的服务数据,一般是宽表。

    扩展资料 数据仓库分层的原因 1、通过数据预处理提高效率,因为预处理,所以会存在冗余数据 2、如果不分层而业务系统的业务规则发生变化,就会影响整个数据清洗过程,工作量巨大 3、通过分层管理来实现分步完成工作,这样每一层的处理逻辑就简单了 标准的数据仓库分层:ods(临时存储层),pdw(数据仓库层),mid(数据集市层),app(应用层) 4、空间换时间。

    通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据。

    5、把复杂问题简单化。

    讲一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。

    而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。

    6、便于处理业务的变化。

    随着业务的变化,只需要调整底层的数据,对应用层对业务的调整零感知 参考资料搜狗百科-数据仓库
  • 选择Vultr VPS主机不支持支付宝付款的解决方案

    在刚才更新Vultr 新年福利文章的时候突然想到前几天有网友问到自己有在Vultr 注册账户的时候无法用支付宝付款的问题,当时有帮助他给予解决,这里正好顺带一并介绍整理出来。毕竟对于来说,虽然使用的服务器不多,但是至少是见过世面的,大大小小商家的一些特性特征还是比较清楚的。在这篇文章中,和大家分享如果我们有在Vultr新注册账户或者充值购买云服务器的时候,不支持支付宝付款的原因。毕竟我们是知道的,...

    LOCVPS(29.6元/月)KVM架构 香港/美国机房全场8折

    LOCVPS商家我们还是比较熟悉的老牌的国内服务商,包括他们还有其他的产品品牌。这不看到商家的信息,有新增KVM架构轻量/迷你套餐,提供的机房包括香港云地和美国洛杉矶,适用全场8折优惠,月付29.6元起。LOCVPS是一家成立于2011年的稳定老牌国人商家,主要从事XEN、KVM架构的国外VPS销售,主推洛杉矶MC、洛杉矶C3、香港邦联、香港沙田电信、香港大埔、日本东京、日本大阪、新加坡等数据中心...

    CloudCone中国春节优惠活动限定指定注册时间年付VPS主机$13.5

    CloudCone 商家产品还是比较有特点的,支持随时的删除机器按时间计费模式,类似什么熟悉的Vultr、Linode、DO等服务商,但是也有不足之处就在于机房太少。商家的活动也是经常有的,比如这次中国春节期间商家也是有提供活动,比如有限定指定时间段之前注册的用户可以享受年付优惠VPS主机,比如年付13.5美元。1、CloudCone新年礼物限定款仅限2019年注册优惠购买,活动开始时间:1月31...

    数据仓库是什么为你推荐
    十进制转换成二进制如何把十进制转化为二进制陕西理工学院地址陕西理工学院邮编是多少南区的手机软件开发教程自学软件开发教程湘潭手机湘潭联想手机哪里有买?声源定位大脑皮层,大脑,小脑,脑干分别有什么作用?深圳erp深圳地区在手机方案行业做得好的ERP公司有哪些?无线监控方案无线监控系统的设计方案及技术要求北方民族大学地址北方民族学校好吗?具体位置在宁夏哪?是几本啊?例外招聘银行校园招聘和合同制柜员有什么区别?l六间房六间房在什么城市直播
    什么是虚拟主机 韩国虚拟主机 域名抢注 域名系统 新网域名解析 韩国加速器 国外私服 服务器cpu性能排行 512m内存 云鼎网络 福建天翼加速 中国电信测速112 域名转向 七夕促销 免费全能主机 福建铁通 搜索引擎提交入口 申请免费空间和域名 宏讯 789 更多