数据仓库是什么各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

数据仓库是什么  时间:2021-09-27  阅读:()

数据仓库的主要特征

  • 面向主题: 传统数据库中,最大的特点是面向应用进行数据的组织,各个业务系统可能是相互分离的。

    而数据仓库则是面向主题的。

    主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合、归类并进行分析利用的抽象。

    在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。

  • 集成性: 通过对分散、独立、异构的数据库数据进行抽取、清理、转换和汇总便得到了数据仓库的数据,这样保证了数据仓库内的数据关于整个企业的一致性。

    数据仓库中的综合数据不能从原有的数据库系统直接得到。

    因此在数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:
  • 非易失性(不可更新性) 数据仓库的数据反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于这些快照进行统计、综合和重组的导出数据。

    数据非易失性主要是针对应用而言。

    数据仓库的用户对数据的操作大多是数据查询或比较复杂的挖掘,一旦数据进入数据仓库以后,一般情况下被较长时间保留。

    数据仓库中一般有大量的查询操作,但修改和删除操作很少。

    因此,数据经加工和集成进入数据仓库后是极少更新的,通常只需要定期的加载和更新。

  • 时变性 数据仓库包含各种粒度的历史数据。

    数据仓库中的数据可能与某个特定日期、星期、月份、季度或者年份有关。

    数据仓库的目的是通过分析企业过去一段时间业务的经营状况,挖掘其中隐藏的模式。

    虽然数据仓库的用户不能修改数据,但并不是说数据仓库的数据是永远不变的。

    分析的结果只能反映过去的情况,当业务变化后,挖掘出的模式会失去时效性。

    因此数据仓库的数据需要更新,以适应决策的需要。

    从这个角度讲,数据仓库建设是一个项目,更是一个过程。

    数据仓库的数据随时间的变化表现在以下几个方面: (1) 数据仓库的数据时限一般要远远长于操作型数据的数据时限。

    (2) 操作型系统存储的是当前数据,而数据仓库中的数据是历史数据。

    (3) 数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性。

    为什么企业需要数据仓库

    在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息。

    在以往的操作型数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决策要使用的信息。

    这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策和目标制定的作用甚微。

    但是信息技术资源和操作型数据库系统不能把这些数据转换为企业真正需要的决策信息。

    为什么呢?首先,企业数据分散在多种互不兼容的的结构和系统中,导致数据很难被整合成需要的决策信息;其次,战略决策所需的数据格式必须适合趋势分析,但操作型数据是由事件驱动的,不能直接反映趋势的变化;再次,对于战略决策来说,决策者必须从不同的商业角度观察数据,比如说产品、地区、客户群等不同方面观察数据,操作型数据不适合从不同的角度进行分析。

    提供战略决策信息需要大量的企业数据,能够以合适的格式存放并能快速检索。

    随着计算机技术的快速发展,存储成本迅速降低和计算能力大大提高,使建立数据仓库成为可能。

    数据仓库参照表是什么

    数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。

    数据仓库研究和解决从数据库中获取信息的问题。

    数据仓库的特征在于面向主题、集成性、稳定性和时变性。

    数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

    各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

    DW :data warehouse 翻译成数据仓库 DW数据分层,由下到上为 DWD,DWB,DWS DWD:data warehouse detail 细节数据层,有的也称为 ODS层,是业务层与数据仓库的隔离层。

    DWB:data warehouse base 基础数据层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。

    DWS:data warehouse service 服务数据层,基于DWB上的基础数据,整合汇总成分析某一个主题域的服务数据,一般是宽表。

    扩展资料 数据仓库分层的原因 1、通过数据预处理提高效率,因为预处理,所以会存在冗余数据 2、如果不分层而业务系统的业务规则发生变化,就会影响整个数据清洗过程,工作量巨大 3、通过分层管理来实现分步完成工作,这样每一层的处理逻辑就简单了 标准的数据仓库分层:ods(临时存储层),pdw(数据仓库层),mid(数据集市层),app(应用层) 4、空间换时间。

    通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据。

    5、把复杂问题简单化。

    讲一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。

    而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。

    6、便于处理业务的变化。

    随着业务的变化,只需要调整底层的数据,对应用层对业务的调整零感知 参考资料搜狗百科-数据仓库
  • HostYun 新增美国三网CN2 GIA VPS主机 采用美国原生IP低至月15元

    在之前几个月中也有陆续提到两次HostYun主机商,这个商家前身是我们可能有些网友熟悉的主机分享团队的,后来改名称的。目前这个品牌主营低价便宜VPS主机,这次有可以看到推出廉价版本的美国CN2 GIA VPS主机,月费地址15元,适合有需要入门级且需要便宜的用户。第一、廉价版美国CN2 GIA VPS主机方案我们可看到这个类型的VPS目前三网都走CN2 GIA网络,而且是原生IP。根据信息可能后续...

    BuyVM商家4个机房的官方测试IP地址和测速文件

    BuyVM 商家算是有一些年头,从早年提供低价便宜VPS主机深受广大网友抢购且也遭到吐槽的是因为审核账户太过于严格。毕竟我们国内的个人注册账户喜欢账户资料乱写,毕竟我们看英文信息有些还是比较难以识别的,于是就注册信息的时候随便打一些字符,这些是不能通过的。前几天,我们可以看到BUYVM商家有新增加迈阿密机房,而且商家有提供大硬盘且不限制流量的VPS主机,深受有一些网友的喜欢。目前,BUYVM商家有...

    ShockHosting日本机房VPS测试点评

    这个月11号ShockHosting发了个新上日本东京机房的邮件,并且表示其他机房可以申请转移到日本,刚好赵容手里有个美国的也没数据就发工单申请新开了一个,这里做个简单的测试,方便大家参考。ShockHosting成立于2013年,目前提供的VPS主机可以选择11个数据中心,包括美国洛杉矶、芝加哥、达拉斯、杰克逊维尔、新泽西、澳大利亚、新加坡、日本、荷兰和英国等。官方网站:https://shoc...

    数据仓库是什么为你推荐
    医药管理系统急!!!千方百剂医药管理系统 怎么删除已单据过账的入库明细视频转换精灵格式工厂和视频转换精灵比较400电话会议收费电话会议如何收费?手机软件开发教程自学软件开发教程计算机网络安全试题计算机等级考试1.2.3.4级分别考什么内容啊新中大软件我公司准备上一套财务软件,新中大的财务软件怎么样啊?oa地址请问中粮的OA系统地址是什么?杭州工作室杭州那么多工作室,怎么挑选呢?是影楼好还是工作室好?超声波探测超声波探伤方法和探伤标准会议管理平台会议推广用什么软件好
    国外域名 济南域名注册 花生壳免费域名申请 3322动态域名 国外空间服务商 警告本网站 免费ddos防火墙 国内php空间 ibox官网 南通服务器 爱奇艺vip免费试用7天 免费申请个人网站 福建铁通 太原网通测速平台 联通网站 双线asp空间 smtp服务器地址 永久免费空间 阿里云邮箱登陆地址 机柜尺寸 更多