数据仓库是什么各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

数据仓库是什么  时间:2021-09-27  阅读:()

数据仓库的主要特征

  • 面向主题: 传统数据库中,最大的特点是面向应用进行数据的组织,各个业务系统可能是相互分离的。

    而数据仓库则是面向主题的。

    主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合、归类并进行分析利用的抽象。

    在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。

  • 集成性: 通过对分散、独立、异构的数据库数据进行抽取、清理、转换和汇总便得到了数据仓库的数据,这样保证了数据仓库内的数据关于整个企业的一致性。

    数据仓库中的综合数据不能从原有的数据库系统直接得到。

    因此在数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:
  • 非易失性(不可更新性) 数据仓库的数据反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于这些快照进行统计、综合和重组的导出数据。

    数据非易失性主要是针对应用而言。

    数据仓库的用户对数据的操作大多是数据查询或比较复杂的挖掘,一旦数据进入数据仓库以后,一般情况下被较长时间保留。

    数据仓库中一般有大量的查询操作,但修改和删除操作很少。

    因此,数据经加工和集成进入数据仓库后是极少更新的,通常只需要定期的加载和更新。

  • 时变性 数据仓库包含各种粒度的历史数据。

    数据仓库中的数据可能与某个特定日期、星期、月份、季度或者年份有关。

    数据仓库的目的是通过分析企业过去一段时间业务的经营状况,挖掘其中隐藏的模式。

    虽然数据仓库的用户不能修改数据,但并不是说数据仓库的数据是永远不变的。

    分析的结果只能反映过去的情况,当业务变化后,挖掘出的模式会失去时效性。

    因此数据仓库的数据需要更新,以适应决策的需要。

    从这个角度讲,数据仓库建设是一个项目,更是一个过程。

    数据仓库的数据随时间的变化表现在以下几个方面: (1) 数据仓库的数据时限一般要远远长于操作型数据的数据时限。

    (2) 操作型系统存储的是当前数据,而数据仓库中的数据是历史数据。

    (3) 数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性。

    为什么企业需要数据仓库

    在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息。

    在以往的操作型数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决策要使用的信息。

    这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策和目标制定的作用甚微。

    但是信息技术资源和操作型数据库系统不能把这些数据转换为企业真正需要的决策信息。

    为什么呢?首先,企业数据分散在多种互不兼容的的结构和系统中,导致数据很难被整合成需要的决策信息;其次,战略决策所需的数据格式必须适合趋势分析,但操作型数据是由事件驱动的,不能直接反映趋势的变化;再次,对于战略决策来说,决策者必须从不同的商业角度观察数据,比如说产品、地区、客户群等不同方面观察数据,操作型数据不适合从不同的角度进行分析。

    提供战略决策信息需要大量的企业数据,能够以合适的格式存放并能快速检索。

    随着计算机技术的快速发展,存储成本迅速降低和计算能力大大提高,使建立数据仓库成为可能。

    数据仓库参照表是什么

    数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。

    数据仓库研究和解决从数据库中获取信息的问题。

    数据仓库的特征在于面向主题、集成性、稳定性和时变性。

    数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

    各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

    DW :data warehouse 翻译成数据仓库 DW数据分层,由下到上为 DWD,DWB,DWS DWD:data warehouse detail 细节数据层,有的也称为 ODS层,是业务层与数据仓库的隔离层。

    DWB:data warehouse base 基础数据层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。

    DWS:data warehouse service 服务数据层,基于DWB上的基础数据,整合汇总成分析某一个主题域的服务数据,一般是宽表。

    扩展资料 数据仓库分层的原因 1、通过数据预处理提高效率,因为预处理,所以会存在冗余数据 2、如果不分层而业务系统的业务规则发生变化,就会影响整个数据清洗过程,工作量巨大 3、通过分层管理来实现分步完成工作,这样每一层的处理逻辑就简单了 标准的数据仓库分层:ods(临时存储层),pdw(数据仓库层),mid(数据集市层),app(应用层) 4、空间换时间。

    通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据。

    5、把复杂问题简单化。

    讲一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。

    而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。

    6、便于处理业务的变化。

    随着业务的变化,只需要调整底层的数据,对应用层对业务的调整零感知 参考资料搜狗百科-数据仓库
  • 41云,服务器8折优惠券,200G TCP防御

    41云怎么样?41云是国人主机品牌,目前经营产品有国内外云服务器、CDN(高防CDN)和物理机,其中国内外云服务器又细分小类有香港限流量VPS、香港大带宽VPS、香港弹性自选VPS、香港不限流VPS、香港BGP线路VPS、香港Cera+大带宽机器、美国超防VPS、韩国原生VPS、仁川原生VPS、日本CN2 VPS、枣庄高防VPS和金华高防VPS;物理机有美国Cera服务器、香港单程CN2服务器、香...

    优林70/月,西南高防地区最低70/月

    优林怎么样?优林好不好?优林 是一家国人VPS主机商,成立于2016年,主营国内外服务器产品。云服务器基于hyper-v和kvm虚拟架构,国内速度还不错。今天优林给我们带来促销的是国内西南地区高防云服务器!全部是独享带宽!续费同价!官方网站:https://www.idc857.com​地区CPU内存硬盘流量带宽防御价格购买地址德阳高防4核4g50G无限流量10M100G70元/月点击购买德阳高防...

    德阳电信高防物理机 16核16G 50M 260元/月 达州创梦网络

    达州创梦网络怎么样,达州创梦网络公司位于四川省达州市,属于四川本地企业,资质齐全,IDC/ISP均有,从创梦网络这边租的服务器均可以备案,属于一手资源,高防机柜、大带宽、高防IP业务,一手整C IP段,四川电信,一手四川托管服务商,成都优化线路,机柜租用、服务器云服务器租用,适合建站做游戏,不须要在套CDN,全国访问快,直连省骨干,大网封UDP,无视UDP攻击,机房集群高达1.2TB,单机可提供1...

    数据仓库是什么为你推荐
    深圳erp请问深圳值得信赖的ERP公司都要哪些?产品涨价通知提价通知怎么写数据挖掘的应用国内基于数据挖掘技术的互联网应用有哪些呢?充电宝摄像机我有一个大功率充电宝,只买一个无线摄像头行吗平顶山教务管理系统平顶山市第十三中学好吗?平顶山教务管理系统平顶山工业职业技术学院怎么查分湖北教育电视台直播在线观看湖北电视台争分夺秒视频,湖北电视台网上在线直播观看,湖北电视台网站?wap地带什么是cmwapm模式wosignoscp 是什么证书三江学院图书馆收藏 柯平 《信息素养与信息检索概论》图书馆有几家
    重庆虚拟主机 播放vps上的视频 域名服务器是什么 中国万网虚拟主机 老鹰主机 美国主机推荐 mach 网络星期一 godaddy parseerror 魔兽世界台湾服务器 hostloc 免费cdn 购买国外空间 登陆空间 架设邮件服务器 数据库空间 摩尔庄园注册 weblogic部署 主机托管 更多