数据仓库是什么各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

数据仓库是什么  时间:2021-09-27  阅读:()

数据仓库的主要特征

  • 面向主题: 传统数据库中,最大的特点是面向应用进行数据的组织,各个业务系统可能是相互分离的。

    而数据仓库则是面向主题的。

    主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合、归类并进行分析利用的抽象。

    在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。

  • 集成性: 通过对分散、独立、异构的数据库数据进行抽取、清理、转换和汇总便得到了数据仓库的数据,这样保证了数据仓库内的数据关于整个企业的一致性。

    数据仓库中的综合数据不能从原有的数据库系统直接得到。

    因此在数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:
  • 非易失性(不可更新性) 数据仓库的数据反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于这些快照进行统计、综合和重组的导出数据。

    数据非易失性主要是针对应用而言。

    数据仓库的用户对数据的操作大多是数据查询或比较复杂的挖掘,一旦数据进入数据仓库以后,一般情况下被较长时间保留。

    数据仓库中一般有大量的查询操作,但修改和删除操作很少。

    因此,数据经加工和集成进入数据仓库后是极少更新的,通常只需要定期的加载和更新。

  • 时变性 数据仓库包含各种粒度的历史数据。

    数据仓库中的数据可能与某个特定日期、星期、月份、季度或者年份有关。

    数据仓库的目的是通过分析企业过去一段时间业务的经营状况,挖掘其中隐藏的模式。

    虽然数据仓库的用户不能修改数据,但并不是说数据仓库的数据是永远不变的。

    分析的结果只能反映过去的情况,当业务变化后,挖掘出的模式会失去时效性。

    因此数据仓库的数据需要更新,以适应决策的需要。

    从这个角度讲,数据仓库建设是一个项目,更是一个过程。

    数据仓库的数据随时间的变化表现在以下几个方面: (1) 数据仓库的数据时限一般要远远长于操作型数据的数据时限。

    (2) 操作型系统存储的是当前数据,而数据仓库中的数据是历史数据。

    (3) 数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性。

    为什么企业需要数据仓库

    在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息。

    在以往的操作型数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决策要使用的信息。

    这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策和目标制定的作用甚微。

    但是信息技术资源和操作型数据库系统不能把这些数据转换为企业真正需要的决策信息。

    为什么呢?首先,企业数据分散在多种互不兼容的的结构和系统中,导致数据很难被整合成需要的决策信息;其次,战略决策所需的数据格式必须适合趋势分析,但操作型数据是由事件驱动的,不能直接反映趋势的变化;再次,对于战略决策来说,决策者必须从不同的商业角度观察数据,比如说产品、地区、客户群等不同方面观察数据,操作型数据不适合从不同的角度进行分析。

    提供战略决策信息需要大量的企业数据,能够以合适的格式存放并能快速检索。

    随着计算机技术的快速发展,存储成本迅速降低和计算能力大大提高,使建立数据仓库成为可能。

    数据仓库参照表是什么

    数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。

    数据仓库研究和解决从数据库中获取信息的问题。

    数据仓库的特征在于面向主题、集成性、稳定性和时变性。

    数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

    各位大神,数据仓库分层 DWD DWB DWS 分别是什么缩写啊

    DW :data warehouse 翻译成数据仓库 DW数据分层,由下到上为 DWD,DWB,DWS DWD:data warehouse detail 细节数据层,有的也称为 ODS层,是业务层与数据仓库的隔离层。

    DWB:data warehouse base 基础数据层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。

    DWS:data warehouse service 服务数据层,基于DWB上的基础数据,整合汇总成分析某一个主题域的服务数据,一般是宽表。

    扩展资料 数据仓库分层的原因 1、通过数据预处理提高效率,因为预处理,所以会存在冗余数据 2、如果不分层而业务系统的业务规则发生变化,就会影响整个数据清洗过程,工作量巨大 3、通过分层管理来实现分步完成工作,这样每一层的处理逻辑就简单了 标准的数据仓库分层:ods(临时存储层),pdw(数据仓库层),mid(数据集市层),app(应用层) 4、空间换时间。

    通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据。

    5、把复杂问题简单化。

    讲一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。

    而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。

    6、便于处理业务的变化。

    随着业务的变化,只需要调整底层的数据,对应用层对业务的调整零感知 参考资料搜狗百科-数据仓库
  • hostkey俄罗斯、荷兰GPU显卡服务器/免费Windows Server

    Hostkey.com成立于2007年的荷兰公司,主要运营服务器出租与托管,其次是VPS、域名、域名证书,各种软件授权等。hostkey当前运作荷兰阿姆斯特丹、俄罗斯莫斯科、美国纽约等数据中心。支持Paypal,信用卡,Webmoney,以及支付宝等付款方式。禁止VPN,代理,Tor,网络诈骗,儿童色情,Spam,网络扫描,俄罗斯色情,俄罗斯电影,俄罗斯MP3,俄罗斯Trackers,以及俄罗斯法...

    优林70/月,西南高防地区最低70/月

    优林怎么样?优林好不好?优林 是一家国人VPS主机商,成立于2016年,主营国内外服务器产品。云服务器基于hyper-v和kvm虚拟架构,国内速度还不错。今天优林给我们带来促销的是国内西南地区高防云服务器!全部是独享带宽!续费同价!官方网站:https://www.idc857.com​地区CPU内存硬盘流量带宽防御价格购买地址德阳高防4核4g50G无限流量10M100G70元/月点击购买德阳高防...

    VirMach(8元/月)KVM VPS,北美、欧洲

    VirMach,成立于2014年的美国IDC商家,知名的低价便宜VPS销售商,支持支付宝、微信、PayPal等方式付款购买,主打美国、欧洲暑假中心产品,拥有包括洛杉矶、西雅图、圣何塞、凤凰城在内的11个数据中心可以选择,可以自由搭配1Gbps、2Gbps、10Gbps带宽端口,有Voxility DDoS高防IP可以选择(500Gbps以上的防御能力),并且支持在控制面板付费切换机房和更换IP(带...

    数据仓库是什么为你推荐
    波粒高清监控系统进不了操作系统,开机只显示波粒百万高清,什么都看不到,求高手科达视频会议系统科达、中兴、华三、华为这几个视频会议哪个最好?l六间房六间房在什么城市直播云龙数码云龙电脑电子的业务是什么?怎么样?香港大陆香港是否连着大陆的?wap地带什么是cmwapm模式郑州网站托管郑州网店托管公司哪家好ganesha象神是什么宗教的华为h3c华为和华三区别?硬件视频会议系统硬件视频会议系统需要什么硬件?哪些厂家设备性价比高?
    免费域名跳转 softlayer 正版win8.1升级win10 php探针 新站长网 镇江联通宽带 福建天翼加速 个人域名 百兆独享 工信部icp备案号 赞助 东莞数据中心 phpmyadmin配置 谷歌台湾 金主 免费稳定空间 阿里云邮箱怎么注册 hosting24 西部数码主机 俄勒冈州 更多