数据仓库论文:河北网通基于数据仓库的帐务决策分析系统的设计与实现
【中文摘要】数据仓库技术是基于数学及统计学严谨逻辑思维的并达成“科学的判断、有效的行为”的一个工具。数据仓库技术也是一种达成“数据整合、知识管理”的有效手段。它从不同视角对企业经营各方面的信息进行精确分析准确判断为企业的决策者做岀正确的决策提供了重要的支撑。典型的数据仓库系统 比如:经营分析系统决策支持系统等等。也随着数据仓库系统带来的良好效果,各行各业的单位 已经能很好的接受“整合数据从数据中找知识运用数据知识、用数据说话”等新的关系到改良生产活动各环节、提高生产效率、发展生产力的理念。本文结合已有的数据仓库技术理论对河北网通的基于数据仓库的账务决策分析系统项目进行了设计与实施。提出了面向数据仓库的账务决策分析的体系结构及和关主题域,并根据 “从一个简明主题开始实施”的原则釆用自底向上的方法进行构建,首先建立部门数据集市实现区域自治,对相关部门的应用进行分类复制对每个数据集市进行数据重构逐步扩展到企业数据仓库
(EDW) 。重点工作是在账务主题域的数据集市构建过程中实现了客户、 账户、用户实体,帐单、欠费、存款、清单、产品、优惠实体等主题域信息根据不同分析需求实现不同汇总粒度的划分和数据的分割 实现了不同数据源数据的集成等,并针对收益分析构造了多维模型 基于此模型利用固定(预定义)报表、图表、即席查询(Ad-Hoc) 、
EIS (Executive Information System) 多维动态分析、数据挖掘等展现方式,从不同维度、不同粒度、多种视角形象直观地显示分析数据。重点对计费系统账单数据进行OLAP分析建立了面向计费系统的财务决策的数据集市。通过该项设计与实施探索出了一种将数据仓库技术与具体应用相结合的有效的方法以业务支撑系统的数据以及其他相关数据作为基础数据源采用科学的数据抽取、整理、存储等方法,挖掘数据内部蕴藏的大量有用信息通过科学的分析做出可信的预测从而为市场决策管理者和市场经营工作提供及时、准确、科学的辅助决策依据。本项应用为提高公司整体管理效率确定决策分析方向提供了数据依据。本文的经验可供其它数据仓库项实施借鉴研究成果经进一步完善和扩充可推广到与通信行业相关的各企业应用。
【英文摘要】 Datawarehouse technology is atool basedonrigorousmathematical and statistical logical thinking to reach “scientificjudgment and effective behavior, ” but also some efficient approachto ^data integration and knowledge management・ ” The technologyconducts accurate analysis and judgment from different perspectivesso as to provide keysupport for decision-making・ Typical datawarehousesystem includes business analysi s system, deci si on support system,etc・ With the good results displayed from data warehouse systems, theconcept has been well-accepted among organizations in various walksof life that data integration, data application and data speak” domatter in the process of production improvement, and help develop
productionefficiency. Combining the existing data warehouse theory, the paperdesigns and operates the data warehouse-based Hebei Netcom accountingdecision-analysis project, and further proposes the datawarehouse-oriented accounting dec i s i on-ana lysis system structureand related domain fields ・ The system is started^from a simpledomainland set up according to bottom—up approach. The department datamart i s first established to achieve regional autonomy and classifiedcopying of department applications, followed by datarestructure of data marts and further expansion into Enterprise DataWarehouse (EDW) . During the data mart building, the key task 1 ies inthe realization of domain information, including die nt, account, entity, bill, arrear, deposit, inventory, product and offered target・Analysis of various demand leads to different aggregate granulepartition lattice and data categorization, achieving the dataintegration from various sources・ Moreover, multi-dimension model isconstructed for benefit analysis・ By using fixed (predefined) reports,charts, ad hoc query (Ad-Hoc) , EIS (Executive Information System) ,multi-dimensional dynamic analysis, data mining and other displayingmethods, the model achieves the visual data demonstration and analysisfrom different dimensions, granule sizes and perspectives・ The billingdata is especially focused on for OLAP analysi s so as to establish
a data mart for financial decision-making in billing system .Bydesigning and implementing the project, an effective approach has beenexplored to combine data warehouse technology and specificapplications・ Taking data from operation-supportive system and otherrelevant systems as the underlying data source, the approach employsscientific data extraction, collation and storage methods to dig outa lot of useful infonnation, and makes reliable predictions afterscientific analysis, serving as timely, accurate and reasonablesupport for decision-making and market operation. The appli cation ofthe project provi des data support for companies to improve overallmanagement efficiency and determine direction of decisions・ Theexperience of the paper could serve as experiment for other datawarehouse projects and be applied to telecommunication-relatedenterprises after further perfection and expansion・
【关键词】数据仓库数据集市OLAP粒度划分EDW
【英文关键词】 Data warehouse data mart OLAP
【目录】河北网通基于数据仓库的帐务决策分析系统的设计与实现摘要4-5 ABSTRACT 5~6第一章引言
10-14 1. 1研究背景和意义10-11 1.2河北网通数据管理的现状11-12 1. 3本文主要研究内容12-13 1.4论文组织结构13-14第二章相关理论知识与技术
14-20 2. 1什么是数据仓库14 2. 2操作型数据库与数据仓库的区别14-15 2. 3创建数据仓库的意义15 2.4建立数据仓库的基本步骤15-16 2. 5数据集市、 OLAP与数据挖掘16-19 2. 5. 1数据集市的概念16-17 2. 5.2数据集市的模型17 2. 5. 3元数据管理17-18 2. 5. 4 OLAP
联机分析处理 18-19 2. 5. 5数据挖掘19 2.6本章小结19-20第三章需求分析与总体设计20-30 3. 1数据仓库的体系结构20-21 3・2数据仓库的总体设计
21-22 3. 3数据仓库的具体设计过程22-26 3. 3. 1主题域的确定22-23 3. 3.2粒度的划分23-24 3. 3. 3数据分割24 3. 3. 4数据仓库模式设计24 3. 3. 5创建数据仓库表和数据准备区24-25 3. 3.6析取、清理和转换数据
25 3. 3. 7数据装入数据仓库25 3. 3. 8建立分析应用
25-26 3. 4数据仓库的开发过程26-29 3・4. 1任务和环境的评估26 3.4.2需求的收集和分析26-27 3.4.3构造数据仓库27 3.4.4创建多维数据集27-28 3.4.5
建立分析应用28 3. 4.6数据仓库技术的培训28 3.4.7回顾、总结及再发展28-29 3. 5本章小结29-30第四章
详细设计与实现30-46 4. 1基于数据仓库的账务决策分析系统的设计 30-35 4. 1. 1体系结构与设计流程
30-31 4. 1. 2确定系统需求31-32 4. 1. 3已有的工作基础32 4. 1.4确定数据库服务器和数据分析工具
32-33 4. 1. 5确定主耍的主题域33-34 4. 1. 6确定基于数据仓库的账务决策分析的数据组织方法34 4. 1. 7确定基于数据仓库的账务决策分析的分析方法34 4. 1.8确定基于数据仓库的账务决策分析的数据展现方法34-35 4.2血向计费系统账务决策的数据集市的设计及实施35-45 4. 2. 1设计目标的确定35-37 4. 2. 2确定粒度层次划分37 4. 2. 3确定数据分割策略37-38 4.2.4数据结构的定义
38-41 4.2. 5数据的获取41-45 4. 3本章小结
45-46 第五章实验与分析46-60 5. 1实现数据集市的多维分析展现46-58 5. 1. 1多维处理功能46-47 5. 1. 2多维处理功能的主要具体应用47-49 5. 1. 3不同管理层面展现内容49-58 5.2测试实例58-59 5. 3实施结果的分析59 5. 4本卓小结59-60 笫八卓结论与展望
60-62 6. 1数据仓库设计和实现中方法总结60-61 6.2项目实施的经验总结61-62致谢62-63 参考文献
63-65
HostKvm也发布了开年促销方案,针对香港国际和美国洛杉矶两个机房的VPS主机提供7折优惠码,其他机房业务提供8折优惠码。商家成立于2013年,提供基于KVM架构的VPS主机,可选数据中心包括日本、新加坡、韩国、美国、中国香港等多个地区机房,均为国内直连或优化线路,延迟较低,适合建站或者远程办公等。下面列出几款主机配置信息。美国洛杉矶套餐:美国 US-Plan1CPU:1core内存:2GB硬盘...
SpinServers服务商也不算是老牌的服务商,商家看介绍是是2018年成立的主机品牌,隶属于Majestic Hosting Solutions LLC旗下。商家主要经营独立服务器租用和Hybrid Dedicated服务器等,目前包含的数据中心在美国达拉斯、圣何塞机房,自有硬件和IP资源等,商家还自定义支持用户IP广播到机房。看到SpinServers推出了美国独服的夏季优惠促销活动,最低月...
Hostiger商家我们可能以前也是有见过的,以前他们的域名是Hostigger,后来进行微调后包装成现在的。而且推出Columbus Day哥伦布日优惠活动,提供全场的VPS主机首月7折月付2.79美元起的优惠。这里我们普及一下基础知识,Columbus Day ,即为每年10月12日,是一些美洲国家的节日,纪念克里斯托弗·哥伦布在北美登陆,为美国的联邦假日。Hostiger 商家是一个成立于2...