引 言
目前,各个行业都面临着激烈的竞争,及时、准确的决策已成为企业生存与发展的生命线。随着信息技术在企业中的普遍应用,企业产生了大量富有价值的电子数据。但这些数据大都存储于不同的系统中,数据的定义和格式也不统一,商务智能系统能从不同的数据源搜集的数据中提取有用的数据,并对这些数据进行清洗、转换、重构等操作后存入数据仓库或数据集市中;再运用适合的查询分析工具、数据挖掘工具、联机分析处理(OLAP)工具等管理分析工具对信息进行处理,使信息变为辅助决策的知识, 并以适当的方式呈现在决策者面前,供决策者运筹帷幄。
1 商务智能(BI)简介
1.1 商务智能的概念
商务智能(Business Intelligence,BI)的定义众说纷纭。 Gartner Group 认为“商务智能是将数据转换成信息的过程, 然后通过发现将信息转化为知识”;商务智能大师利奥托德认为“商务智能是将存储于各种商业信息系统中的数据转换成有用信息的技术,它允许用户查询和分析数据库,可以得出影响商业活动的关键因素, 最终帮助用户做出更好更合理的决策”。
1.2 商务智能系统的主要技术
美国数据仓库研究院把商务智能比作 “数据炼油厂”,它将商务智能的应用过程描述为“数据-信息-知识-计划-行动”的过程。 由商务智能系统的基本架构可以看出, 商务智能的实现涉及到软件、硬件、咨询服务及应用等方面,其基本技术包括数据仓库、联机分析和数据挖掘 3 个部分。
2 联机分析处理(OLAP)概述
联机分析处理(OLAP)的概念最早是由关系数据库之父 E.F.Codd 于 1993 年提出的:OLAP 是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP 的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,是多维数据分析工具的集合。OLAP提供了在不同的数据子集和不同的抽象层数据上进行上卷、下钻、切片、切块、旋转等多维分析操作,提高了数据分析的能力和数据显示的灵活性。
3 OLAP 在商务智能系统中的应用
作为商务智能系统的关键技术,OLAP 可以在使用多维数据模型的数据仓库或数据集市上进行,充分发挥 OLAP 的联机分析的功能和特性。 将OLAP 与数据挖掘进行结合,能够为数据挖掘提供基础数据支持,提高数据挖掘的效率,而且还可以实现联机分析数据挖掘的功能。用户常常希望穿越数据库,选择相关数据,在不同的粒度上进行分析,并以不同的形式显示结果。联机分析数据挖掘提供了在不同的数据子集和不同的抽象层上进行数据挖掘的工具,在数据立方体和挖掘的中间结果数据上进行下钻、上卷、旋转、切片、切块等操作,提高数据挖掘探测性的数据分析能力和灵活性。
3.1 OLAP 数据库设计
进行 OLAP 分析首先要根据分析主题选取分析的维度,设计 OLAP 数据库模型。OLAP 数据库的实现主要有 3 种方式:一是 MOLAP(基于多维数据库的 OLAP),它是建立专有的多维数据库来存储 OLAP 所分析的数据,性能好、响应速度快,支持计算复杂的跨维计算和多用户的读写操作计算;二是 ROLAP(基于关系型数据库 OLAP),它是利用现有的关系数据库技术通过建立中间表来模拟多维数据, 通过 SQL 实现详细数据与概要数据的存储;三是 HOLAP,它将 ROLAP 和 MOLAP 的功能结合在一起,增强了数据库的适应性。
在中国, 大多数企业的数据都是采用关系型数据库的方式进行存储的, 并且存在着格式不统一,存储不集中等多种弊病。 在企业商务智能系统建设的过程中,无法抛弃以往的数据重新构建,只能对其进行优化处理。 首先将原始数据 ADB 通过应用抽取、清洗、转换、加载等数据仓库技术建立企业级的数据仓库 LDB(基于关系数据库);然后根据部门或分析主题的要求, 创建部门级和主题级数据集市 RDB(ROLAP);最后在数据集市的基础上创建多维立方体数据模型进行多维分析和预测(MOLAP)。 常规的分析、汇总等工作只需在数据集市中进行, 而决策分析和支持工作在多维立方体中进行实现。 基于以上分析,在本系统的设计上采用了 HOLAP 的设计方式对数据进行管理,数据库总体架构如图 1 所示。
图1.OLAP总体架构
ROLAP(RDB)的设计一般采用星型模型或雪花模型来表达设计结果。 本文以数据集市中产品库存变动为例, 分析表明宜采用雪花模型进行设计。 通过包含主题的事实表(存货异动事实表)和 3个包含事实的维度表(产品维表 comProduct,仓库维表 comWarehouse,产品记录维表 comProdrec)来支持各种复杂的查询和决策分析。 产品维度事实表向外连接了产品类型类别表 comProductClass,产品记录维度事实表向外连接了产品批号类别表comProdBatch, 类别表是对事实表进行详细的描述,通过这种方式可以缩小事实表,提高查询的效率。建立的库存变动主题雪花模型如图 2 所示。
图2.库存变动主题雪花模型
图 2 中, 事实表存货异动与维表 comProduct,comWarehouse,comProdrec 通 过 各 维 表 的 主 键(ProdId 产品代码 、WarehouseId 仓库代码 、BillNo表单记录号、RecNo 产品记录号、Flag) 建立关联,维表再通过各自的外键与详细类别表建立关联,构成雪花模型。 这个模型的基本分析维有 3 个:时间维、产品维和仓库维;维层次分别为时间维(年,季度,月),产品维(产品类别,产品编号),仓库维(仓库编号);分析度量值则定为各种变动数量(入库数量、在库数量、出库数量等)。
以确定的维度为基础,创建多维立方体。 将事实表中的 BillDate 字段进行提取分析得到时间维数据 (以年季月进行三级分割, 提供三级数据钻取),以 ClassID 字段为基础进行下钻操作,提供产品维数据, 用 WareID 字段来提供仓库维数据,度量值分别由 BuyInAmount,AdjustAmount 和SaleOutAmount 三个字段值来提供,并根据各维度和度量值创建多维立方体。
3.2 OLAP 多维数据分析
建立好了多维立方体, 就可以对立方体进行多维数据分析。 OLAP 基本的分析操作包括切片、切块、旋转、钻取等。 以度量值为 AdjustAmount 为例组织起来的三维立方体数组表示为(时间、产品类型、仓库、在库数量)。切片: 切片操作在给定的数据立方体的一个维上进行选择,形成一个子方。 例如在仓库维上选择一个维成员, 就得到了在仓库维上的一个关于时间和产品类型的切片; 在产品类型维上选定一个维成员,就得到一个关于时间和仓库的切片。
切块: 切块操作在给定的数据立方体的某一个维上选定某一区间的维成员或在二个维或多个维上分别选取一个区间的维成员形成的一个子方。 例如在仓库维上选择维成员“02”,同时在时间维上选择 2005 年的 4 个季度,就可得到一个数据切块,如图 3 所示。
图3.三维数据切块
钻取:钻取有向上钻取(上卷 roll-up)和向下钻取(下钻 drill-down)操作。 上卷操作就是通过一个维的概念分层向上攀升,在数据立方体上进行聚集;下钻是上卷的逆操作,通过沿维的概念分层向下从而得到更详细的数据,钻取的深度与维所划分的层次相对应。 以在产品类型维上执行下钻操作为例,获得更详细的信息如图 4 所示。
图4.三维数据下钻
旋转:旋转是一种目视操作,通过旋转可以得到不同视角的数据,提供数据的替代表示。 旋转包含了交换行和列, 或者把某一行维移动到列维中去,或是把页面显示中的一个维和页面外的维进行交换,令其成为新的行或列中的一个。
通过以上各种操作, 增强了数据的透明度和可读性, 帮助用户从不同的角度和深度去理解和分析数据, 方便用户从大量数据中获取有用的信息,穿越数据迷雾。
4 结束语
本文对 OLAP 在商务智能系统中进行多维分析所涉及的多维数据结构进行了设计, 并将多维数据分析技术与实例相结合进行了研究和探讨。事实表明, 利用商务智能技术能帮助企业深入全面地分析业务数据, 从不同的角度审视业务的经营情况,给企业管理和决策者提供更全面、客观的信息,有利于提高企业的经营管理水平,使企业信息系统的建设更上一层楼。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:OLAP 技术在 BI 系统中的应用
本文网址:http://www.toberp.com/html/consultation/10819915934.html