随着国内水泥企业信息化建设和应用的逐步深入,各类业务系统已在企业中广泛使用,企业内部建立了ERP系统(企业资源规划)、CRM系统(客户关系管理)、人力资源管理系统等基础信息化系统。这些系统的特点是通过业务人员在客户端对数据库进行操作。因而在系统的实际使用中,各个部门用户往往局限于对已有的海量数据做一些简单的、局部的和浅层次的查询,缺乏对相关数据信息进行深层次的分析和利用,“数据泛滥,知识贫乏”的现象很普遍,企业领导决策时,往往更多的是依靠决策者的的直觉、假设。以及各类报表的简单。这表明企业的正确决策对数据信息有着全面和深人的客观需求,将企业在日常事务中积累、沉淀的大量历史数据集成为可靠的决策支持信息,已成为水泥企业关注的重要问题。
基于Pentaho的商业智能能够充分利用水泥企业内部的各类信息系统,从业务系统的基础数据库中抽取需要的数据。通过对这些数据进行清洗、转换、加载和集成,实现商业信息的搜集、管理和分析。为企业决策者提供全面、准确、系统和直观的决策支持。
1 商业智能和Pentaho平台
1989年,Gartner的分析师Howard Dresdner首次提出了“商业智能”(Business Intelligence,BI)的概念:它是将数据转换成信息的过程,然后通过发现将信息转化为知识,并将知识应用到商业行为上的一个过程。
图1中,商业智能实质上是将数据转化为信息的过程。这一过程也可称为信息供应链,其目的是把初始的操作型数据变成决策所使用的商务信息。在这一过程中,数据集成过程执行源数据的清洗、格式转化和合并计算等功能:数据存储过程建立数据存储模型,存储企业统一的数据视图,为商业智能系统的应用提供基础数据:数据分析工具一般包括OLAP(联机分析处理)、数据挖掘工具、统计分析工具及其它人工智能工具等,这些工具结合商业处理规则为决策者提供决策辅助信息。
商业智能软件区别于一般的管理应用软件,在决策支持中发挥重要作用,有着广阔的市场前景,近年来在国内外受到高度重视。目前,微软、Oracle、IBM、SAS等实力雄厚的公司都已把本身产品扩展到BI领域,其凭借雄厚的技术力量。能为大型企业提供完整的BI平台和解决方案。然而,这些厂商提供的都是需要商业软件授权的解决方案,国内企业在实施商业智能过程中往往需要花费高昂成本。而采用开源软件产品,比如开源数据库、服务器软件等,则既有利于功能定制开发,也在授权和成本方面比商业软件有着绝对优势。在如今的开源BI社区,很多优秀的开源产品完全可以和商业产品一较高低。Pentaho便是目前应用比较广泛的开源项目。
图1 数据转化为信息流程图
图2 水泥企业商业智能信息系统的体系结构
Pentaho BI平台是一个以过程为核心,面向解决方案的、可扩展的商务智能平台。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。Pentaho的功能十分强大,它对BI的功能提供了全面支持。包括数据仓库、ETL、OLAP、数据挖掘等技术,同时提供流程设计、报表生成、测试和部署的集成开发环境。
2 水泥企业商业智能信息系统
目前,国内大多数水泥企业都已上线ERP系统。ERP系统是指建立在信息技术基础上,以系统化的管理思想,为企业决策层及员工提供决策运行手段的管理平台。它将企业的物流、资金流、信息流这三大资源进行一体化集成,其管理内容涉及到企业的生产控制、物流管理和财务管理等各个方面。
通过在水泥企业原有的ERP系统基础上构建Pentaho商业智能平台来实现系统集成,使水泥企业不仅在一个集成的环境下,有一个合理、严格的流程控制,有效地完成日常的业务作业,产生大量准确的数据,同时将这些操作型数据变为分析型数据,从分析型数据中提炼决策信息。协助水泥企业决策者做出正确的决策,促进水泥企业对信息的深度利用。ERP可以为BI提供大量的准确的源数据,BI中的OLAP技术和数据挖掘技术(DM)能从数据仓库中获取数据并进行多目标多维度的分析,对用户随机性的查询并形成报告不用消耗大量的计算机资源,消除了不必要的资源开销。
在水泥企业ERP系统上构建Pentaho商业智能信息平台的体系结构主要由ERP业务子系统、业务数据库、数据转换工具、数据仓库、数据集市、Mondrian OLAP分析工具、Weka数据挖掘工具和决策支持子系统组成见图2。
该集成系统将各子系统中的海量数据经过抽取、清洗、转换、加载等过程,转换为分析型数据,加载入数据仓库。数据仓库中的数据根据不同部门的实际要求,再经抽取、综合、加载而进入不同的数据集市。成为部门经营、管理和决策的数据库。利用OLAP和数据挖掘技术对数据仓库或数据集市中的数据进行分析和处理。分析和处理的结果,可以直接提供给用户,也可以作为知识进入决策支持系统的知识库,知识库中的知识通过推理机中的推理规则,产生推理结果,提供给管理决策者。所有的数据传输、前端数据展示等均采用基于Pentaho的商业智能解决方案。
3 基于Pentaho的商业智能对水泥销售的多维分析
水泥销售多维分析通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,...,维n,度量指标),如(地区、时间、产品、销售额)。多维分析是指对以多维形式组织起来的数据采取切片(Slice)、切块(Dice)、钻取(Drill-down和Roll-up)、旋转(Pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。
水泥销售多维分析的核心是位于服务器端的Pentaho平台,Pentaho平台主要由以下几个部分组成:(1)OLAP服务器。Mondrian是纯Java开发的OLAP服务器,通过该服务器。用户可以对存储在关系数据库中的大型数据集进行交互分析。(2)OLAP展示工具。JPivot可视化组件,包括多维数据表和多维数据图,可以完成数据立方体的展示。由于该组件基于JSP网页方案,适应B/S模式开发。通过报表生成工具Report Designer,可以进一步生成专业的分析报表。(3)ETL工具。Kettle是和Pentaho整合的开源ETL工具,包括Spoon和Pan两个包,用于定义和执行转换操作,可以使用Chef或Kitchen让定义的ETL任务定时自动执行。Kettle的Spoon和Chef工具有友好的图形化界面,很容易使用。(4)数据挖掘工具。Weka是功能强大的数据挖掘软件,提供了丰富的挖掘算法和可视化支持,适合配置紧耦合的挖掘环境。(5)集成管理和开发环境。Pentaho Design Studio,基于Eclipse的开发环境,内置的Action Sequence编辑器提供了定义工作流的图形化界面。此外。开发人员可以很方便地利用该环境进行项目测试和部署。
表1 水泥产品销售多维分析
图3 水泥产品销售多维分析柱状图
现已湖南某水泥企业2008年的销售数据为基础数据。构建基于Pentaho的商业智能解决方案。把销售数据导入Oracle10g数据库,作为支持Pentaho解决方案的基础数据库,创建处理销售数据的Action Sequence应用,把应用部署到在Mondrian OLAP服务器上。Mondrian OLAP核心引擎根据部署的配置文件,从关系数据库中计算和缓存数据,并响应来自表示层的各种查询。查询可以是MDX语句,而MDX预先存储后,非专业用户可以在图形化交互界面中进行数据分析。启动Pentaho服务器,通过Web运行得到水泥产品2008年的销售数据多维分析和柱状图见表1、图3。通过对水泥的时间、地区和产品的多维分析,可以得出水泥销售中的地域性差别比较大的一般性结论:随着企业历史数据的累积。这种多维分析还将发现更多隐含的信息,可以帮助企业决策获得更好的支持。
4 结论
通过ERP系统与商业智能的集成,构建水泥企业商业智能信息平台,可有效利用ERP系统的海量历史数据,通过将操作型数据转换为分析型数据,从中提炼出决策信息,可实现水泥企业对信息的深度利用,提升决策水平。基于Pentaho的商业智能解决方案,可以有针对性地实现水泥销售的多维分析,其结果直观、高效。Pentaho平台部署简单、操作简易、运行成本低,因此易于应用并取得成效。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/