一、会计数据处理发展历程回顾
会计数据是对企业经营活动过程中各种经济事项进行记录的符号。在对会计数据进行采集、存储、加工和传递等的过程中所采用的技术称为会计数据处理技术。会计数据处理技术的发展经历了四个阶段:
一是会计数据手工处理阶段, 会计人员依靠算盘、纸张等计算工具对会计数据进行采集、存储、加工和具时会计数据进行采集、存储、加工和传递等。手工处理阶段在会计业务处理过程中表现出好的适应性、灵活性和可靠性,但也表现出低速度、低效率和高差错率等不足之处。
二是会计数据机械处理阶段,即会计人员利用穿孔机、验孔机、机电设备、电子设备等工具对会计数据进行采集、存储、加工和传递等。会计数据机械处理阶段能够提高会计数据处理的计算速度与正确性,但这些工具存在体系庞大、成本过高、操作困难和稳定性较差等不足。
三是会计数据电子计算机处理阶段。计算机的出现,为会计数据处理提供了技术支撑。会计数据的集中存储和自动处理极大地提高了会计数据处理的工作效率,提高了会计信息的及时性和准确性。这个阶段,计茸机技术还是会计数据处理的工具,信息的分享和交换主要通过软盘、光盘等存储介质来实现。该阶段会计核算和操作流程主要模拟手工方式,只有相关独立的单机运行的会计核算程序,一种核算程序独立完成一项会计业务,相互之间没有联系。
四是会计数据网络化处理阶段。随着网络技术的发展,财务部门,可独立使用计算机及网络如内部网(intranet)、外部网(extranet)、因特网(internet)等进行会计数据的处理。
利用分布式数据库技术、互联网技术、中间件技术、系统集成技术等现代信息技术,特别是ERP系统的开发与应用,企业会计信息系统实现了业务流程、会计工作流程和信息流程的集成,彻底消除了“信息孤岛”现象,极大地提高了整个企业的信息共享性。同时,实现了业务处理和会计处理的集成、财务信息和非财务信息的集成、会计核算与会计管理的集成。
二、物联网下会计数据处理的革命
(一)会计大数据的特征
随着信息技术特别是物联网技术、移动计算技术的发展,会计核算必须收集、处理数量巨大、结构各异的大数据。这些会计大数据除具有一般大数据的4个“V”的特征外,还具有无形性与粘性的特征:
1.数据数童规模大(Volume)。物联网下产生的数据数量大,它已经不是过去大规模数据(large scale data)、庞大数据(enormous data)、海童数据(massive data)所能够描述的,而应该是用大数据(big data)来概括。数据规模不是用GB, TB为单位而是用PB为单位来衡量。
2.数据异构的数据((Variety)。物联网下产生的数据不仅包括数字这样结构化的数据,还包括声音、图像等非结构化的数据。这些数据因为与业务事件的关联性,从而导致结构化数据与非结构化数据更加复杂,不易处理。
3.数据产生与处理实时性( Velocity)。传统数据时时间处理要求不高。但是,物联网下物的行为与人的行为一般都要求在当下完成,因此数据的产生与处理具有实时性。
4.价值密度低(Value)。会计大数据会连续不断地产生,但有价值的数据却只是连续产生的数据中的一个片断或一个部分。以视频为例,连续不间断的监控过程中,可能有用的数据仅仅只有一两秒。因此,大数据的价值密度低。
5.会计数据的无形性与粘性。当前物联网上企业采集、传输、处理的数字信息主要是非价值的数量信息。这些数据可以直接被感应器所感知,从而容易被传播;而会计数据是无形的数据,它不能够被感应器所感知。同时,会计数据是直接粘合在业务数据之中,不能够脱离业务数据而存在。因此,会计数据具有无形性与粘性。
(二)会计大数据的处理问题:物联网与云计算的发展必须解决的问题
如果说石油是工业社会的血液,那么数据就是信息社会中的血液。但是,大童的大数据如果没有得到有效利用,就会产生数据泛滥或信息超载。大量优质的数据和劣质数据融合在一起,可能会产生各种各样的误差和错误。数据不准确就没有任何价值。如何保证数据的可信性和质童是物联网需要解决的首要问题。其次,如何时物联网中所产生的大量数据进行智能挖掘和分析以产生真正的数据价值是物联网需要解决的核心问题。最后,如何对由于物联网所产生的大量大数据进行存储和管理并确保这些大数据的安全,是物联网下需要解决的基础问题。
三、构建会计大数据分析平台及其思路:企业会计云计算建设的核心
随着会计大数据时代的来临,企业要向数据分析型企业转型,必须改变传统观念,全员、全方位、全过程地利用数据,建立会计大数据分析平台。由于篇幅的限制,会计大数据的治理及管理、标准与安全管理等内容不在本文论述,本文主要提出企业推行会计云计算、构建会计大数据分析平台中需要做到的几点内容。
(一)大数据不是信息,信息不是智慧:企业必须端正的认识
由于数据蕴含着企业管理决策所需要的信息,通过对企业所拥有的数据进行分析,能够为企业创造巨大的效益,如对企业内部数据进行挖掘、优化,能帮助企业更精准地找到用户、降低营梢成本、提高企业销售率、增加利润。因此,当前许多企业认为只要是数据就要收集、存储,就能够从中获取收益,这是一个错误的认识。数据越多,不一定代表信息越多。数据不代表信息,更不代表智慧。企业大量收集大数据的同时,也面临着大数据处理、使用、保管和安全等方面的新挑战。当前,许多企业有很多数据自收集后就存在服务器内,不产生任何价值。如银行、电信、保险等企业拥有巨量数据,但有很大一部分数据是处于休眠或者是半休眠状态,不仅未能帮助企业做出有效的管理决策,而且耗费大量存储和管理成本。
(二)确保会计大数据质量:一个必须坚持的原则
“垃圾的数据只能产生垃圾的信息。”在会计大数据处理过程中经常出现数据不准确、不完整、不及时等数据质量问题。因此,在会计数据处理的过程中必须确保会计大数据的质量。
会计大数据的质量主要包括大数据的准确性、完整性、一致性、时效性、可信性和可解释性等。数据的准确性是指不包含错误或存在偏离期望的值;数据的完整性是指数据不缺属性值,或仅含聚集数据;数据的一致性是指数据之间不存在差异,相互可内洽;数据的时效性是指数据的及时性;数据的可信性是指反映有多少数据是用户依赖的;数据可解释性是指数据是否容易理解。
(三)建立企业大数据中心开发平台:数据分析平台建设的基础
大数据的问题不是单一的一个产品能够解决的,它需要一整套的解决方案,它要融合很多传统的、新的技术。要构建大数据分析平台并从大数据中挖掘出价值,企业首先需要一个可扩展、灵活而可管理的数据基础架构,也就是企业大数据中心开发平台。
1.数据中心开发平台的基本内容。数据中心开发平台的含义很多,笔者认为,数据中心主要应具备以下特征:
①数据中心是各种数据的集成与交换中心,是集基础与应用为一体的综合开发与应用集成平台。
②数据中心是一种搭建平台,提供一系列完整语义的数据处理功能,提供对流程、表单、应用程序界面数据等完整的搭建方案(由一系列的程序模块及数据组成),因而也是关于应用系统的集成设计器和工具箱。
③数据中心是一种强兼容性的数据仓库,可以在同一个框架下,把来自不同生产厂商、不同格式、不同标准和分布在不同位置的数据统一在一个系统之下,即实现对分布式多源异构数据的管理能力。
④数据中心是一个定义完备的功能仓库,支持和管理以多种方式(组件、插件、流程、动态库、程序片断和脚本)提供的功能,并能时这些功能以一种一致的方式进行调用和执行。
⑤数据中心是一种应用集成系统,采用柔性设计理念,系统能够被快捷地搭建出来,且能适应需求的变化迅速做出调整。
2.数据中心的体系架构。数据中心的架构是面向服务的系统架构(Service-Oriented Architecture),又称为SOA架构。在这架构下,无数软件制造者可将其研制软件功能以服务形式提供出来,各功能之间是相互独立的,以一种称为松藕合的协议机制来组合。数据中心架构通过目录配置、可视化配置和搭建充分利用功能仓库和数据仓库的机制进行管理。
(四)会计大数据的获取、存储和计算:一条企业参与会计云计算的主线
1.数据清理、数据集成、数据选择、教据变换:会计大数据的获取。
会计有一句名言:财务会计与管理会计影同源分流”,这里的源便是数据。但是,收集来的数据应先经过数据清理、数据集成、数据选择、数据变换才能进行会计的加工、处理。首先,未经处理会出现数据的不准确,例如收集数据的设备可能出故障;人或计算机的错误可能在数据输入时出现;用户不希望提交个人信息时,故意强制输入不正确的值;错误也可能在传输过程中出现。其次,未经处理会出现数据的不完整。不完整数据的出现可能出于多种原因,如销售事务数据中顾客的数据不一定总能得到;数据的重复,如多次记入的客户;数据逻辑上关联不一致,如地址与邮政编码。
会计数据预处理主要有数据清理、数据集成、数据选择、数据变换。有效的“清理”是指消除噪音和删除不一致数据;集成是指多种数据源可组合在一起;选择是指从数据库中提取与分析任务相关的数据;变换是指通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式。
2.关系型数据库存储与管理向本原(XML)数据库存储与管理转变:会计大数据的存储与管理。
数据的存储与计算是相互依存的。因此,会计大数据的存储在会计云计算中具有重要的地位。随着会计大数据时代的来临,会计数据已从原来数值型为主的数据向非结构性为主的数据转变。由于非结构性数据存储与结构性数据存储技术上存在本质的差异,会计大数据的存储与管理要从关系型数据库存储与管理向本原(XML)数据库存储与管理转变。
①关系型数据库存储与管理。关系型数据库存储与管理不仅很好地解决了数据的集中和共享问题,而且数据关系模型有严格的数学基础,抽象级别比较高,而且简单清晰,便于理解和使用。关系型数据库也能够解决数据独立性和抽象问题。用户在对这种数据库进行存取时,不需要明确数据的存储结构并指出存取路径。
②原生XML数据库系统(Native XML Database)存储与管理。关系型数据库能很好地处理所谓的“表格型数据”,却对物联网技术所产生的非结构化的数据无能为力。这就需要比关系型数据库产品更高级的面向对象关系型数据库来支持(作者注:“面向对象的数据库系统<objectoriented database>"<或简称“OO数据库系统”>专门用来解决非结构化的数据存储问题。由于面向对象的数据库产品的主要设计思想是试图用新型数据库系统来取代现有的数据库系统,这对许多已经运用数据库系统多年兼积累了大量工作数据的客户<尤其是大客户>来说,无法承受新旧数据间的转换而带来的巨大工作量及巨额开支。
另外,面向对象的关系型数据库系统使查询语言变得极其复杂,从而使得无论是数据库的开发商家还是应用客户都视其复杂的应用技术为畏途。因此,面向对象与关系型数据库的结合是当前的主要方式)。以非结构化数据为主要特征的会计大数据存储与管理必须在跨操作平台、跨软件系统的Internet平台上进行,其基础技术就形可扩展的标识语言(XML, extensiblemarkup language)。如果说以http传输协议和超文本标识语言HTML为标志的是第一代Internet技术的话,那么,围绕着XML所形成的一系列标准和技术将构成新一代的Internet技术。HTML文件中的标识符仅表示该文件应该如何显示,文件中表达的意义完全需要人通过对文字的阅读才能理解,机器难以判断其表达的语义。而XML则不同,它所采用的标识符本身就代表了语义结构,文件的具体语义完全可以通过对语义结构的分解及该结构内变量值或字符的分析由机器来解释。因此,用通俗的话来概括HTML与XML的差别:0HTML是写给人看的;而XML则是写给机器看的。
一般说来,XML有下列重要特性:XML是一种表意而非表形的元语言;XML是Internet的标准语言,具有跨操作平台、跨区域的特点,是网络世界里的一种“世界语”;XML是一种可自我描述定义的元语言(self descriptionmeta language),所以它将大量用于制定行业内及行业间数据交换的标准。相对于传统的关系型数据库管理系统来说,原生XML数据库系统存储与管理是一种结构完全不同、设计思想新颖的全新的数据库系统。如果用关系型数据库来处理XML数据,将需要一系列复杂的转换工作,从而极大地影响应用的速度。当转换选择不合理时,很有可能对应用造成致命的伤害。而原生XML数据库系统则不同,XML数据不经任何转换而按原结构形状直接存入数据库内。时于XML应用,原生XML数据库系统的速度相对于其他数据库来说要快得多。
3.数据挖掘:会计大数据的计算。
从某种意义上说,会计实质上是数据分类处理的一门学问。如何从经济业务数据中获取决策知识是会计的主要目的。随着信息技术的发展,数据挖掘技术正是会计大数据处理的核心技术。数据挖掘(Data mining)主要是指从数据库中提取知识,并对数据进行一定的处理,从而获得其中隐含的、事先未知的而又可能极为有用的信息。数据挖掘方法主要包括神经网络法、遗传算法、决策树法、搜盖正例排斥反例法、统计分析法、模糊集法等。
数据挖掘的主要内容可分为四类,即预测建模、关联分析、聚类分析和异常检测等。这里主要把它分为两类:预测任务与描述任务。预测任务是指根据其他属性的值,预测特定属性的值;描述任务主要是导出概括数据中潜在联系的模式(如相关、趋势、聚类、轨迹和异常)。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文网址:http://www.toberp.com/html/consultation/1083979825.html