1.概述
日前,数据正以前所未有的、惊人的速度产出,根据国际数据公司的“数字宇宙研究报告”, 2011 年全球被创建和被复制的数据总量已达到了1.8ZB,预测在2020 年,世界的数据量将可能增加到了50倍。传统数据库等存储工具都难以满足如此大规模要求,维基百科把“无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合”称为大数据。一般地,大数据能正确地反映全球的本质和运行的规律,利于人们充分的、有效的配置资源。所以,大数据具有极高的利用价值,誉为“未来的新石油”。
大数据的价值问题已不是仅停留在一个话题上了,已引起全球地区和企业的高度重视。在2012年3 月, 美国发布了《Big Data Research andDevelopment Initiative》,旨在提升利用大量复杂数据集合获取知识和洞见的能力,并投入两亿美元以上资金鼓励各企业进行探究及开发。微软、IBM、谷歌等商业巨头相继进军该领域。在大数据时代构建及借助功能全面的企业系统具有非常重要的现实意义。因此,挖掘数据中有用的价值,用于决策,赢得优势是企业开展竞争的一个关键。
2.大数据的产生背影和特征
2.1 大数据发展背影
伴随着信息技术的发展,各种传感器、摄像头、手机和个人电脑的普及,世界更容易被感知了,所以产生的数据量越来越大。谈及大数据产生的根本原因,首先是爆发式的数据增长,量膨胀式增加。量大包含实时的数据会越来越多,非结构化数据极其多;第二个原因是数据的社会化趋势,如UGC 及碎片化的信息。
大数据的发展大致可划分两个阶段,第一个阶段主要是大型的互联网企业。包括谷歌、百度、阿里巴巴等走在大数据的前列的原因来源于本身拥有大数据,没有现成的解决方案,资本市场对大数据非常敏感和火热的学术界,成立各种各样大数据的机构。第二个阶段,这里面很重要的一点还是大型的互联网企业是大数据这里面主要的力量,经过大数据转型的IT 厂商。
2.2 大数据的特征
大数据是指无法再可容忍的时间内用于传统IT 技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。大数据的特点可以总结为5V, 即数量(Volume)、多样性(Variety)、速度(Velocity)、价值(Value) 以及真实性(Veracity)。
海量的数据,聚合在一起供分析的数据规模非常庞大。谷歌执行董事长艾瑞特·施密特曾说,现在全球每两天创造的数据规模等同于从人类文明至2003年间产生的数据量总和。“大”是相对而言的概念,对于搜索引擎,EB 属于比较大的规模,但是对于各类数据库或数据分析软件而言,其规模量级会有比较大的差别。
多样性的数据,数据形态多样,从生成类型上分为交易数据、交互数据、传感数据;从数据来源上分为社交媒体、传感器数据、系统数据;从数据格式上分为文本、图片、音频、视频、光谱等;从数据关系上分为结构化、半结构化、非结构化数据;从数据所有者分为公司数据、政府数据、社会数据等。
井喷式增长的数据,一方面是数据的呈井喷式增长,另一方面是要求数据访问、处理、交付等速度极快。美国的马丁·希尔伯特说,数字数据储量每3年就会翻1倍。人类存储信息的速度比世界经济的增长速度快4倍。
价值不可估量的数据,尽管我们拥有大量数据,但是发挥价值的仅是其中非常小的部分。大数据背后潜藏的价值巨大,被誉为“未来的新石油”。美国社交网站Facebook有10亿用户,网站对这些用户信息进行分析后,广告商可根据结果精准投放广告。对广告商而言,10亿用户的数据价值上千亿美元。据资料报道,2012年,运用大数据的世界贸易额已达60亿美元。
真实性的数据,一方面,对于虚拟网络环境下如此大量的数据需要采取措施确保其真实性、客观性,这是大数据技术与业务发展的迫切需求;另一方面,通过大数据分析,真实地还原和预测事物的本来面目也是大数据未来发展的趋势。经过社会的大范围在调查对于大数据特性关注度,统计如图1。
图1 大数据特征的关注度
从图中我们不难看出,在大数据的几个特征中,“多样性”和“价值”极受人们关注。“多样性”之所以被最为关注,在于数据的多样性使得其存储、应用等各个方面都发生了变化,大数据类型繁多,包括结构化数据、半结构化数据。同时,由于数据显性或隐性的网络化存在,使得数据之间的复杂关联无所不在。针对于多样化数据的处理需求也成为了技术重点攻关方向。而“价值”则不言而喻,不论是数据本身的价值还是其中蕴含的价值都是企业、部门、政府机关所希望的。
因此,如何将如此多样化的数据转化为有价值的存在,是大数据所要解决的重要问题。
3.大数据的价值利用
近年来,微软、甲骨文、惠普、IBM、SAP 等公司已经在数据管理和分析领域投入超出150 亿美元。据Gartner 最新预测,大数据产业2014年将在全球范围内带来近千亿美元的IT 开支;2015 年,大数据将为全球带来440 万个IT 岗位,这将带来一个空前的大跃进。
大数据作为一种重要的战略资产,已经不同程度地渗透到每个行业领域和部门,其深度应用不仅有助于企业经营活动和竞争,还有利于推动国民经济发展。大数据使经济决策部门能够更敏锐地把握经济走向,及时制定并实施科学的经济政策。大数据可以提高企业经营决策水平和效率,推动创新,给企业、行业领域带来不可估量的价值。大数据技术作为一种重要的信息技术,对于提高安全保障能力、应急能力、优化公共事业服务,提高社会管理水平的作用正在日益凸显。
自2008年11月IBM 提出“智慧地球”概念以来,2009年1月,美国奥巴马总统公开肯定了IBM“智慧地球”思路,2009 年8 月,IBM 又发布了《智慧地球赢在中国》计划书,正式揭开IBM“智慧地球”中国战略的序幕。智慧城市是大数据的源头,大数据是智慧城市的内核。以智慧交通为例,智慧交通领域的海量数据融合了各类数据,并以城市交通为主题,在海量变化数据中建立关联关系,找到所需数据的准确信息,并被及时推送到对象手中,提高了城市管理的精确性,提升了城市居民的幸福感受。
数据挖掘是一种重要的战略行为,它就像“石油”一样具有极不可估量的开采价值,非常有利于帮助企业、行业及政府机构做出更为精准、更为科学的决策,实现更大的商业利益。所以,有效利用大数据并不等同于简单使用决策支撑,而是一种产生高、快、准的效益决策。
在数据迸发时代,若是仍墨守成规的再依靠简单的经验来做决策,将是白白浪费一个将企业乃至一个行业进行质的飞跃的大好机会,现在企业要的是以数据为依据,挖掘数据的价值,借助数据,做出精准的判断,进行科学的决策,赢得提升的先机。
4.数据的标准化探究
在大量快速变化、多样化、低价值密度、低质数据中提取数据价值。在大数据上开掘城市智慧。大数据犹如大储油罐,分析数据多样性,解决数据爆炸的问题,解决数据垃圾的问题,进行数据标准化与增强、补全数据资源,避免数据垃圾化,实现数据资产化。
图2 数据标准化结
不以规矩,无以成方圆,制定数据标准为解决之道。一切数据,皆应有标准。在生活中数据不乏规范及标准,如:
数据名址标准:人名、机构名、商品名、地址;数据编码标准:身份证号码,工商注册号,车牌号,手机号,工号;
国际标准国家标准行业标准地方标准企业标准;
数据标准布局;
数据实体标准;
数据库表结构及数据字典规范;
数据交换标准: 多为XML 标准(XML vocabulary);
数据表示标准:如CSS;
行业数据标准。
图3 数据标准化流程
创新的数据标准制定与评估,自底向上的标准制定。传统的自顶向下,自底向上与自顶向下相结合!
数据标准依赖数据规则来落地、实施,数据规则则辅助人来制定数据标准和辅助人来评估数据标准。涉及的人力资源配置及工作分工的问题,因此,需要明权责的跟进数据治理规范,指导数据处理过程规范,使数据稽查规范可落地。
大数据时代的到来极大地改变既有的技术与商业格局,改变了企业的竞争模式.TRS 公司开推出了大数据管理系统,采用分布式并行计算、多副本机制、没有单点的高可靠体系架构,兼容Hadoop 标准,支持PB 级海量数据管理;支持实时及用户行为数据的高效管理和分析;创新的多检索引擎机制;支持线性扩展,充分释放硬件潜力,为大数据管理提供支撑,规范了数据。
结语
大数据已成为企业的一种资产,像石油一样驱动生产力的发展,对其分析与管理已经成为企业获取竞争优势制高点、产业转型和及智慧城市等的推动的重要途径。现在只有适应数据变革,标准先行,抓住先机,实现低成本、高效率的竞争优势,才能赢得先机,乃至实现先知、先行、先赢!
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:大数据的标准化研究
本文网址:http://www.toberp.com/html/consultation/10839716648.html