一直以来,辉瑞制药有限公司的全球药物科学部门都负责决定什么样的新药能够进入市场,然而曾经有一段时间,该部门却走到了技术的十字路口,难以决策。研究者们渴望着一种迭代方法,但是一旦到了需要从不同数据源集成数据的时候,这些工具变得不够灵活,工作进度随之不可避免地慢了下来。
过去,公司一直在使用最常用的一种集成实践——ETL。当数据集成请求提出,ETL工具会进入数据库或其他数据源,复制请求数据集,将其转换成为数据集市,供用户和应用程序获取。
但这样工作还没有完成。辉瑞负责处理数据集成请求的业务信息系统(BIS)部门必须从内部客户收集具体的需求,在继续实施ETL流程之前将数据清单完全审核一遍。
公司BIS团队负责人Michael Linhares说道:“当时,我们基本上都在按照这个数据仓库信息工厂的模式走。”
由于ETL工具机械地对数据进行复制和迁移,请求容易重复并出错。绝大部分获取的数据都被导入Excel表格,随后这些信息会被迁移到数据集市,与原来相比已经产生了变化。
除此之外,ETL工具都是批量处理,因此集成请求十分耗时。Linhares表示,一个项目耗时达到一年、花费超过一百万美元都是有可能的,甚至有时候完成ETL任务时,该项目已经没有用处了。
“这就代表它太慢了。”
若撇开成本、质量和时间不谈,并不是每一个数据集成请求都值得这样巨大的投入。很多时候研究者想要很快就能得到答案,验证一下想法,如果不行就丢掉,然后转移到下一个上面。但是ETL工具的工作模式非常死板,一旦完成一个集成请求,就没有办法紧接着添加另一项并导入新的数据源。如果必须要将新的数据源添加到数据集市,就只能再创建一个ETL。
走进数据虚拟化
对于更多灵敏性的需求,外加预算缩减的压力,促使Linhares开始寻求另一种数据集成方式——数据虚拟化。这一技术不是简单地复制和迁移数据,而是在保留原有工具的同时,从多种源数据中提取数据,并通过一个门户网站为用户创造出一个虚拟视角,无论数据是在平面文件、Oracle数据库还是SQL Server中,都能够让用户迅速地查询与分享,还有最重要的——集成。
Linhares的团队在2005年选择了Composite软件公司刚推出的数据集成平台。Forrester称,自2005年以来,企业持续添加诸如基于云的CRM系统和BI工具等更多的数据源,数据管理和集成需求也随之增长。
在Forrester 2011年发布的《Data Virtualization Reaches Critical Mass》报告中,我们看到,“数据虚拟化在新的性能和客户成功案例驱动下,以策略性的解决方案,展现出IaaS的一片大好前景,同时向企业数据管理迈进了一大步。”
报告指出,与数据合并这样的传统数据集成方法相比,数据虚拟化相对来讲还是比较省钱的。
而Composite由于推出了满足几项重要标准的易于使用的产品,被Forrester列为2012年市场中数据虚拟化的领导者。Linhares表示,这一新的平台能够缓存数据,即便服务器崩溃,用户仍然可以看到记忆数据;另外,它还支持标准编程语言“pure SQL”。
Linhares在过去的采访中多次提到,企业在实施数据虚拟化之前必须做好面对第一关挑战的心理准备,即必须确保在所有数据源中对授权数据进行及时处理与统一定义;否则的话,数据虚拟化将收不到成效。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:辉瑞制药摒弃ETL走进数据虚拟化