20 世纪末,席卷全球的以互联网为核心的计算机网络信息技术迅猛发展,电子商务成为新经济形式的代表,给企业的经营管理带来了巨大的冲击和变化。这意味着又一次产业革命的来临,人类社会的发展从工业经济时代进入到电子商务时代。随着网络技术的成熟,电子商务大潮正在全球范围内急速变革着传统的商业模式,各类电子商务网站风起云涌,不仅提供了一种商家与客户进行交流的全新的方式,同时为商家提供了丰富的数据资源。21 世纪作为“商务时代”,其特殊性在于“客户经济”。企业要在新时代里生存,就要具备吸引和保持客户的能力。
商务智能是指基于互联网环境下的商品交易及以商品交易相关的商务活动,同时与人工智能技术,数据挖掘等方面的技术相结合的活动,涉及的领域非常广泛,其中包括电子支付、安全、信任、法律、广告、在线购物等。当前,商务智能的真正价值在于企业应用。企业的成本控制是有限的,在生产过剩、市场不足的情况下,企业只有加大市场营销、销售和服务等与客户相关的部门的管理,才能开源。客户参与及互动合作的新的营销理念及其运作,要求不论是虚拟型的纯电子商务,还是由具备强大基础结构的传统商务企业延伸出来的电子商务,都必须能将焦点移回到客户身上。只有提供客户个性化且立即解决问题的支持,才能在电子商务时代中创造压倒性的竞争优势。企业要想生存,必须尽快抓住这一中心。
那么,如何了解顾客的兴趣,掌握客户需求,以达到增加收入降低成本使企业处于更有利的竞争位置呢? 客户行为预测和潜在客户挖掘已成为商务营销者必须面对和解决的问题。有效地利用数据挖掘技术,从商务网站潜在的海量商业数据中发现商机,提高商家对市场的响应速度和竞争力势在必行。
1 数据挖掘在商务智能应用中的研究现状
数据挖掘能带来显著的经济效益,因此在电子商务中应用也越来越广泛。客户的行为、消费习惯对于电子商务来说非常重要。在生活中采用数据挖掘的成功的例子很多,例如著名的“尿布与啤酒”的故事。早在 2007 年,Google、Amazon、Yahoo、MSN 等一些公司都要求员工运用挖掘技术来了解客户行为,并根据挖掘出的信息数据及模式设计更加符合客户需求的服务和产品。也就是说利用挖掘可以了解客户行为,其分析的数据结果可提供给企业参考,做出合适的调整策略。目前,国外对于数据挖掘的研究重点逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。当前,世界上比较有影响的典型数据挖掘系统有 Cover Story,EXPLORA,Knowledge Discovery,Workbench,DB Miner,Quest 等。在应用方面包括:KDD 商业软件工具不断产生和完善,注重建立解决问题的整体系统,而不是孤立的过程。用户主要集中在大型银行、保险公司、电信公司和销售业。国外很多计算机公司非常注重数据挖掘的开发应用,比如 IBM 和微软成立了相应的研究中心进行这方面的工作。
国内从事数据挖掘研究的人员主要在大学,也有研究所和公司在从事这方面的研究,这些工作一般集中于学习算法和有关数据挖掘理论方面的研究。在具体应用方面,中科院计算所智能处理开放实验室的史忠植等人设计了一个数据挖掘工具 MSMiner,使用决策树算法为广东地税提供纳税人异常情况检测; 复旦德门公司开发的“天眼”数据挖掘工具集 D miner 集成了多种数据挖掘算法,取得了较好的挖掘效果。
2 数据挖掘技术在商务智能中的应用
2.1 数据挖掘在商务智能 CRM 中的应用
CRM( Customer Relationship Management) ,即客户关系管理。这个概念最初由 Gartner Group 提出来,而在最近开始在企业电子商务中流行。CRM 的主要含义就是通过对客户详细资料的深入分析,来提高客户满意程度,从而提高企业的竞争力的一种手段,它主要包含以下 7 个主要方面( 简称 7P) : 客户概分析( Profiling) 、客户忠诚度分析( Persistency) 、客户利润分析 ( Profitability ) 、客户性能分析( Performance) 、客户未来分析( Prospecting) 、客户产品分析( Product) 、客户促销分析( Promotion) 。
目前在 CRM 中进行有效数据挖掘的应用及研究主要集中在以下几个方面:
1) 通用且合理的 CRM 系统体系结构的研究。主要考虑应用对象、应用目标、企业规模等等实际问题;
2) 数据挖掘与数据库、数据仓库的有机结合;
3) CPJI 中的复杂数据挖掘模型的研究。这方面主要集中在挖掘的知识类型、多个抽象层的交互知识挖掘算法的研究;
4) 数据的研究。这方面主要包括数据库类型的多样性问题、复杂数据类型的处理、噪声数据和缺失数据的处理,以及异种数据库和 Web 上的数据挖掘等;
5) 与用户交互的研究。这方面主要研究数据挖掘结果的可视化和可理解性,领域知识的运用等。数据挖掘是从海量数据中挖掘出有用的信息和知识的过程,它在 CRM 中的应用主要表现在对客户信息的分析和处理上,它能从表层数据中挖掘出蕴含的深层的知识。正是基于这一点,许多 CRM 的解决方案中越来越重视数据挖掘在其中的应用。
2.2 需要数据挖掘处理的客户行为数据源
电子商务网站客户进行数据挖掘时,所需要的数据主要来自于两个方面: 一方面是客户的资料,包括客户的背景信息和客户以往的交易数据,这部分信息主要来源于客户的登记信息; 另外一部分数据主要来自于客户浏览时的点击流,这部分数据主要用于考查客户的行为表现,主要来源于服务器数据。
2.2.1 服务器数据
服务器数据可以分为 Web 日志文件和查询数据。
1) Web 日志文件。登陆电子商务网站的客户只要他们链接到网站的服务器上,提供 Web 服务的服务器会自动生成访问日志信息。客户访问任意一个页面,Web 服务器的日志记录中就会增加一条相关信息。随着网络技术的高速发展和时间积累,Web 服务器中所记录的日志文件必将越来越大,所包含的网站客户访问信息也会越来越多。
2) 查询数据。电子商务网站的查询数据是指客户在商务网站上查询自己想要查询的信息时在Web 服务器端产生的数据。例如,客户会搜索一些自己喜欢的商品或某些关注的广告,这些查询信息就会通过商品或者广告的登记信息连接到服务器的访问日志上。
2.2.2 客户登记信息
在数据挖掘中,客户登记信息必须和访问日志集成,才能提高数据挖掘的准确度,更进一步地了解客户特征。通常我们要求在电子商务网站的访问者成为客户之前就开始跟踪他们。通过网络站点就能实现这一点,每当第一次看到一个访客就发送一个cookie 和启动一个匿名简档以记住访客作了什么,当该访客回来( 使用同一浏览器) 的时候,该 cookie被识别,简档被更新。当该访客最终变成客户或者是成为注册用户时,将导致转变得那些活动加入该客户的历史行为记录。
2.3 数据挖掘客户行为的过程
电子商务客户行为数据挖掘过程可以细分为确定业务对象、数据的搜集和抽取、数据预处理、挖掘模型的构建、数据挖掘、结果分析、使用结果。
2.3.1 定义问题
数据挖掘的结果往往是不可预测的,但是要探索的问题应该是有预见性的、有明确目标的。为了数据挖掘而挖掘数据带有盲目性,往往是不会成功的。在确定业务对象时,要确定这样一些问题: 从何处入手,需要挖掘什么数据,要用多少数据,数据挖掘要进行到什么程度。
2.3.2 数据的搜集和抽取
一旦问题定义完毕,就要进行相关数据的搜集。对于电子商务客户数据挖掘,数据的主要来源是服务器数据和客户的登记信息。电子商务网站每天都可能有上百万次的在线交易,生成海量的日志文件和登记表。这些海量的数据就构成了电子商务数据挖掘的数据源。数据抽取的目的是辨别出需要分析的数据集和,缩小处理范围,提高数据挖掘的质量。
2.3.3 数据的预处理
数据预处理是对数据进行清洗,解决数据中的缺值、冗余、数据值的不一致性等问题,以供数据挖掘阶段使用。这是电子商务数据挖掘最关键的阶段。数据预处理的一个主要任务就是要将客户访问网站留下的原始日志整理成事物数据库,以供数据挖掘阶段使用。
2.3.4 挖掘模型的构建
将数据转化成一个分析模型,这个分析模型时针对挖掘算法建立的。建立一个真正的适合挖掘算法的分析模型,是数据挖掘成功的关键了。所建模型的目标就是要反应客户群中各个年龄段对某种商品的反应的各种相关因素。模型建立后,需要从模型的准确性、可理解性和性能方面进行考察。
2.3.5 数据挖掘
选择合适的算法进行数据挖掘,从而从海量的数据中得出有效的、新颖的、潜在的、有用的及最终可以理解的信息和知识。电子商务数据挖掘常用关联规则、序列模式、分类和聚类等技术。
2.3.6 结果分析
当数据挖掘出结果后,要对挖掘结果进行解释并且评估。数据的可视化问题是数据挖掘中一个重要的组成部分,他把挖掘到的信息组成和提供成为易于作决策的表达方式。可以说,没有提供良好的数据可视化的数据挖掘系统,不是一个完善的系统。用户对数据挖掘结果进行评估,如果满意则挖掘过程结束,否则,则可以重新提出挖掘要求,再重新进行挖掘。
2.3.7 使用结果
一旦当达到了数据挖掘的最后一步,就可以应用基于所发现的模式决策了。可以利用挖掘得到的知识在管理决策分析中得到应用,提高企业的竞争力。
3 商务智能中的数据挖掘技术
数据挖掘的技术基础是人工智能。但它仅仅利用了人工智能中一些已经成熟的算法和技术,如: 人工神经网络、遗传算法、决策数、邻近搜索方法; 规则
准理、模糊逻辑等,其问题的复杂性和难度比人工智能要低很多。进行电子商务的数据挖掘,主要是针对客户访问信息、客户交易信息等客户行为信息进行挖掘,得到客户的访问模式和行为模式,从而找到有用的市场信息,提供有针对性、个性化的服务。数据挖掘系统利用的技术越多,精确度就高。但无论采用哪几种技术来完成任务,从功能上包括以下 4种。
3.1 关联分析
关联分析的目的就是为了挖掘出隐藏在数据间的关联规则。在电子商务中关联分析也就是找到客户对网站上各种文件之间访问的相互联系,找出客户购买行为的各种关联。进行Web上的数据挖掘,构建关联模型,可以更好的组织站点,减少用户过滤信息的负担,可以根据客户当前的购买行为给客户提供推荐。
3.2 序列模式分析
序列模式分析的侧重点在于分析数据间的前后或者因果关系。就是在实践有序的事物集中,找到哪些“一些项跟随另一些项”的内部事务模式。对电子商务数据挖掘而言,序列模式分析是很重要的分析方法,因为 Web 日志数据是根据用户的访问时间来记录的,经过数据净化和处理后,使一个间断的时间序列; 而且,商品交易数据也是时间序列数据。关联分析中采用的 Apriori 特性也可以用于序列模式的挖掘,因为若长度为 K 的序列模式是非频繁的,其超集( 长度为 k +1) 不可能是频繁。因此,即使参数设和约束条件有所不同,序列模式分析的大部分算法仍然是类 Apriori 算法的变形算法。
3.3 分类分析
分类分析可以挖掘默写共同的特性。这个特点可以用来对新添加到数据库里的数据项进行分类。在数据挖掘中,分类计数可以根据访问这些用户而得到的个人信息或共同的访问模式得出访问某一服务器文件的用户特征。另外,通过用户的注册表、在线调查表也可以得到用户的一些特性。按照各种算法的技术特点,可以将分类分析分成决策树类分类、贝叶斯类分类、基于关联规则分类以及利用数据库技术分类等几类算法。
在电子商务中通过分类分析,得到客户分类模式后,知道各类客户的特点、爱好,那么就可以针对不同类客户的特点展开不同的商务活动,提供有针对性地人性化的信息服务; 得到客户的分类模式后,可以对新的客户进行分析,发现新的客户属于那一个类别,从而有针对性地开展商务活动。
3.4 聚类分析
聚类分析用于把有相似特性的用户、数据项集合到一起,并用显式或者隐式的方法描述不同的类别。电子商务数据挖掘用聚类技术可以把具有相似浏览模式的用户集中起来。
1) 利用数据挖掘技术,通过挖掘 Web 服务器中用户的访问日志,对网络用户进行聚类,发掘出具有相似的访问兴趣的网络用户,网站的设计者根据聚类的结果,可以更好的理解用户的需求,重新调整网站的页面结构,从而为用户提供方便、优质的服务。还可以利用聚类分析进行网页聚类,调整网页结构。
2) 利用数据挖掘技术挖掘客户资料,将具有相似爱好的客户分配到相同的族中,聚类产生以后,根据族中其他客户对某商品的评价就可以得到该客户对该商品的评价,就可以同客户推荐他可能感兴趣的商品。
3) 分类分析和聚类分析的综合应用。分类分析法和聚类分析法是互逆的过程。例如在最初的分析中,分析人员根据以往的经验要分析的数据进行鉴定、划分类别,然后,该分析人员用分类分析法分析该数据集合,得到每个类别的描述,接着把这些描述作为新的分类规则重新对这个集合( 抛弃原来的划分结果) 进行划分,一次获得更好的分类结果。这样分析人员可以循环使用这两种分析法直到得到满意的结果。在电子商务中,由于客户登记的资料往往不完整,不可能正确划分客户的类型,综合运用两种方法更有实际的意义。
4 结束语
目前,对商务智能系统的研究主要集中于对Web 日志的挖掘,比较成功的技术是协同过滤技术,而将关联规则、聚类、分类等数据挖掘技术用于商务推荐系统才刚刚开始。分析客户访问电子商务网站的浏览和购买等行为,从行为数据的采集与储存,数据挖掘算法的改进及复合补充挖掘三个方面来找到一个适合小型电子商务网站的适时挖掘系统,从而实现掌握客户行为规律,为推荐等工作提供依据。
在以后的研究工作中,对目前比较先进的大型数据库进行研究,数据的集成、清洗还有待进一步研究,数据的建立模型还有待进一步完善,目前各种数据理还较为繁琐,适应性较低。研究解决大型商务网站的海量客户行为数据的采集和存储问题的方案。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:商务智能系统中客户行为数据挖掘研究综述
本文网址:http://www.toberp.com/html/consultation/10839315720.html