0 引言
随着企业信息化建设的加强,MES在企业生产信息化建设中的作用越来越重要.MES系统中的数据挖掘主要针对于过程监控中的大量生产的日志数据.通过这些数据分析,对生产过程中的数据变化进行实时监测,以此来得到生产状态而进行结果判别.
国际MES协会对MES定义为“一个提供信息的系统,以优化从定单到成品的生产活动.使用当前的和精确的实时数据,MES指导厂级活动,并对发生的活动进行响应和汇报,形成对变化条件的迅速响应,并专注于减少无价值的活动,从而驱动有效的厂级操作和过程”.
生产过程是一个复杂的而且具有周期的多样性的过程,采用传统的数据分析方法,很难进行建模和处理.粗糙集(RoughSet,RS)就是一种新型的数据处理的软计算方法,它甚至不需要数据的任何检验或者附加的信息(比如数学统计上的概率分布,模糊集理论中的模糊度划分,神经网络中一定数量的训练样本等),而是直接从已知数据的初始状态系统出发,通过不可分辨关系和不可分辨类确定给定问题的近似解,从而有效地进行分析和处理不精确、不完整的信息,并有效地进行属性约简并进行正确的动态调度.
1 基于粗糙集的数据挖掘算法
粗糙集的方法和模型建立在一种直观的二维表的基础上,所以可以采用知识表示系统和决策系统对问题进行描述.由于互信息方法在精度等方面的有可能表现不足,我们可以通过引入粗糙集,得出一种基于关系积理论和知识表示的属性约简算法,从而提出一个适用于海量文本数据集的特征选择方式.利用此方法来进行互信息特征初选,利用属性约简算法来消除冗余,获得具有代表性的特征词.结果表明,该性约简算法方法能获得冗余度小且具有代表性的特征子集.使用关联规则是数据挖掘中一种重要的方法,最开始是由R.Agrawal等人在1993年提出的,主要用于发现事务数据库中不同商品之间的联系,从而找出顾客购买行为模式等行为.此算法的核心就是Apriori算法,即基于两阶段大项集思想的方法,将关联规则用于数据挖掘算法的设计可以分解为两个子问题:
(1)找出所有支持度中大于最小支持度的项集(Itemset),并把这些项集称为大项集(Large Itemset).
(2)使用第1步找到的大项集产生相应的关联规则.
从关联规则的支持度和置信度出发,那么在事务数据库中就存在无穷多的关联规则和置信度.人们一般只对满足一定的支持度和置信度的关联规则非常关注.科学论文中,一般称满足一定要求的(如大的支持度和置信度)的关联规则为强规则.所以,为了找到有意义的关联规则,需要给定两个数据:最小支持度和最小置信度.前者称为用户规定的关联规则必须满足的最小支持度,它表示了一组物品集在统计意义上的最低程度;后者即用户规定的关联规则必须要满足的最小置信度,它直接反应了关联规则的最低可靠度.
2 数据挖掘算法在MES系统中研究与应用
生产执行过程中的数据挖掘算法是一种新技术,新方法,所以还没有形成完整的理论体系,它的应用都是针对具体问题展开研究,其广度和深度需要进一步拓展.
在生产过程中,计算机系统记录和保存的数据是时间上连续变化的数据经采样、量化得到.它在本质上是连续的,变化过程受生产状态约束;其次,生产过程中的行为、特性等元素是由许多过程变量共同决定的,而且任何一个变量的变化都影响其它变量以及生产状态的变化,所以在空间上,生产过程数据和变量具有高维数、强关联和非线性等特点.但是与一般商业上的数据不同存在区别,比如零售业数据库中的的数据是关于商品的名称和数量的数据,这些数据在本质上是分散的,而且在时间域无约束,在空间域的特点也不同于生产过程数据,所以数据特点不同,采用的挖掘算法不同,特征提取的方法也不同.
预测在数据挖掘算法中具有重要应用领域,对生产过程有着重要的指导意义.在预测研究方法中,确定关键因子是非常重要的一环,以前的预测方法所涉及因子比较少,所以它的结论具有一定的局限性.数据挖掘算法的优点就是从海量数据中找到潜在有用且有关联的信息.
由于各种干扰,生产过程数据中含有大量的噪声和杂质;生产过程中存在大量的不确定性和机动性,造成生产数据也存在大量的不确定性.因为数据中的噪声影响算法的有效性和结论的可靠性,所以给数据中的不确定性给知识提取带来了困难.生产过程不同的部分其特性不同,要求也不一样,因此对不同部分变量的采样使用不同的采样频率,这使得过程变量具有多标度特点.
本文根据生产执行的全过程,结合粗糙集的属性约简改进了Apriori算法,从而使它适合生产过程中的知识发现和数据挖掘.算法Apriori-MES的详细流程如图1所示.
图1 Apriori MES流程图
3 结束语
本文针对MES系统的特点,运用先前提出的一套Apriori—MES算法,并且将此算法在实际的数据挖掘系统中得到了实现,但是MES系统中尚待研究的问题还有很多,主要有:
(1)从寻求数据挖掘过程中的可视化方法出发,使知识发现的过程能够被用户认识,也便于在知识发现的过程中进行人机交互和应用,以及能够反应不同生产工序之间关系的图形显示.
(2)生产过程中不同的过程造成不同的特性,要求也会一样,因此对不同部分变量的采样使用了不同的采样频率,这使得过程变量具有多标度的特点,目前的数据挖掘算法还不能处理这类数据.
(3)将KDD技术与在线分析处理(OLAP)技术、数据查询有机的相结合,因为用户使用数据挖掘系统时,他们的要求具有不确定性,数据查询可以提供给用户一个简单的,灵活多变的分析数据库结构和数据简单特征的工具.
(4)在实际应用中,许多算法不能有效的工作是因为巨大的数据量.一个有效的算法必须能存储这样巨大的数据,算法运算的时间必须是合理的。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:基于粗糙集的数据挖掘算法在MES/ERP系统的研究与应用
本文网址:http://www.toberp.com/html/consultation/10820211554.html