基于数据挖掘技术的客户关系管理系统研究

来源: 万方数据作者: 钟若武 王惠平
2010/8/16 13:07:53
通过阐述数据挖掘的概念、过程、目标,分析基于数据挖掘的CRM的特征,并探讨数据挖掘在客户关系管理系统中的应用。

分享到: 新浪微博 腾讯微博
本文关键字:

随着通信技术和互联网络的迅猛发展、市场的不断成熟,世界经济进入了全球化、电子化的时代,各个企业之间产品和服务的差异越来越小,传统的以生产为中心、以销售产品为目的的市场战略逐渐被以客户为中心、以服务为目的的市场战略所取代。只要能把握客户的需求趋势、加强与客户的关系、有效发掘和管理客户资源,就能获得市场竞争优势,在白热化的市场竞争中立于不败之地。客户资源成为了企业竞争的焦点,企业、供应商、销售商及客户形成的价值链成为企业竞争的核心,客户关系管理(Customer Relationship Management,CRM)也成为众多企业关注的对象。

同时,随着人们对海量数据中知识提取的迫切需求,数据挖掘技术在各个行业中的应用需求也日趋激烈,故就基于数据挖掘的客户关系管理系统的数据取样、探索、调整及其建模和模型评价作以探讨。

1 数据挖掘技术综述

1.1 定义

数据挖掘技术是在机器学习、计算可视化、模式识别和统计学等多个学科的基础上发展起来的一门新兴的交叉学科,是指从数据仓库中提取潜在的、有用的、最终可理解的知识的过程。数据挖掘的过程一般可以分为3个阶段:①数据准备,包括数据收集、数据选择、数据预处理、数据转换;②数据挖掘,选择并实现适当的数据挖掘技术;③结果表达和解释,根据最终用户的决策目的对提取的信息进行分析,把最有价值的信息区分出来,并且通过决策工具提交给决策者。

1.2 客户关系管理

所谓客户关系管理,世界著名IT系统项目认证和决策权威机构——Gartner Group认为,CRM是现代管理科学与先进信息技术结合的产物,它又是一种企业商务战略,是在现代管理技术和信息技术基础上开展的包括判断、选择、争取、发展和保持客户所实施的全部商业过程;是企业以客户关系为重点,通过再造企业组织体系和优化业务流程,展开系统的客户研究,提高客户满意度和忠诚度,提高运营效率和利润收益的工作实践;同时,也是企业为最终实现电子化、自动化和运营目标,创造和使用的技术、软硬件系统及集成的管理办法、解决方案的总和。

1.3 数据挖掘的基本流程

数据挖掘是一个周而复始的过程,许多软件供应商和数据挖掘顾问公司都提供了一些数据挖掘过程模型,来指导他们的用户逐步的进行数据挖掘工作,比如SPSS的5A和SAS的SEMMA,基本的数据挖掘步骤包括以下几个步骤:

(1)确定商业主题。要想充分发挥数据挖掘的价值,必须对自己的目标有一个清晰明确的定义,根据特定的目标,选择和准备数据,建立模型;

(2)数据处理。这一过程所花的时间和精力要占整个数据挖掘项目的50%~90%,它包括四个步骤:①数据过滤,这一步可以确保收集的数据符合分析的需要.如果数据有缺陷或有非一致性问题的话,即使最先进的数据挖掘工具也不会有效果。②数据预处理,这一步骤应确保原始数据和输入标准一致。数据挖掘所需要的数据可能在不同的数据库中,因而需要集成和合并数据到单一的营销数据库,并协调来自多个数据源的数据在数值上的差异,使数据属性标准化,同时,还要删除重复数据。③数据分析,在建立良好的预测模型之前。必须对预处理后的数据进行初步分析、初步认识,找出对预测输出影响最大的数据字段和决定是否需要定义导出字段。④数据准备,这是建模前数据处理的最后一步,也是数据挖掘过程的核心。主要有四个部分:选择变量、选择记录、创建新变量、转换变量,使之和选定用来建立模型的算法一致。在数据准备阶段,还需要考虑数据清洗、数据缺少、数据合并等工作;

(3)建立模型。在多个可供选择的模型中找出最佳模型,初始模型可能没法达到数据挖掘的目的,需要多次反复。在寻找最优模型的过程中,可能要修改正在使用的数据,甚至修改问题的陈述;

(4)评价模型。对数据挖掘阶段构建的模型进行评定、解释其价值。模型验证的标准方法是从预处理数据中随机抽取两个样本,一个校准样本用于构建模型,一个样本用于验证校准样本产生的模型。通常一个好的模型运用到验证样本中能得到较好的效果,如果效果很差,就需要重新构建模型。

最后,值得注意的是实施数据挖掘技术应将数据同商务需求结合在一起,理解客户及其期望、理解产品和市场、理解供应商及其合作伙伴、理解业务过程。同时,数据挖掘的结果也应同运营市场反馈紧密联系起来,实时适应市场调整挖掘模型。

1.4 CRM中常用的数据挖掘技术

在CRM中一般使用以下几种数据挖掘技术:

(1)统计分析:统计方法是从Web站点中抽取知识最常用的方法,对会话文件中的各个维度,例如浏览时间、路径长度,都可以进行频度、平均值的统计分析。许多Web浏览分析工具会定时提交统计分析报告,这些报告的内容通常包括最常访问页面、页面的平均浏览时间和平均路径长度,有些统计报告还提供了简单的错误分析功能。尽管这种分析缺少深度,但仍有助于改进系统功能,增强系统安全性,便于站点修改,并能提供决策支持;

(2)关联规则的发现:在CRM中关联规则的发现就是要找到客户对网站上各种文件之间的访问的相互联系。例如,用关联规则发现技术,可以找到以下相关性:40%的客户访问页面/company/productsl时,也访问了/company/pmducts2,30%的客户在访问/company/special时,在/company/productsl进行了在线定购,利用这些相关性,可以更好的组织站点,实施有效的市场策略;

(3)分类规则的发现:分类发现就是给出识别一个特殊群体的公共属性的描述,可以用来分类新的项。分类分析法的输入集是一组记录集合和几种标记,首先为每一个记录赋予一个标记,即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征,这个特征可以用于对新添加到数据库里的数据项进行分类;

(4)聚类分析:聚类分析用于把有相似特性的用户、数据项集合到一起。聚类分析法不同于分类规则,其输入集没有进行任何分类,是一组未标定的记录。通过聚类技术可以把具有相似浏览模式的用户集中起来,提供更适合、更令用户满意的服务。在Web日志中,聚类顾客信息或数据项能够便于开发和执行未来的市场战略,包括自动给一个特定的顾客聚类发送销售邮件,为一个顾客聚类动态地改变一个特殊的站点等。例如,有一些客户在一段时间经常浏览“furniture”、“electrical equipment”,经过分析这些客户被聚类为一组,对他们的服务就应该有别于其他的聚类客户,Web可自动给这个特定的顾客聚类发送新产品信息邮件,动态地改变一个特殊的站点,在一定程度上满足客户的要求,这对客户和销售商来说更有意义;

(5)序列模式的发现:序列模式挖掘就是要挖掘出交易集之间有时间序列关系的模式。在网站服务器日志里,用户的访问是以一段时间为单位记载的,经过数据净化和事件交易确认以后是一个间断的时间序列,这些序列反映出用户的行为。序列模式挖掘侧重点在于分析数据问的前后或因果关系,在时问有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式。例如,在访问/company/products的顾客中,有30%的人曾在过去的一星期利用关键字“数据挖掘”在yahoo上做过查询。购买彩电的人当中,80%的人会在3个月内购买影碟机等。发现序列模式能够便于进行电子商务的组织预测客户的访问模式,对客户开展有针对性的广告服务,通过序列模式的发现,能够在服务器方选取有针对性的页面,以满足访问者的特定要求。

共2页: 上一页1 [2]
责编:赵新娜
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map