CRM系統(tǒng):基于數(shù)據(jù)挖掘技術(shù)的CRM 系統(tǒng)中客戶行為
基于數(shù)據(jù)挖掘技術(shù)的CRM 系統(tǒng)中客戶行為
葛淑杰
(黑龍江科技學(xué)院 計算機(jī)與信息工程系,黑龍江 哈爾濱 150027)
摘 要:為了解決在企業(yè)中實(shí)施客戶關(guān)系管理(CRM), CRM 系統(tǒng)中客戶行為的定量研究問題, 利用決策樹的數(shù)據(jù)挖掘相關(guān)技術(shù)和方法,
提出了UPTree 數(shù)據(jù)挖掘算法,并采用UPTree 算法對隱藏在大量客戶行為中的信息進(jìn)行挖掘,從而獲取了CRM 系統(tǒng)中潛在的客戶行為
規(guī)則,并給出這些行為規(guī)則的IF-THEN 的描述形式,為企業(yè)的科學(xué)決策提供依據(jù)。
關(guān)鍵詞:CRM; 數(shù)據(jù)挖掘;客戶行為
中圖分類號:TP 391 文獻(xiàn)標(biāo)識碼:A
Behavior of customers in CRM system based on data mining technology
GE Shu-jie
(Department of Computer and Information Engineering, Heilongjiang Institute of Science and
Technology, Harbin 150027, China)
Abstract:To study the customer behavior by carrying out Customer Relationship Management (CRM) in
enterprises, we use some relative technology and method of decision tree of data mining to propose a kind of
UPTree algorithm of data Mining, which is used to mine a great deal of information hidden in customer behavior.
So we can gain series of potential customer behavior rules , introducing IF-THEN description form of those
behavior rules to provide beneficial basis for scientific decision of enterprises.
Key words: CRM;data mining;behavior of customers
0 引 言
隨著信息技術(shù)與網(wǎng)絡(luò)化經(jīng)濟(jì)快速發(fā)展,商業(yè)
模式發(fā)生了根本性變化。很多行業(yè)所提供的產(chǎn)品和
服務(wù)日益商品化,企業(yè)產(chǎn)品同質(zhì)化傾向越來越強(qiáng),
市場競爭越來越激烈,同時客戶對產(chǎn)品和服務(wù)的質(zhì)
量、個性化和價值的要求越來越高。在這種環(huán)境下,
建立和維持良好的客戶關(guān)系成為企業(yè)取得競爭優(yōu)
勢的最重要基礎(chǔ)。這就需要企業(yè)完整掌握客戶信
息,準(zhǔn)確把握客戶要求,快速響應(yīng)個性化需求,提
供便捷購買渠道和良好服務(wù),提高客戶滿意度和忠
誠度。在這樣的前提下,客戶關(guān)系管理(CRM)應(yīng)
運(yùn)而生。這也是企業(yè)管理理念從傳統(tǒng)以產(chǎn)品、銷售
中心的客戶關(guān)系向以客戶滿意為中心的客戶關(guān)系
轉(zhuǎn)變的必然結(jié)果,建立以客戶為中心的管理體系是
關(guān)系到企業(yè)生存與發(fā)展的戰(zhàn)略決策。
1 客戶關(guān)系管理整體架構(gòu)
CRM 是通過收集、加工和處理涉及客戶行為
的大量信息,確定特定消費(fèi)群體或個體的興趣、消
費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消
費(fèi)群體或個體下一步的消費(fèi)行為,然后以此為基
礎(chǔ),對所識別出來的消費(fèi)群體進(jìn)行特定內(nèi)容的定向
營銷,提高了營銷效果,為企業(yè)帶來更多的利潤。
客戶關(guān)系管理架構(gòu)從整體上來說,包括三個層
面的應(yīng)用,分別是客戶接入、業(yè)務(wù)流程管理以及決
策支持。其中客戶接入是利用電子商務(wù)、呼叫中心
等與客戶互動及快速響應(yīng);業(yè)務(wù)流程管理是實(shí)現(xiàn)市
場、銷售、服務(wù)等部門的全程量化管理及工作自動
化;決策支持是利用數(shù)據(jù)倉庫/數(shù)據(jù)挖掘技術(shù)提供支
持[1]。
2 數(shù)據(jù)挖掘
2.1 數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘就是從大量的、不完全的、隨機(jī)的數(shù)
據(jù)中,提取隱含在其中的、人們事先不知道的、但
又潛在有用的信息和知識的過程,數(shù)據(jù)挖掘過程一
般由3 個階段組成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘以及解釋
評估。數(shù)據(jù)挖掘是整個知識發(fā)現(xiàn)過程的一個步驟,
是由一些特定的數(shù)據(jù)挖掘算法組成,其功能和目的
是:在可以接受的計算效率的限制條件下,生成一
個事實(shí)(F)的模式表達(dá)(E)的計算或列舉。數(shù)據(jù)
挖掘主要通過分類、回歸、聚類以及關(guān)聯(lián)等方法來
實(shí)現(xiàn),本文所用的數(shù)據(jù)挖掘技術(shù)為分類挖掘[2]。
分類的直觀含義是基于訓(xùn)練集形成一個模型,
訓(xùn)練集中的類標(biāo)簽是已知的,使用該模型對新的數(shù)
據(jù)進(jìn)行預(yù)測,確定給定數(shù)據(jù)屬于哪一類標(biāo)簽。分類
的目的是發(fā)現(xiàn)一個模型去預(yù)測目標(biāo)函數(shù)的值,該模
型的結(jié)果可能的形式包括代數(shù)表達(dá)式、決策樹、神
經(jīng)網(wǎng)絡(luò)、一個復(fù)雜的算法、或者上述方法的聯(lián)合。
2.2 客戶關(guān)系管理系統(tǒng)中數(shù)據(jù)挖掘過程
隨著數(shù)據(jù)庫技術(shù)的迅速發(fā)展以及數(shù)據(jù)庫管理
系統(tǒng)的廣泛應(yīng)用,人們積累的數(shù)據(jù)越來越多。但是
在CRM 系統(tǒng)中真正具有更深層次的數(shù)據(jù)處理的系
統(tǒng)還不多,如目前的數(shù)據(jù)庫系統(tǒng)只能完成數(shù)據(jù)的錄
入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的
關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展
趨勢。所以,企業(yè)決策者希望CRM 系統(tǒng)在提供有
效管理大量客戶信息的同時,能夠?qū)ζ溥M(jìn)行更高層
次的分析,進(jìn)一步發(fā)現(xiàn)隱藏于客戶信息表中的、潛
在有用的信息和知識,最大限度地反映企業(yè)客戶的
某種規(guī)律性,找出有價值的信息,從而指導(dǎo)商業(yè)行
為,這個過程即CRM 系統(tǒng)中的數(shù)據(jù)挖掘.
3 數(shù)據(jù)選擇與預(yù)處理
本文的數(shù)據(jù)取自惠通電腦銷售實(shí)業(yè)總公司近
幾年的銷售記錄。該公司數(shù)據(jù)倉庫中保存了數(shù)萬條
的數(shù)據(jù)信息。但是,用戶感興趣的常常只是數(shù)據(jù)倉
庫的一個子集。因此不加區(qū)分地挖掘整個數(shù)據(jù)倉庫
是不現(xiàn)實(shí)的。另外,現(xiàn)實(shí)世界的數(shù)據(jù)一般是含噪聲
的、不完全的和不一致的。采用數(shù)據(jù)預(yù)處理可以改
進(jìn)數(shù)據(jù)質(zhì)量,從而有助于提高挖掘過程的精度和性
能。在關(guān)系數(shù)據(jù)庫中,選擇相關(guān)的數(shù)據(jù)集并進(jìn)行數(shù)
據(jù)預(yù)處理不僅使得挖掘更有效,而且能夠產(chǎn)生更有
意義的規(guī)則。
3.1 屬性相關(guān)性分析
在對數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)挖掘時,其中大部分屬
性與挖掘任務(wù)不相關(guān),是冗余的,遺漏相關(guān)屬性或
留下不相關(guān)屬性都是有害的,不相關(guān)或冗余的屬性
增加了數(shù)據(jù)量,可能會減慢挖掘進(jìn)程,降低系統(tǒng)性
能。然而,對于用戶來說,確定哪些維/屬性應(yīng)當(dāng)包
含在類特征分析中則不是一件簡單的事情,所以應(yīng)
當(dāng)引進(jìn)相應(yīng)的方法進(jìn)行屬性相關(guān)性分析,以過濾掉
統(tǒng)計上不相關(guān)或弱相關(guān)的屬性。
3.2 屬性相關(guān)性分析方法
為了保證輸入量與輸出量之間有一定的相關(guān)
度,可以用信息增益來考察屬性間的相關(guān)性。1948
年,香農(nóng)(C. E. Shannon)提出了信息論,并對信
息量(Information)和熵(Entropy)進(jìn)行了定義[3]。
熵實(shí)際上是系統(tǒng)信息量的加權(quán)平均,也就是系
統(tǒng)的平均信息量,信息增益指標(biāo)的原理就取自信息
論。
設(shè)指向N 的訓(xùn)練集為S,其中包含m 個不同的
類,他們區(qū)分了不同的類Ci (for i=1, … , m)。設(shè)si
是S 中屬于類Ci 的記錄的個數(shù)。那么分裂之前,系
統(tǒng)的總熵:
I (s1, s2, … , sm) = -Σ (i=1 to m) pi log2(pi)
容易看出,總熵是屬于各個類的記錄的信息量
強(qiáng)力推薦:
天柏客戶關(guān)系管理系統(tǒng)
天柏客戶關(guān)系管理系統(tǒng)(CRM)是一款集專業(yè)性、實(shí)用性、易用性為一體的純B/S架構(gòu)的CRM系統(tǒng),它基于以客戶為中心的協(xié)同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實(shí)施以客戶滿意為目標(biāo)的營銷策略,通過企業(yè)級協(xié)同,有效的“發(fā)現(xiàn)、保持和留住客戶”,從而達(dá)到留住客戶、提高銷售,實(shí)現(xiàn)企業(yè)利潤最大化的目的。通過對客戶進(jìn)行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產(chǎn)品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業(yè)銷售、營銷、客戶服務(wù)和支持等與客戶關(guān)系有關(guān)的業(yè)務(wù)流程并提高各個環(huán)節(jié)的自動化程度,從而幫助企業(yè)達(dá)到縮短銷售周期、降低銷售成本、擴(kuò)大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機(jī)會和銷售渠道,最終從根本上提升企業(yè)的核心競爭力,使得企業(yè)在當(dāng)前激烈的競爭環(huán)境中立于不敗之地。
關(guān)鍵詞:CRM,CRM系統(tǒng),CRM軟件,客戶關(guān)系管理,客戶管理軟件,客戶管理系統(tǒng),客戶關(guān)系管理軟件,客戶關(guān)系管理系統(tǒng)