CRM系統(tǒng):數(shù)據(jù)挖掘在通信行業(yè)客戶關(guān)系管理中的應(yīng)用
數(shù)據(jù)挖掘在通信行業(yè)客戶關(guān)系管理中的應(yīng)用
曾耀輝
(廣東南方電信規(guī)劃咨詢?cè)O(shè)計(jì)院有限公司惠州分公司 惠州 516003)
摘 要 數(shù)據(jù)挖掘(Data Mining),是指從大量數(shù)據(jù)中,提取正確的、新穎的、潛在有用的并能夠被理解的知識(shí)
的過程。本文介紹了數(shù)據(jù)挖掘在通信行業(yè)客戶關(guān)系管理中的應(yīng)用過程,以及應(yīng)注意的問題。指出,通過
利用數(shù)據(jù)挖掘技術(shù)建立基于數(shù)據(jù)挖掘技術(shù)的客戶關(guān)系管理模式,終將極大地提升企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì),提高
企業(yè)的競(jìng)爭(zhēng)水平。
關(guān)鍵詞 客戶關(guān)系管理 數(shù)據(jù)挖掘 通信企業(yè) 客戶流失
1 數(shù)據(jù)挖掘的概念和流程
1.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘(Data Mining),也叫知識(shí)發(fā)現(xiàn)、數(shù)據(jù)
開采等,是指從大量數(shù)據(jù)中,提取正確的、新穎的、潛
在有用的并能夠被理解的知識(shí)的過程。 數(shù)據(jù)挖掘能進(jìn)行
分類預(yù)測(cè)、聚類分析、關(guān)聯(lián)規(guī)則和序列模式的發(fā)現(xiàn)、相
關(guān)分析、異常監(jiān)測(cè)和趨勢(shì)分析[1]。
數(shù)據(jù)挖掘技術(shù)是目前數(shù)據(jù)倉庫領(lǐng)域廣泛使用的數(shù)據(jù)
分析手段。 它的分析思想是利用已知的數(shù)據(jù)通過建立數(shù)
學(xué)模型的方法找出隱含的業(yè)務(wù)規(guī)則, 在很多行業(yè)中都有
成功的案例。比如信用卡欺詐預(yù)測(cè)、通信行業(yè)惡意呼叫
行為分析等。
按照所挖掘的數(shù)據(jù)模式的不同,可以將數(shù)據(jù)挖掘方
法劃分為以下4 種[2]。
(1)關(guān)聯(lián)規(guī)則發(fā)現(xiàn),關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中
項(xiàng)集之間有價(jià)值的關(guān)聯(lián)或相互聯(lián)系。
(2)分類和預(yù)測(cè),分類和預(yù)測(cè)用于提取描述重要數(shù)
據(jù)類的模型并運(yùn)用該模型預(yù)測(cè)未來的數(shù)據(jù)趨勢(shì)。
(3)聚類分析,聚類就是將數(shù)據(jù)對(duì)象分組成為多個(gè)
類或簇,在同一個(gè)簇中的對(duì)象之間具有較高的相似度,
而不同簇中的對(duì)象差別較大。
(4)序列模式分析,序列模式分析和關(guān)聯(lián)分析相
似,其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式
分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后序列關(guān)系。
通常一個(gè)完整的數(shù)據(jù)挖掘過程由業(yè)務(wù)問題定義、 數(shù)
據(jù)過濾、預(yù)處理、分析、準(zhǔn)備、模型選擇與建立、模型
的評(píng)估與檢驗(yàn)、模型應(yīng)用與鞏固等多個(gè)步驟組成。以下
介紹運(yùn)用數(shù)據(jù)挖掘技術(shù)分析客戶流失的一般過程。
1.2 數(shù)據(jù)挖掘流程
通信企業(yè)保存著客戶的相關(guān)信息, 呼叫數(shù)據(jù)及計(jì)費(fèi)
等大量的數(shù)據(jù),這些業(yè)務(wù)數(shù)據(jù)雖看似普通,卻能釋放出
關(guān)于客戶流失方面的珍貴信息, 數(shù)據(jù)挖掘技術(shù)與海量數(shù)
據(jù)有密不可分的關(guān)系,以及其強(qiáng)大的數(shù)學(xué)算法,使得它
能夠根據(jù)這些數(shù)據(jù)建立有關(guān)客戶流失的預(yù)測(cè)模型, 從而
分析出客戶流失的主要原因并且采取相應(yīng)措施有效地挽
留有流失傾向的客戶。
數(shù)據(jù)挖掘是一個(gè)周而復(fù)始的過程, 許多軟件供應(yīng)商
和數(shù)據(jù)挖掘顧問公司都提供一些數(shù)據(jù)挖掘過程模型, 來
指導(dǎo)他們的用戶一步步的進(jìn)行數(shù)據(jù)挖掘工作,比如
SPSS 的5A 和SAS 的SEMMA。但基本的數(shù)據(jù)挖掘步
驟包括以下幾個(gè)步驟。
1.2.1 定義業(yè)務(wù)問題
業(yè)務(wù)問題定義要明確數(shù)據(jù)挖掘技術(shù)解決的是何種商
務(wù)問題,對(duì)客戶流失管理來說就是要定義何為流失。移
動(dòng)通信領(lǐng)域的客戶流失有三方面的含義: 一指客戶從本
移動(dòng)運(yùn)營商轉(zhuǎn)網(wǎng)到其他通信運(yùn)營商, 這是流失分析的重
點(diǎn);二指客戶使用的手機(jī)品牌發(fā)生改變,從本移動(dòng)運(yùn)營
商的高價(jià)值品牌轉(zhuǎn)向低價(jià)值品牌, 如中國移動(dòng)的用戶從
全球通客戶轉(zhuǎn)為神州行客戶;三指客戶ARPU(指每用
戶月平均消費(fèi)量)降低,從高價(jià)值客戶成為低價(jià)值客戶。
在客戶流失分析中有兩個(gè)核心變量:財(cái)務(wù)原因/ 非財(cái)
務(wù)原因、主動(dòng)流失/被動(dòng)流失。客戶流失可以相應(yīng)分為
4種類型,其中非財(cái)務(wù)原因主動(dòng)流失的客戶往往是高價(jià)
值的客戶。他們會(huì)正常支付服務(wù)費(fèi)用,并容易對(duì)市場(chǎng)活
動(dòng)有所響應(yīng)。這種客戶是通信企業(yè)真正需要保住的客
戶。
1.2.2 數(shù)據(jù)處理
這一過程所花的時(shí)間和精力要占整個(gè)數(shù)據(jù)挖掘項(xiàng)目
的50%~90%,它包括4 個(gè)步驟。
(1)數(shù)據(jù)過濾,這一步驟可以確保收集的數(shù)據(jù)符合
分析的需要。
(2)數(shù)據(jù)預(yù)處理,這一步驟應(yīng)確保原始數(shù)據(jù)和輸入
標(biāo)準(zhǔn)一致,將分布在不同的數(shù)據(jù)庫中的數(shù)據(jù)和輸入標(biāo)準(zhǔn)
一致,將分布在不同的數(shù)據(jù)庫中數(shù)據(jù),集合和合并到單
一的營銷數(shù)據(jù)庫,并協(xié)調(diào)來自多個(gè)數(shù)據(jù)源的數(shù)據(jù)在數(shù)值
上的差異,使數(shù)據(jù)屬性標(biāo)準(zhǔn)化。
(3)數(shù)據(jù)分析,在建立良好的預(yù)測(cè)模型之前,必須
對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行初步分析,初步認(rèn)識(shí),找出對(duì)預(yù)
測(cè)輸出影響最大的數(shù)據(jù)字段,和決定是否需要定義導(dǎo)出
字段。
(4)數(shù)據(jù)準(zhǔn)備,這是建模前數(shù)據(jù)處理的最后一步,
也是數(shù)據(jù)挖掘過程的核心。
主要有4個(gè)部分:選擇變量、選擇記錄、創(chuàng)建新變
量、轉(zhuǎn)換變量,使之和選定用來建立模型的算法一致。
1.2.3 建立模型
在多個(gè)可供選擇的模型中找出最佳模型, 初始模型
可能沒法達(dá)到數(shù)據(jù)挖掘的目的,需要多次反復(fù)。在尋找
最優(yōu)模型過程中,可能要修改正在使用的數(shù)據(jù),甚至修
改問題的定義。
1.2.4 評(píng)估和解釋模型
這個(gè)階段是對(duì)數(shù)據(jù)挖掘階段構(gòu)建的模型進(jìn)行比較和
評(píng)估,生成一個(gè)相對(duì)最優(yōu)模型,并對(duì)此模型用業(yè)務(wù)語言
加以解釋。模型驗(yàn)證的標(biāo)準(zhǔn)方法是從預(yù)處理數(shù)據(jù)中隨機(jī)
抽取兩個(gè)樣本,一個(gè)校準(zhǔn)樣本用于構(gòu)建模型,一個(gè)樣本
用于驗(yàn)證校準(zhǔn)樣本產(chǎn)生的模型。 通常一個(gè)好的模型運(yùn)用
到驗(yàn)證樣本中能得到較好的效果,如果效果差,就需要
重新構(gòu)建模型。
1.2.5 運(yùn)用和鞏固模型
對(duì)模型在實(shí)際應(yīng)用中的表現(xiàn)進(jìn)行監(jiān)控, 將數(shù)據(jù)挖掘
的結(jié)果同運(yùn)營市場(chǎng)反饋緊密聯(lián)系起來, 如果模型表現(xiàn)不
好,應(yīng)實(shí)時(shí)適應(yīng)市場(chǎng)調(diào)整挖掘模型,對(duì)模型做進(jìn)一步的
考察和修正,以反映業(yè)務(wù)運(yùn)作規(guī)律的變化。
2 客戶關(guān)系管理中數(shù)據(jù)挖掘的應(yīng)用條件
目前通信運(yùn)營商都具有業(yè)務(wù)營運(yùn)系統(tǒng)、業(yè)務(wù)受許多
理網(wǎng)站、客戶服務(wù)呼叫中心等客戶信息系統(tǒng),也擁有許
多成熟的數(shù)據(jù)庫應(yīng)用系統(tǒng),這些系統(tǒng)具有如下特點(diǎn)。
(1)目前通信運(yùn)營系統(tǒng)實(shí)質(zhì)上是實(shí)現(xiàn)了數(shù)據(jù)的物理
集中,業(yè)務(wù)系統(tǒng)之間則相互獨(dú)立。
(2)眾多的客戶數(shù)據(jù)、市場(chǎng)營銷數(shù)據(jù)、賬務(wù)數(shù)據(jù)以
不同的數(shù)據(jù)格式和訪問方式分散在不同的系統(tǒng)中,過于
分散、冗余,沒有形成整體的、唯一的、集中的客戶數(shù)
據(jù),不能滿足數(shù)據(jù)挖掘過程中數(shù)據(jù)必須具有單一視圖的
要求。
(3)這些系統(tǒng)都是聯(lián)機(jī)事務(wù)處理(On-Line Transaction,
OLTP)系統(tǒng),實(shí)時(shí)處理在線事務(wù),不能適應(yīng)數(shù)
據(jù)挖掘應(yīng)用大規(guī)模、頻繁的檢索和查詢操作。
數(shù)據(jù)挖掘技術(shù)本身不是萬能的,一個(gè)完善的CRM
系統(tǒng)應(yīng)該以數(shù)據(jù)挖掘技術(shù)為核心,要有效的支持客戶關(guān)
系管理,必須建立企業(yè)級(jí)的客戶信息數(shù)據(jù)倉庫,能夠把
強(qiáng)力推薦:
天柏客戶關(guān)系管理系統(tǒng)
天柏客戶關(guān)系管理系統(tǒng)(CRM)是一款集專業(yè)性、實(shí)用性、易用性為一體的純B/S架構(gòu)的CRM系統(tǒng),它基于以客戶為中心的協(xié)同管理思想和營銷理念,圍繞客戶生命周期的整個(gè)過程,針對(duì)不同價(jià)值的客戶實(shí)施以客戶滿意為目標(biāo)的營銷策略,通過企業(yè)級(jí)協(xié)同,有效的“發(fā)現(xiàn)、保持和留住客戶”,從而達(dá)到留住客戶、提高銷售,實(shí)現(xiàn)企業(yè)利潤最大化的目的。通過對(duì)客戶進(jìn)行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產(chǎn)品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業(yè)銷售、營銷、客戶服務(wù)和支持等與客戶關(guān)系有關(guān)的業(yè)務(wù)流程并提高各個(gè)環(huán)節(jié)的自動(dòng)化程度,從而幫助企業(yè)達(dá)到縮短銷售周期、降低銷售成本、擴(kuò)大銷售量、增加收入與盈利、搶占更多市場(chǎng)份額、尋求新的市場(chǎng)機(jī)會(huì)和銷售渠道,最終從根本上提升企業(yè)的核心競(jìng)爭(zhēng)力,使得企業(yè)在當(dāng)前激烈的競(jìng)爭(zhēng)環(huán)境中立于不敗之地。