CRM系統(tǒng):數(shù)據(jù)挖掘在電信客戶關(guān)系管理的應(yīng)用
數(shù)據(jù)挖掘在電信客戶關(guān)系管理的應(yīng)用
何明軒
( 同濟(jì)大學(xué), 上海200092)
摘要: 本文介紹了數(shù)據(jù)挖掘的相關(guān)概念與知識, 提出了數(shù)據(jù)挖掘在當(dāng)今從海量數(shù)據(jù)中提取相關(guān)信息, 和知識發(fā)現(xiàn)的過程, 與此同時介
紹了數(shù)據(jù)挖掘在幫助企業(yè)進(jìn)行數(shù)據(jù)分析, 推理, 預(yù)測的應(yīng)用, 例如: 關(guān)聯(lián)分析、時序模式、偏差分析、分類、聚類、預(yù)測等。與此同時, 著重提
出了數(shù)據(jù)挖掘在電信行業(yè)營銷的應(yīng)用, 介紹了國內(nèi)外應(yīng)用現(xiàn)狀, 并以國內(nèi)某電信運(yùn)營商的數(shù)據(jù)倉庫項目為例, 例證了數(shù)據(jù)挖掘在客戶分
群和流失預(yù)測的成功應(yīng)用, 在此基礎(chǔ)上, 展望了未來的可發(fā)展方向。
關(guān)鍵詞: 數(shù)據(jù)挖掘; 企業(yè)應(yīng)用; 電信客戶分群; 客戶流失預(yù)測
中圖分類號: TP274 文獻(xiàn)標(biāo)識碼: A 文章編號: 1009- 3044(2007)03- 10620- 02
The Application of Data Mining on CRM in Telecommunicaion
HE Ming- xuan
(Tongji University,Shanghai 200092)
Abs tract:This paper is about the introduction of data mining including the conception and some related knowledge which is discovering invisible
information from huge of data, we can call it process of knowledge of learning. Meanwhile, it also presents the application of data mining
on the field of data analysis, consequence and forecast in enterprises. For example, association analysis, warp analysis, sequence module, classification
and clustering. It also takes a telecommunication enterprises as example, which testified the success of attempt at using data mining at customer
clustering and prediction of losing customers. At the end of the paper, it prospects the future of the App of data mining on the solution of
other problems in telecommunication.
Key words :Data mining; Application on enterprises; Customer clustering; Prediction of losing customer
1 引言
隨著國內(nèi)電信市場競爭的日趨激烈, 電信運(yùn)營商的經(jīng)營模式
逐漸從“技術(shù)驅(qū)動”向“市場驅(qū)動”、“客戶驅(qū)動”轉(zhuǎn)化。這就要求運(yùn)
營商要采取以客戶為中心的策略, 根據(jù)客戶的實(shí)際需求提供多樣
化、層次化、個性化的服務(wù)解決方案。因此, 客戶關(guān)系管理成了電
信運(yùn)營商增加收入和利潤, 提高客戶滿意度、忠誠度的有效工具。
在客戶關(guān)系管理的流程中, 為了準(zhǔn)確、及時地進(jìn)行經(jīng)營決策, 必須
充分獲取并利用相關(guān)的數(shù)據(jù)信息對決策過程進(jìn)行輔助支持。另
外, 面對用戶的多樣化、層次化、個性化的需求, 大眾化營銷已經(jīng)
失去了它的優(yōu)勢, 基于客戶信息、客戶價值和行為的深入的數(shù)據(jù)
分析的洞察力營銷、精確化營銷的理念逐漸被各大電信運(yùn)營商所
接受, 并渴望通過從數(shù)據(jù)中挖掘價值來減少營銷成本、提高
營銷效益。近幾年迅速發(fā)展起來的數(shù)據(jù)挖掘技術(shù)成為實(shí)現(xiàn)這些目
標(biāo)的必要手段。
數(shù)據(jù)挖掘是從海量數(shù)據(jù)中提取隱含在其中的有用信息和知
識的過程。它可以幫助企業(yè)對數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)
計、分析、綜合和推理, 從而利用已有數(shù)據(jù)預(yù)測未來, 幫助企業(yè)贏
得競爭優(yōu)勢。例如, 利用數(shù)據(jù)挖掘可以對企業(yè)的海量數(shù)據(jù)進(jìn)行客
戶分析, 包括客戶類型、各類客戶的需求傾向、購買行為預(yù)測和客
戶信用政策分析、客戶流失分析等; 進(jìn)行市場研究, 包括商品市場
占有率預(yù)測、市場拓展計劃仿真; 進(jìn)行經(jīng)營策略研究, 包括經(jīng)營成
本與收入分析、風(fēng)險控制、欺詐行為甄別等。
數(shù)據(jù)挖掘旨在從數(shù)據(jù)庫中提取正確的、非平常的、未知的、有
潛在應(yīng)用價值的并最終可為用戶理解的模式。它的出現(xiàn)為自動和
智能地把海量的數(shù)據(jù)轉(zhuǎn)化成有用的信息和知識提供了手段。數(shù)據(jù)
挖掘涉及到諸如機(jī)器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、數(shù)據(jù)庫和人工智能
等等眾多學(xué)科, 是數(shù)據(jù)庫理論和機(jī)器學(xué)習(xí)的交叉學(xué)科。
2 數(shù)據(jù)挖掘主要的一些應(yīng)用
(1)關(guān)聯(lián)分析: 其目的就是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。
例如, 買電腦的顧客同時會買某種軟件, 這就是一條關(guān)聯(lián)規(guī)則。
(2) 時序模式: 通過時間序列搜索出重復(fù)發(fā)生概率較高的模
式, 這里強(qiáng)調(diào)時間序列的影響。例如, 購買了激光打印機(jī)的人中,
半年后80%的人會買新硒鼓。
(3)分類: 找出一個類別的概念描述, 它代表了這類數(shù)據(jù)的整
體信息。分類數(shù)據(jù)挖掘中應(yīng)用最多的任務(wù)。
(4)聚類: 按一定規(guī)則將數(shù)據(jù)分為一系列有意義的子集。同一
聚類中, 個體之間的差距較小; 不同聚類中, 個體之間的距離偏
大。聚類和分類有著很大的區(qū)別: 分類時, 我們總是事先知道哪些
屬性是重要的, 我們總是將重要的、有影響力的屬性作為分類的
依據(jù); 而聚類時, 我們事先根本不知道哪些屬性起作用, 我們的任
務(wù)就是要找到那些起關(guān)鍵作用的屬性。
(5)偏差分析: 從數(shù)據(jù)庫中找出異常數(shù)據(jù), 比如欺詐行為的發(fā)
現(xiàn)。
(6)預(yù)測: 利用歷史數(shù)據(jù)找出規(guī)律, 建立模型, 并用此模型預(yù)測
未來數(shù)據(jù)的種類、特征等。
在國內(nèi)外, 數(shù)據(jù)挖掘已經(jīng)有不少成功案例。目前國內(nèi)企業(yè)實(shí)
現(xiàn)數(shù)據(jù)挖掘的困難在于缺少數(shù)據(jù)積累、難于構(gòu)建業(yè)務(wù)模型、各類
人員之間的溝通存在障礙、缺少有經(jīng)驗的實(shí)施者、初期資金投入
較大。而在國外, 數(shù)據(jù)挖掘首先在金融、證券、電信、零售業(yè)等數(shù)據(jù)
密集型行業(yè)實(shí)施, 因為這些行業(yè)信息化程度比較高, 數(shù)據(jù)庫中已
經(jīng)保留了大量數(shù)據(jù)資源。有數(shù)據(jù)表明, 進(jìn)入二十世紀(jì)90 年代, 人
類積累的數(shù)據(jù)量以每月高于15%的速度增加, 如果不借助強(qiáng)有力
的挖掘工具, 僅依靠人的能力來理解這些數(shù)據(jù)是不可能的。數(shù)據(jù)
挖掘的前景被人們普遍看好。國際知名調(diào)查機(jī)構(gòu)Gartner Group 在
高級技術(shù)調(diào)查報告中, 將數(shù)據(jù)挖掘和人工智能列為“未來三到五
年內(nèi)將對工業(yè)產(chǎn)生深遠(yuǎn)影響的五大關(guān)鍵技術(shù)”之首, 還將并行處
理體系和數(shù)據(jù)挖掘列為未來五年內(nèi)投資焦點(diǎn)的十大新興技術(shù)前
兩位。Gartner 的調(diào)查報告預(yù)計: 到2010 年, 數(shù)據(jù)挖掘在相關(guān)市場
的應(yīng)用將從目前少于5%增加到超過80%。美國銀行家協(xié)會預(yù)測
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在美國商業(yè)銀行的應(yīng)用增長率是
14.9%。
數(shù)據(jù)挖掘目前在電信行業(yè)也已得到廣泛應(yīng)用, 比如:
(1)客戶消費(fèi)模式分析
客戶消費(fèi)模式分析( 如固話話費(fèi)行為分析) 是對客戶歷年來
長話、市話、信息臺的大量詳單、數(shù)據(jù)以及客戶檔案資料等相關(guān)數(shù)
據(jù)進(jìn)行關(guān)聯(lián)分析, 結(jié)合客戶的分類, 可以從消費(fèi)能力、消費(fèi)習(xí)慣、
消費(fèi)周期等諸方面對客戶的話費(fèi)行為進(jìn)行分析和預(yù)測, 從而為固
話運(yùn)營商的相關(guān)經(jīng)營決策提供依據(jù)。
(2)客戶市場推廣分析
客戶市場推廣分析( 如優(yōu)惠策略預(yù)測仿真) 是利用數(shù)據(jù)挖掘
技術(shù)實(shí)現(xiàn)優(yōu)惠策略的仿真, 根據(jù)數(shù)據(jù)挖掘模型進(jìn)行模擬計費(fèi)和模
擬出賬, 其仿真結(jié)果可以揭示優(yōu)惠策略中存在的問題, 并進(jìn)行相
應(yīng)的調(diào)整優(yōu)化, 以達(dá)到優(yōu)惠促銷活動的收益最大化。
(3)客戶欠費(fèi)分析和動態(tài)防欺詐
通過數(shù)據(jù)挖掘, 總結(jié)各種騙費(fèi)、欠費(fèi)行為的內(nèi)在規(guī)律, 并建立
一套欺詐和欠費(fèi)行為的規(guī)則庫。當(dāng)客戶的話費(fèi)行為與該庫中規(guī)則
吻合時, 系統(tǒng)可以提示運(yùn)營商相關(guān)部門采取措施, 從而降低運(yùn)營
商的損失風(fēng)險。
(4)客戶流失分析
根據(jù)已有的客戶流失數(shù)據(jù), 建立客戶屬性、服務(wù)屬性、客戶消
費(fèi)情況等數(shù)據(jù)與客戶流失概率相關(guān)聯(lián)的數(shù)學(xué)模型, 找出這些數(shù)據(jù)
之間的關(guān)系, 并給出明確的數(shù)學(xué)公式。然后根據(jù)此模型來監(jiān)控客
戶流失的可能性, 如果客戶流失的可能性過高, 則通過促銷等手
段來提高客戶忠誠度, 防止客戶流失的發(fā)生。這就徹底改變了以
往電信運(yùn)營商在成功獲得客戶以后無法監(jiān)控客戶流失、無法有效
實(shí)現(xiàn)客戶關(guān)懷的狀況。
各運(yùn)營支撐系統(tǒng)所積累的海量歷史數(shù)據(jù)是企業(yè)的一筆寶貴
財富, 誰能正確地挖掘與分析隱含在數(shù)據(jù)中的知識, 誰就能更好
地向用戶提供產(chǎn)品與服務(wù), 從而在競爭中獲勝。數(shù)據(jù)挖掘正是充
分利用這些寶貴資源從中提取知識的一種技術(shù)。在國外, 英國電
信選用了SPSS 的數(shù)據(jù)挖掘產(chǎn)品Clementine, 為其“商業(yè)高速公路”
活動分析數(shù)據(jù)和建立探索模型, 更好地了解了這些客戶的行為特
征, 向銷售人員提供最佳客戶的清單, 直郵活動回應(yīng)率提高了
100%。美國西部電信利用銷售活動管理軟件, 連同SAS 的Enterprise
Miner 一起, 既消除了銷售人員對全部客戶數(shù)據(jù)進(jìn)行評分
的負(fù)擔(dān), 也減少了手工干預(yù)所造成的人為錯誤, 公司的市場營銷
周期大為縮短, 使企業(yè)得到了更高的營銷投資回報。麻薩諸賽州
Lightbridge 公司用數(shù)據(jù)挖掘技術(shù)中的分類回歸樹為英格蘭一家主
要電話公司建立和部署了一個分析客戶流失的預(yù)測模型, 使得公
司能及時發(fā)現(xiàn)高價值的流失客戶并且能夠及時采取挽留的措施,
極大降低了電話公司客戶流失率。比利時國家電信使用數(shù)據(jù)倉庫
建立顧客信息系統(tǒng), 通過實(shí)施客戶欺騙檢測, 能夠很快發(fā)現(xiàn)反常
電話以及欺騙性的打電話方式, 并能在造成重大經(jīng)濟(jì)損失之前終
止這種欺騙行為。
某電信運(yùn)營商實(shí)施數(shù)據(jù)挖掘應(yīng)用有非常好的基礎(chǔ), 某電信運(yùn)
營商在ITSP 規(guī)劃指導(dǎo)下, 于2004 年3 月啟動數(shù)據(jù)倉庫項目, 并
于2005 年6 月完成項目初驗。建立了企業(yè)統(tǒng)一數(shù)據(jù)視圖和統(tǒng)一
統(tǒng)計口徑的數(shù)據(jù)倉庫為數(shù)據(jù)挖掘提供了進(jìn)行廣泛的數(shù)據(jù)分析的
基礎(chǔ)。數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的協(xié)同工作, 一方面, 可以迎合和簡化
數(shù)據(jù)挖掘過程中的重要步驟, 提高數(shù)據(jù)挖掘的效率和能力, 確保
數(shù)據(jù)挖掘中數(shù)據(jù)來源的廣泛性和完整性。另一方面, 數(shù)據(jù)挖掘技
術(shù)已經(jīng)成為數(shù)據(jù)倉庫應(yīng)用中極為重要和相對獨(dú)立的方面和工具。
數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的融合與互動發(fā)展為廣大渴望從數(shù)據(jù)“奴
隸”到數(shù)據(jù)“主人”轉(zhuǎn)變的企業(yè)最終用戶提供了通途。另外, 該電信
也已經(jīng)在數(shù)據(jù)挖掘應(yīng)用方面作出了許多卓有成效的嘗試。數(shù)據(jù)倉
庫的建設(shè)期間, 數(shù)據(jù)挖掘應(yīng)用也在其地市電信分公司進(jìn)行了試點(diǎn)
工作, 在客戶流失預(yù)測和客戶分群分面取得了顯著的應(yīng)用效果。
該公司于2005 年1 月20 日在某市啟動基于數(shù)據(jù)挖掘的客戶分
群應(yīng)用的MR 項目試點(diǎn), 4 月1 日完成試點(diǎn)客戶分群, 隨后用一個
月時間在另一試點(diǎn)進(jìn)行了推廣, 目前已于8 月30 日通過了MR
試點(diǎn)初驗。通過客戶分群, 根據(jù)客戶可能的行為和潛在的價值對
客戶進(jìn)行分類, 針對每一類客戶的特點(diǎn)制定有針對性的營銷策
略, 為市