CRM系統(tǒng):數(shù)據(jù)挖掘技術(shù)在CRM系統(tǒng)中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在CRM系統(tǒng)中的應(yīng)用
江 耘1 ,龍 海2 ,黃水源1 ,李 姍1
(1. 南昌大學(xué)信息工程學(xué)院,江西南昌 330029 ;2. 江西渝州科技職業(yè)學(xué)院工商管理學(xué)院,江西新余 338000)
摘要:隨著信息化建設(shè)在CRM系統(tǒng)中的迅速發(fā)展,數(shù)據(jù)量的急劇膨脹,如何將計算機(jī)獲得的海量信息進(jìn)行有效的組織和
利用,將其用于決策就變成一個緊迫的問題。本文對利用數(shù)據(jù)挖掘技術(shù)建立CRM系統(tǒng)中的決策分析系統(tǒng)進(jìn)行了理論研
究和實際應(yīng)用,包括數(shù)據(jù)倉庫的建立和組織,聯(lián)機(jī)分析(OLAP) 和數(shù)據(jù)挖掘(DM) 。
關(guān)鍵詞:數(shù)據(jù)挖掘;CRM;數(shù)據(jù)挖掘技術(shù)
中圖分類號:TP311. 52 文獻(xiàn)標(biāo)識碼:A
Application of Data Mining Technique in CRM System
J IANG Yun1 ,LONG Hai2 ,HUANG Shui2yuan1 ,LI Shan1
(1. School of Information Engineering , Nanchang University , Nanchang 330029 , China ;
2. School of Business Administration ,Jiangxi Yuzhou Scientific and Technological Institute ,Xinyu 338000 ,China)
Abstract :With the rapid development of the informatization construction in CRM system and the drastic increment of data amount , it be2
comes a crucial problem how to effectively organize and utilize the mass information and to use themon the decision system. Several theo2
retic and practical problems are analyzed using data mining technique to build the decision analysis systemof the CRM system , including
the creation and organization of data wearhouse , OLAP and DM.
Key words :data mining ;CRM;data mining technique
0 引 言
決策支持系統(tǒng)(DSS) 是以日常業(yè)務(wù)處理系統(tǒng)的
數(shù)據(jù)為基礎(chǔ),利用數(shù)學(xué)或智能的方法對業(yè)務(wù)數(shù)據(jù)進(jìn)行
綜合分析,預(yù)測未來業(yè)務(wù)的變化趨勢,在企業(yè)發(fā)展、市
場經(jīng)營戰(zhàn)略等重大問題上為領(lǐng)導(dǎo)層提供決策幫助的
計算機(jī)系統(tǒng)。
1 數(shù)據(jù)挖掘技術(shù)
1. 1 數(shù)據(jù)倉庫
數(shù)據(jù)倉庫的數(shù)據(jù)是面向主題的,數(shù)據(jù)以數(shù)據(jù)模型
中所定義的各個主題域為基礎(chǔ),獨立于應(yīng)用。主題域
可分為表示基本實體的主題,以及表示實體間聯(lián)系的
主題。因此數(shù)據(jù)倉庫的設(shè)計由數(shù)據(jù)驅(qū)動。數(shù)據(jù)倉庫
應(yīng)該在海量數(shù)據(jù)中為用戶提供有用、及時、全面的信
息,幫助用戶做出正確的決策。它由數(shù)據(jù)開始,對已
有的數(shù)據(jù)進(jìn)行集成,生成各個主題域,然后根據(jù)數(shù)據(jù)
來編制程序。用戶根據(jù)查詢和分析結(jié)果,將需求反饋
給開發(fā)人員。
1. 2 數(shù)據(jù)挖掘
數(shù)據(jù)倉庫的數(shù)據(jù)量不斷增長,如果不能有效地利
用會淹沒其中的有用信息。因此,企業(yè)領(lǐng)導(dǎo)層需要高
效的決策支持工具,方便、有效地使用數(shù)據(jù)倉庫。數(shù)
據(jù)挖掘工具就是決策支持工具的一個典型代表。數(shù)
據(jù)挖掘發(fā)現(xiàn)的是以前未知的、可理解的、可執(zhí)行的信
息,所以也被稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)( Knowledge
Discovery in Databases) 。與統(tǒng)計分析技術(shù)相比,數(shù)據(jù)
挖掘技術(shù)能很好地和數(shù)據(jù)庫技術(shù)相結(jié)合,而且數(shù)據(jù)挖
掘工具用以發(fā)現(xiàn)數(shù)據(jù)中隱含的知識規(guī)律。數(shù)據(jù)挖掘
任務(wù)一般可以分兩類:描述數(shù)據(jù)庫中數(shù)據(jù)的一般特
性;根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行推斷及預(yù)測。
數(shù)據(jù)挖掘主要用于解決以下的問題:
(1) 關(guān)聯(lián)分析(Association analysis) 。即尋找屬性
間的相關(guān)性,其中關(guān)聯(lián)規(guī)則和序列模式是兩種常用的
技術(shù)。關(guān)聯(lián)規(guī)則尋找同一事件中出現(xiàn)的不同項的相
關(guān)性序列模式尋找的是事件之間時間上的相關(guān)性。
(2) 分類(Classification) 和預(yù)測(Prediction) 。根據(jù)
某種標(biāo)準(zhǔn)將數(shù)據(jù)庫記錄分成預(yù)先定義好的類別。
(3) 聚類(Clustering) 。把整個數(shù)據(jù)庫分成不同的
群組。聚類與分類不同:分類追求的目標(biāo)是要使群與
群之間差別明顯,而同一群之內(nèi)的數(shù)據(jù)盡量相似。分
類之前已經(jīng)知道要把數(shù)據(jù)分成哪幾類,每個類的性質(zhì)
是什么;聚類則恰恰相反。
(4) 演變分析(evolution analysis) 。描述對象行為
隨時間變化的規(guī)律或趨勢并對其建模。
(5) 描述和可視化(Description and Visualization) 。
數(shù)據(jù)歸約、概化或圖形描述等。
KDD(從數(shù)據(jù)庫中發(fā)現(xiàn)知識) 是從數(shù)據(jù)庫中發(fā)現(xiàn)
有用知識的過程,而數(shù)據(jù)挖掘則是KDD 過程的核心,
它應(yīng)用專門算法從數(shù)據(jù)中抽取有效的模式。KDD 包
括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、評估解釋模式模型、鞏固知
識、運用知識等步驟,各步驟之間相互影響,反復(fù)調(diào)
整,形成螺旋式的上升過程。目前提出的數(shù)據(jù)挖掘方
法包括統(tǒng)計分析方法、決策樹方法、神經(jīng)網(wǎng)絡(luò)方法、
Rough 集方法、遺傳算法、公式發(fā)現(xiàn)和可視化技術(shù)等。
數(shù)據(jù)挖掘基本可分為:明確目標(biāo)、數(shù)據(jù)準(zhǔn)備、建立
模型、輸出結(jié)果的評價和解釋以及實施5 個階段,
(1) 明確目標(biāo)。應(yīng)用數(shù)據(jù)挖掘的首要任務(wù)就是明
確需要達(dá)到什么樣的目標(biāo),并描述出需要解決的問
題。目標(biāo)的描述應(yīng)該細(xì)化、清楚,以便于選擇合適的
挖掘方法,也方便檢測數(shù)據(jù)挖掘效果,判斷建立模型
的有效性。
(2) 數(shù)據(jù)準(zhǔn)備?;跀?shù)據(jù)挖掘的商業(yè)目標(biāo),提取
所需要的數(shù)據(jù)。為了保證數(shù)據(jù)的質(zhì)量,除了對數(shù)據(jù)進(jìn)
行必要的檢查和修正外,還需要考慮不同源之間數(shù)據(jù)
的一致性問題。如果數(shù)據(jù)集包含過多的字段,需采用
一定的方法找到對模型輸出影響最大的字段,適當(dāng)減
少輸入的字段。常用的方法包括:描述型數(shù)據(jù)挖掘和
連結(jié)分析等。
(3) 建立模型。建立模型是一個反復(fù)的過程。首
先需要選擇適合解決當(dāng)前問題的模型。對模型的選擇
過程可能會啟發(fā)對數(shù)據(jù)的理解并加以修改,甚至改變
最初對問題的定義。一旦選擇了模型的類型及應(yīng)用的
方法,所選擇的模型將決定對數(shù)據(jù)的預(yù)處理工作。例
如,神經(jīng)網(wǎng)絡(luò)需要做數(shù)據(jù)轉(zhuǎn)換,有些數(shù)據(jù)挖掘工具可能
對輸入數(shù)據(jù)的格式有特定的限制等。對于通過數(shù)據(jù)挖
掘建立的模型需要有一定的數(shù)據(jù)來測試和驗證。對于
預(yù)測性模型,需通過反復(fù)的測試、驗證、訓(xùn)練,才能不斷
提高模型的準(zhǔn)確率。同一個問題可以用不同的數(shù)據(jù)挖
掘模型來解決,模型之間并不相互排斥。
(4) 輸出結(jié)果的評價和解釋。模型建立好之后,
必須評價其結(jié)果,解釋其價值。在實際應(yīng)用中,模型
的準(zhǔn)確率標(biāo)準(zhǔn)會隨著應(yīng)用數(shù)據(jù)的不同發(fā)生變化,但準(zhǔn)
確度自身并不一定是選擇模型的唯一最佳評價方法。
對輸出結(jié)果的分析需要考慮錯誤的類型和由此帶來
的相關(guān)費用的因素。如果每個不同的預(yù)測錯誤所需
付出的代價(費用) 也不同的話,則代價最小的模型
(而不一定是錯誤率最小的模型) 將是較好的選擇。
直接從實際需要和解決現(xiàn)實問題出發(fā)來測試模型很
重要,可先在小范圍內(nèi)應(yīng)用,取得滿意的測試結(jié)果后
再逐步擴(kuò)大范圍推廣。
(5) 實施。模型在建立并經(jīng)驗證之后,有兩種主
要的使用方法。一種是提供給分析人員進(jìn)行分析,并
做出解釋和方案建議;另一種是把模型應(yīng)用到不同的
數(shù)據(jù)集上。模型可以用來標(biāo)識一個事例的類別,還可
以用在數(shù)據(jù)庫中選擇符合特定要求的記錄,以便再用
其他工具做進(jìn)一步分析。
OLAP 工具。OLAP 工具可超越查詢和報表工具
的能力,其顯著特點是用多維模型來表達(dá)數(shù)據(jù)。多維
模型一般定義為星型結(jié)構(gòu),不是將數(shù)據(jù)視為一個孤立
事件,而是一段時間上這些事件的累計效用。使用
OLAP 工具,是以動態(tài)表格或交叉表來看數(shù)據(jù),這樣能
迅速從不同角度觀察數(shù)據(jù)。
2 CRM 系統(tǒng)中的數(shù)據(jù)倉庫
1. 方案。
對數(shù)據(jù)倉庫開發(fā)者來說,劃分粒度是設(shè)計過程中
最重要的問題之一,所謂粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單
元的詳細(xì)程度和級別。數(shù)據(jù)越詳細(xì),粒度越小,級別
就越低;數(shù)據(jù)綜合度越高,粒度越大,級別就越高。在
數(shù)據(jù)倉庫環(huán)境中,主要是分析型處理,粒度的劃分將
直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量和所適合的查詢類
型。一般將數(shù)據(jù)劃分為:詳細(xì)數(shù)據(jù)、輕度綜合、高度綜
合三級或更多級粒度,不同粒度級別的數(shù)據(jù)用于不同
強(qiáng)力推薦:
天柏客戶關(guān)系管理系統(tǒng)
天柏客戶關(guān)系管理系統(tǒng)(CRM)是一款集專業(yè)性、實用性、易用性為一體的純B/S架構(gòu)的CRM系統(tǒng),它基于以客戶為中心的協(xié)同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實施以客戶滿意為目標(biāo)的營銷策略,通過企業(yè)級協(xié)同,有效的“發(fā)現(xiàn)、保持和留住客戶”,從而達(dá)到留住客戶、提高銷售,實現(xiàn)企業(yè)利潤最大化的目的。通過對客戶進(jìn)行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產(chǎn)品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業(yè)銷售、營銷、客戶服務(wù)和支持等與客戶關(guān)系有關(guān)的業(yè)務(wù)流程并提高各個環(huán)節(jié)的自動化程度,從而幫助企業(yè)達(dá)到縮短銷售周期、降低銷售成本、擴(kuò)大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機(jī)會和銷售渠道,最終從根本上提升企業(yè)的核心競爭力,使得企業(yè)在當(dāng)前激烈的競爭環(huán)境中立于不敗之地。
關(guān)鍵詞:CRM,CRM系統(tǒng),CRM軟件,客戶關(guān)系管理,客戶管理軟件,客戶管理系統(tǒng),客戶關(guān)系管理軟件,客戶關(guān)系管理系統(tǒng)