電信客戶流失數據挖掘論文

時間:2022-06-24 09:51:05

導語:電信客戶流失數據挖掘論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

電信客戶流失數據挖掘論文

1數據挖掘概述

數據挖掘(DataMining)是一種決策支持的過程,是從看似雜亂無章的海量數據中,利用人工智能、模式識別、機器學習、數據庫、統計學等技術高效的分析企業龐大的數據庫,從中找出有價值的事件,進行合理的歸納性推理,挖掘出潛在的模式,幫助決策者做出正確的決策。

2客戶流失的概述

2.1客戶流失的理解

流失的客戶分為主動流失和被動流失。主動流失是因為客戶自身的原因導致的流失,例如各個運營商之間的競爭,客戶的搬遷、學生畢業等因素。被動流失是指客戶由于欠費時間較長或者與運營商簽訂的合同到期后不再續約等因素,從而運營商終止向客戶提供服務的行為。對于銅川聯通公司,把用戶狀態為“鎖定期”、“強拆銷號”、“退網停機”、“預登錄停機”、“欠費服務暫停”等定義為流失的客戶或即將流失的客戶。數據挖掘的目標是通過挖掘出來的結果降低客戶流失率,分析各項因素對客戶流失的影響,用最小的成本最大程度的挽留客戶。

2.2電信客戶流失分析的特點

(1)電信客戶的數據量大、實時性強、邏輯復雜,使用歷史數據來進行數據挖掘,結果往往會存在較大的偏差。(2)數據預處理工作需要收集大量雜亂無章的原始數據來進行處理,工作量非常大,通常需要花費一個項目大多數的時間。(3)國內電信企業的客戶流失率大約在1%~3%左右,不適合直接采用某種模型,而需要增加流失客戶的比例,但這樣就會存在抽樣過度的風險。(4)需要考慮到多方面的平衡:首先,預測的準確性,并兼顧可理解性;其次,營銷成本的收益問題和客戶挽留的價值。

3電信企業客戶流失分析的數據挖掘過程

3.1數據挖掘的模型選擇

在實踐應用中,神經網絡算法和決策樹算法在客戶流失預測的問題上都具有較高的精確度和準確性。

3.1.1決策樹算法

決策樹的優點:能夠形成容易理解的規則并且能很好的進行歸納分類;缺點:預處理較多,對于數據信息不能充分利用,在數據類別較多的情況下,錯誤率也高。

3.1.2神經網絡算法

神經網絡的優點:在自適應、自組織、自學習等能力較強,抗干擾能力和互補性也較強。缺點:解釋性差。決策樹算法和神經網絡算法各有特點,但對于解決客戶流失的問題而言,決策樹算法更容易被人們理解和接受,但在預測結果的準確性和精確度較差,而神經網絡算法可以彌補這一缺點,提高預測模型的準確度。因此,在實踐當中,如果將兩種算法結合起來應用,那么會對預測客戶流失的實際效果方面起到更大的作用。

3.2數據準備

數據挖掘項目中,數據準備階段及其重要,在整個挖掘壞境中也工作量最大。本次研究中,采取的是陜西銅川聯通公司2013年11月的數據,數據量龐大,主要來自計費系統,其中包括客戶基本信息、消費行為特征、通話行為特征,欠費等。

4結束語

要在龐大的數據中找出有流失傾向和流失的客戶幾乎是不可能的事,在使用SPSS/Clementine進行數據挖掘建模后,客戶挖掘的準確率達到98%,為電信企業做出決策起到很大的作用,從而可以制定相應措施挽留一些有價值的客戶。數據挖掘技術在電信行業的廣泛應用將會使更多的電信企業從源頭上緩解客戶流失所帶來的損失,能在很大程度上避免許多損失,在激烈的市場競爭中立于不敗之地。

作者:楊逸凡 趙夏 單位:蘭州財經大學