摘 要: 利用基于RFM模型的自組織特征映射神經(jīng)網(wǎng)絡(luò)(Self-Organizing Feature Map,SOM)對(duì)移動(dòng)客戶進(jìn)行細(xì)分,,可以有效地解決各類別特征不明顯,、特征參數(shù)相互交錯(cuò)、非線性分布的類型識(shí)別問題,。研究過程中將客戶的屬性劃分為近度,、頻度、值度三個(gè)指標(biāo),,模擬專家分類的功能,,根據(jù)各個(gè)客戶簇的特征進(jìn)一步分析客戶的終身價(jià)值,量化分析客戶的重要性,。最后利用相關(guān)的市場營銷知識(shí)對(duì)各個(gè)客戶類別提出相應(yīng)的營銷策略方案,。
關(guān)鍵詞: SOM神經(jīng)網(wǎng)絡(luò);RFM模型,;移動(dòng)通信,;客戶細(xì)分;營銷策略
0 引言
客戶細(xì)分(Customer Segmentation)是指將一個(gè)大的客戶群體劃分成一個(gè)個(gè)細(xì)分群的動(dòng)作[1],。常用的客戶分類算法主要有K-means聚類算法,、決策樹算法、BP神經(jīng)網(wǎng)絡(luò)算法,、粒子群優(yōu)化(PSO)算法和自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM)算法,。本文采用基于RFM模型的SOM神經(jīng)網(wǎng)絡(luò)對(duì)移動(dòng)客戶進(jìn)行細(xì)分。自組織特征映射神經(jīng)網(wǎng)絡(luò)(Self-Organizing Feature Maps,,SOM)是由芬蘭赫爾辛基大學(xué)神經(jīng)網(wǎng)絡(luò)專家Kohonen教授在1981年提出的,。Kohonen認(rèn)為[2],當(dāng)神經(jīng)網(wǎng)絡(luò)接受外界輸入模式時(shí)將會(huì)分為不同的區(qū)域,,各區(qū)域?qū)斎肽J接凶詣?dòng)完成不同的響應(yīng)特征,,即無導(dǎo)師的學(xué)習(xí)并自動(dòng)聚類。吳春旭等[3]曾利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)電信客戶進(jìn)行細(xì)分并證明分類的有效性,。林盛等[4]曾利用RFM的模型對(duì)客戶進(jìn)行細(xì)分,,并使用K-均值聚類法,但K值需要事先給定,,而K值的選定非常難以估計(jì),。本文之所以選擇SOM神經(jīng)網(wǎng)絡(luò)對(duì)移動(dòng)客戶進(jìn)行細(xì)分,主要有三個(gè)方面的原因,,一是它的性能比較好,,可以處理大量的數(shù)據(jù)集;二是它對(duì)孤立點(diǎn)不敏感[5],;三是它可以自動(dòng)地進(jìn)行權(quán)值的調(diào)整,,同時(shí)通過優(yōu)化學(xué)習(xí)率,使其快速收斂,。
近年來,,關(guān)于SOM神經(jīng)網(wǎng)絡(luò)的應(yīng)用研究很廣泛。楊于峰等[6]利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)品牌丑聞在微博上的傳播進(jìn)行分類預(yù)測,。他們直接將RFM模型進(jìn)行細(xì)化,,利用客戶的動(dòng)態(tài)變化屬性進(jìn)行聚類。張靜[7]在基于SOM的變壓器故障診斷研究中,,與DGA方法進(jìn)行比較,,結(jié)果表明前者的分類結(jié)果準(zhǔn)確且快速。孫進(jìn)進(jìn)和王苗苗[8]將SOM神經(jīng)網(wǎng)絡(luò)對(duì)民用機(jī)場進(jìn)行分類,,更好地分析各個(gè)機(jī)場的特性,。張吉?jiǎng)偟萚9]利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)高校教師職稱進(jìn)行評(píng)審,使得評(píng)價(jià)結(jié)果更加客觀和準(zhǔn)確,。由此可知,,根據(jù)研究對(duì)象的特殊性,可以建立RFM模型進(jìn)行聚類,,也可以直接對(duì)RFM指標(biāo)進(jìn)行具體化后再聚類,,其結(jié)果都證明了SOM神經(jīng)網(wǎng)絡(luò)聚類結(jié)果的準(zhǔn)確性和客觀性。
1 移動(dòng)通信行業(yè)客戶RFM商業(yè)模型
客戶分類的常用方法有基于指標(biāo)組合和基于顧客利潤率的客戶分類方法[10],。Arthur Hughes研究指出客戶數(shù)據(jù)庫中的RFM是數(shù)據(jù)分析的最好指標(biāo),,而RFM的細(xì)分依據(jù)又是客戶的消費(fèi)行為。因此,,本文選用RFM指標(biāo)模型對(duì)移動(dòng)客戶進(jìn)行細(xì)分,。RFM模型[11]中的三個(gè)常用指標(biāo)分別為:近度(Recency)、頻度(Frequency),、值度(Monentary),。傳統(tǒng)的RFM模式中,近度指最近一次購買到現(xiàn)在的時(shí)間間隔,。頻度指一定時(shí)間內(nèi)的購買頻率,。值度指購買的金額。針對(duì)移動(dòng)通信行業(yè)的特殊性,,本文改用客戶在六個(gè)月內(nèi)的繳費(fèi)情況來代替客戶的消費(fèi)行為,??蛻舻腞FM指標(biāo)分別是最近一次繳費(fèi)距離調(diào)查日的時(shí)間間隔、繳費(fèi)的次數(shù)以及繳費(fèi)的總額,。這樣選取代替指標(biāo)的理由是:首先,,繳費(fèi)時(shí)間間隔一般比較大,用它代替消費(fèi)近度,,可以避免消費(fèi)近度難以區(qū)別的問題,;其次,消費(fèi)頻度高但是繳費(fèi)次數(shù)不是很多,,用繳費(fèi)次數(shù)代替消費(fèi)的頻度可以減少對(duì)消費(fèi)頻度統(tǒng)計(jì)的工作量,;最后,客戶的消費(fèi)總額等于繳費(fèi)總額,。以下是本文采用的RFM指標(biāo)與傳統(tǒng)RFM指標(biāo)的對(duì)比,,如表1所示。
2 SOM建模
2.1 網(wǎng)絡(luò)模型
芬蘭學(xué)者T.Kohonen于1981年提出了SOM神經(jīng)網(wǎng)絡(luò)[2],,并給出SOM神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)模型,。如圖1。
由圖1可以看到,,SOM神經(jīng)網(wǎng)絡(luò)是由輸入層和輸出層構(gòu)成,。輸入層的神經(jīng)元個(gè)數(shù)為n,由輸入向量的維數(shù)決定,。輸出層的神經(jīng)元個(gè)數(shù)為m,,一般按照二維點(diǎn)陣進(jìn)行排列。其中,,輸入層和輸出層的神經(jīng)元之間通過權(quán)值進(jìn)行全連接,,且輸出層的神經(jīng)元之間也相互通過權(quán)值連接。
2.2 SOM神經(jīng)網(wǎng)絡(luò)的算法流程
SOM神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)主要分為如下8個(gè)步驟:
?。?)初始化[12],。首先,將[0,,1]區(qū)間內(nèi)的隨機(jī)值賦給神經(jīng)網(wǎng)絡(luò)的連接權(quán),,令i=1,2,,3,,…,N,,j=1,,2,3,…,,M,;其次,確定學(xué)習(xí)率(t)的初始值(0)(0<(0)<1),;最后以獲勝神經(jīng)元C為中心確定學(xué)習(xí)領(lǐng)域Nc(t),,該區(qū)域一般是正方形或圓形區(qū)域[12],,如圖2所示,。Nc(t)為第t次學(xué)習(xí)過程中該領(lǐng)域所包含的神經(jīng)元個(gè)數(shù),設(shè)達(dá)到最優(yōu)結(jié)果時(shí)總的學(xué)習(xí)次數(shù)為T,。
?。?)歸一化。從訓(xùn)練數(shù)據(jù)集合中隨機(jī)抽取一個(gè)輸入向量(p=1,,2,,3,…,,n),,n代表輸入模式的維數(shù),也即輸入向量的變量個(gè)數(shù),。
?。?)預(yù)處理神經(jīng)元之間的連接權(quán)值,分別計(jì)算它們與輸入對(duì)應(yīng)向量之間的歐式距離djk,,把其中與距離最小的神經(jīng)元C作為獲勝神經(jīng)元,。
(4)自動(dòng)更新神經(jīng)元C的學(xué)習(xí)半徑,,調(diào)整輸出節(jié)點(diǎn)的連接權(quán)值向量,,權(quán)值調(diào)整如下:
(5)調(diào)整完成后輸入訓(xùn)練集合中下一個(gè)神經(jīng)網(wǎng)絡(luò)的矢量Xp+1,。
?。?)令t=t+1,更新學(xué)習(xí)率并選取另一組訓(xùn)練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,,返回步驟(3)繼續(xù)循環(huán)操作,。
(7)當(dāng)t=T時(shí),,結(jié)束訓(xùn)練算法,。
(8)輸入測試樣本,,如果預(yù)測結(jié)果輸出與期望結(jié)果基本一致,,則網(wǎng)絡(luò)訓(xùn)練成功并結(jié)束訓(xùn)練,否則重新調(diào)整網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)并繼續(xù)訓(xùn)練。
最后,,SOM神經(jīng)網(wǎng)絡(luò)的輸出如下:
3 案例分析
3.1 Kohonen網(wǎng)絡(luò)的構(gòu)建
本文采用Kohonen網(wǎng)絡(luò)模型:輸入層節(jié)點(diǎn)數(shù)Inum=3,,即輸入向量為三維;競爭層呈二維方陣排列,,總節(jié)點(diǎn)數(shù)K=36,;輸出層的節(jié)點(diǎn)數(shù)g=6,即客戶類別數(shù),。初始化輸入層的學(xué)習(xí)率為rate1min=0.01,,rate1max=0.1;初始化輸出層學(xué)習(xí)率rate2min=0.5,,rate2max=1,;初始化學(xué)習(xí)半徑r1min=0.4,r1max=0.5,。輸入層神經(jīng)元與競爭層神經(jīng)元之間的連接權(quán)值1=rand(Inum,,k),競爭層各個(gè)神經(jīng)元與輸出節(jié)點(diǎn)神經(jīng)元之間的連接權(quán)值2=(K,,g),,迭代次數(shù)maxgen=10 000。計(jì)算最優(yōu)節(jié)點(diǎn)[mindist,,index]=min(dist(x,,1))。
3.2 基于RFM模型客戶分類思想
基于RFM模型的客戶細(xì)分指導(dǎo)思想主要包括了以下六個(gè)步驟:
?。?)根據(jù)專家分析結(jié)果確定RFM的權(quán)值[4],,[R,F,,M]=[0.221,,0.341,0.439],;
?。?)根據(jù)客戶的RFM權(quán)值進(jìn)行加權(quán)和劃分,并利用SOM的自動(dòng)聚類功能得到多個(gè)客戶簇,;
?。?)分別計(jì)算全部客戶的總RFM平均值和各個(gè)客戶簇的RFM平均值;
?。?)把各個(gè)客戶簇的RFM平均值與全部客戶的RFM總平均值相比較,,比較結(jié)果為小于或大于(等于)總平均值,從而確定各個(gè)客戶簇的RFM的變動(dòng)情況(大于(等于)的用“↑”表示,,小于的用“↓”表示),;
(5)借鑒現(xiàn)有的客戶分類方法,根據(jù)每個(gè)客戶簇的RFM變動(dòng)情況分析該類客戶的類型,;
?。?)將確定好客戶類型的客戶數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù)兩部分,最后使用已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)未知客戶進(jìn)行分類,。
3.3 樣本客戶的分類結(jié)果
根據(jù)研究需要收集了廣西大學(xué)的3 200名移動(dòng)用戶最近6個(gè)月的消費(fèi)情況,,將采集的數(shù)據(jù)進(jìn)行預(yù)處理后,利用RFM各指標(biāo)劃分客戶類別,,接著將每類客戶的RFM各指標(biāo)的平均值與總RFM平均值作比較,,通過對(duì)比得到每類客戶RFM的變動(dòng)情況并確定客戶的類型。將事先模擬專家分好類別的3 000份客戶數(shù)據(jù)作為訓(xùn)練樣本,,另外200個(gè)作為預(yù)測樣本,。表2是訓(xùn)練樣本客戶的分類結(jié)果,。
3.4 網(wǎng)絡(luò)模型的測試和分類
3.4.1 測試
確定創(chuàng)建網(wǎng)絡(luò)模型的結(jié)構(gòu)后,,利用MATLAB工具箱中的new函數(shù)建立一個(gè)SOM神經(jīng)網(wǎng)絡(luò);將準(zhǔn)備好的樣本輸入到網(wǎng)絡(luò)中,,利用train函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,,用仿真函數(shù)sim對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)測輸出仿真。利用事先模擬專家分好類別的200個(gè)測試數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)測試,,圖3和圖4分別為SOM網(wǎng)絡(luò)模型對(duì)200個(gè)預(yù)測樣本數(shù)據(jù)進(jìn)行分類的結(jié)果圖和誤差分析圖,。
圖3中,黑色小圓圈表示網(wǎng)絡(luò)預(yù)測客戶類別,,黑色小星點(diǎn)表示模擬專家得到的客戶類別,。當(dāng)黑色小圓圈與黑色小星點(diǎn)重合時(shí),表明網(wǎng)絡(luò)預(yù)測輸出的結(jié)果與實(shí)際結(jié)果相一致,;反之亦然,。由圖可知,該SOM神經(jīng)網(wǎng)絡(luò)對(duì)客戶細(xì)分模型的預(yù)測輸出是有效的,。
3.4.2 對(duì)隨機(jī)輸入的未知客戶數(shù)據(jù)進(jìn)行分類
確定該SOM神經(jīng)網(wǎng)絡(luò)已訓(xùn)練好之后,,把2 000個(gè)未知類別的客戶數(shù)據(jù)投到該神經(jīng)網(wǎng)絡(luò)模型中分類,最終確定客戶的類別,。如表3所示,。
表3是該SOM神經(jīng)網(wǎng)絡(luò)對(duì)2 000個(gè)未知客戶進(jìn)行分類的結(jié)果,共分為五種客戶類型,,但該分類結(jié)果還無法確定各類客戶之間的價(jià)值和重要性的差別,。比如,對(duì)于客戶簇5,、6,,都是重要保持類客戶。這就需要分析各類客戶的終身價(jià)值[13],并根據(jù)其大小進(jìn)行排序,,以此作為客戶重要性分析的參考,。顧客的終身價(jià)值運(yùn)算公式為:
其中,CIk是第k類客戶的RFM各指標(biāo)加權(quán)后的總得分,,wR,、wF、wM分別表示R,、F,、M指標(biāo)的權(quán)值,CRk,、CFk,、CMk分別表示第k類客戶的R、F,、M各指標(biāo)標(biāo)準(zhǔn)化后的平均值,。RFM各指標(biāo)的標(biāo)準(zhǔn)化運(yùn)算公式為:
其中,RL和RS分別表示指標(biāo)R的最大和最小值,,F(xiàn)和M的表示相類似,。
最后,根據(jù)加權(quán)總分的大小對(duì)各類客戶進(jìn)行排序,,總分越大則表明客戶的終身價(jià)值越高,,忠誠度也越高,客戶相對(duì)更重要,。表4為客戶類別終身價(jià)值排序結(jié)果,。
由表4可知,客戶簇6的排名第一,,故客戶簇6是企業(yè)最具價(jià)值的客戶,;而客戶簇1的排名最后,其價(jià)值最低,??蛻舸?為重要發(fā)展客戶,但因其價(jià)值無法立即顯現(xiàn),,因而企業(yè)不應(yīng)將有限的資源過多地投到它身上,。客戶簇2的近度高,,但是值度很小,,屬于忠誠度很低的客戶,所以企業(yè)應(yīng)該讓其自然發(fā)展,??蛻舸?的終身價(jià)值排在第四,,它們的近度提高了,同時(shí)值度也跟著提高,,說明這類客戶對(duì)企業(yè)的信賴和忠誠在慢慢地提高,,企業(yè)可以適當(dāng)?shù)貙?duì)其推銷一些服務(wù)套餐??蛻舸?的近度和頻度都在減小,,但是其值度增加,同時(shí)它的終身價(jià)值排名居中,,因此屬于忠誠度很高的客戶,,企業(yè)應(yīng)該重點(diǎn)挽留。對(duì)于同一類別的客戶簇5和6,,從表4可看出,,在客戶價(jià)值上客戶簇6大于客戶簇5。企業(yè)應(yīng)該主動(dòng)與這類客戶進(jìn)行回訪,,尤其是了解客戶簇6的需求,,提高該類客戶的忠誠度及消費(fèi)金額,為企業(yè)帶來更大的利潤,。
4 總結(jié)與展望
本文利用移動(dòng)客戶的RFM指標(biāo)對(duì)其進(jìn)行細(xì)分,,并分析各個(gè)客戶簇的特征,在原有的分類基礎(chǔ)上進(jìn)一步計(jì)算客戶的終身價(jià)值指標(biāo),,并對(duì)每一類客戶的重要性進(jìn)行排序,根據(jù)其重要性排序得到了六類客戶,,并對(duì)這六類客戶分別提出了一些針對(duì)性的營銷建議,,企業(yè)可以根據(jù)客戶的重要程度以及客戶的類型實(shí)施個(gè)性化的服務(wù)和營銷。
但是,,本文的研究還有很多需要改進(jìn)的地方,。比如,其中權(quán)值的調(diào)整只考慮了學(xué)習(xí)率及輸入模式與獲勝神經(jīng)元及其鄰域,,卻忽略了輸入模式分量與全體參與競爭的神經(jīng)元權(quán)值向量間的某種相關(guān)關(guān)系,。因此,本文的后續(xù)工作是在原有的基礎(chǔ)上改進(jìn)和完善更適用于移動(dòng)網(wǎng)絡(luò)客戶分類的神經(jīng)網(wǎng)絡(luò)算法,,使細(xì)分結(jié)果更加有效,、準(zhǔn)確。
參考文獻(xiàn)
[1] 科特勒.市場營銷管理(上)[M].北京:中國人民大學(xué)出版社,,1996.
[2] KOHONEN T. Self-organized formation of topologically correct feature maps[J]. Biological Cybernetics,,1982, 43(1):59-69.
[3] 吳春旭,,鮑滿園,,茍清龍.自組織映射聚類算法在電信客戶細(xì)分中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,,2010,19(8):168-172.
[4] 林盛,,肖旭.基于RFM的電信客戶市場細(xì)分方法[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),,2006,38(5):759-760.
[5] 呂昱,,程代杰.基于SOM的市場細(xì)分研究[J].計(jì)算機(jī)科學(xué),,2005,32(12):98-100.
[6] 楊于峰,,余偉萍,,田盼.基于SOM神經(jīng)網(wǎng)絡(luò)的品牌丑聞微博傳播分類預(yù)測研究[J].情報(bào)雜志,2013,,32(10):24-28.
[7] 張靜.基于SOM的變壓器故障診斷研究[J].電力學(xué)報(bào),,2014,29(4):319-321.
[8] 孫進(jìn)進(jìn),,王苗苗.基于SOM神經(jīng)網(wǎng)絡(luò)的民用機(jī)場分類方法[J].交通科技與經(jīng)濟(jì),,2013,15(5):83-84.
[9] 張吉?jiǎng)?,梁娜.SOM網(wǎng)絡(luò)在高校教師職稱評(píng)審中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,,2013,41(2):322-323.
[10] 陳伯成.自組織映射神經(jīng)網(wǎng)絡(luò)在客戶分類中的一種應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,,2004,,24(3):9-14.
[11] CHEN Y L, KUO M H,, WU S Y,, et al. Discovering recency, frequency,, and monetary(RFM)sequential patterns from customers′ purchasing data[J]. Electronic Commerce Research and Applications,, 2009,8(5):241-251.
[12] 聞新,,周露,,王丹力,等.Matlab神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:科學(xué)出版社,,2002.
[13] 胡理增,,薛恒新,于信陽.以客戶終身價(jià)值為準(zhǔn)則的客戶重要程度識(shí)別系統(tǒng)[J].系統(tǒng)工程理論與實(shí)踐,,2005,,25(11):80-85.