摘 要: 針對(duì)目前電子商務(wù)個(gè)性化推薦研究的不足,,提出準(zhǔn)確全面地獲取用戶(hù)獨(dú)特興趣愛(ài)好,、滿(mǎn)足用戶(hù)差異化需求的推薦服務(wù),同時(shí)構(gòu)建了具體的個(gè)性化推薦系統(tǒng)模型,,給出了基于協(xié)作過(guò)濾算法的電子商務(wù)個(gè)性化推薦的流程,、系統(tǒng)設(shè)計(jì)和系統(tǒng)實(shí)現(xiàn),從而有利于推動(dòng)電子商務(wù)的發(fā)展,。
關(guān)鍵詞: 個(gè)性化推薦,;用戶(hù)興趣模型;協(xié)作過(guò)濾
電子商務(wù)的迅速發(fā)展革命性地改變了人們的生產(chǎn)和生活方式,,對(duì)于個(gè)人可以做到足不出戶(hù)就獲得所需要的商品和服務(wù),,對(duì)于企業(yè)則轉(zhuǎn)變了傳統(tǒng)經(jīng)營(yíng)模式,通過(guò)網(wǎng)站為用戶(hù)提供一個(gè)直接,、迅速而且不受商品陳列空間限制的龐大的商品購(gòu)物平臺(tái)[1],。然而在享受互聯(lián)網(wǎng)技術(shù)推動(dòng)電子商務(wù)發(fā)展的便利的同時(shí),用戶(hù)也發(fā)現(xiàn)自己處于了“信息爆炸而知識(shí)貧乏”的困境之中,,也就是網(wǎng)站提供的品類(lèi)繁雜的商品和用戶(hù)相對(duì)單一的購(gòu)物需求之間的矛盾[2],。
因此電子商務(wù)網(wǎng)站希望通過(guò)應(yīng)用個(gè)性化推薦技術(shù)較準(zhǔn)確地預(yù)測(cè)用戶(hù)的購(gòu)物需求,并給用戶(hù)提供高質(zhì)量的推薦服務(wù),,以此來(lái)挖掘更多的潛在用戶(hù),,盡可能地將網(wǎng)站的瀏覽者轉(zhuǎn)化為購(gòu)買(mǎi)者,增強(qiáng)網(wǎng)站的關(guān)聯(lián)銷(xiāo)售能力,,提高用戶(hù)購(gòu)物的滿(mǎn)意度,,最終達(dá)到提高網(wǎng)站競(jìng)爭(zhēng)力,提高網(wǎng)站經(jīng)營(yíng)效益的目的,。本文就如何針對(duì)不同用戶(hù)提供差異化的服務(wù)做了研究并予以實(shí)現(xiàn)[3],。
電子商務(wù)個(gè)性化推薦系統(tǒng)以電子商務(wù)購(gòu)物網(wǎng)站為依托,根據(jù)已知的用戶(hù)信息(比如個(gè)人注冊(cè)信息,、歷史訪(fǎng)問(wèn)記錄,、評(píng)分記錄和訂單),利用推薦技術(shù)和算法,,分析用戶(hù)的消費(fèi)偏好,,為不同的用戶(hù)有針對(duì)性地推薦符合興趣的商品。個(gè)性化推薦技術(shù)作為推薦系統(tǒng)的核心,,是其重要的組成部分,。其基本思想是:首先找與他自身興趣比較相似的用戶(hù),然后將這些用戶(hù)感興趣的消費(fèi)內(nèi)容推薦給目標(biāo)用戶(hù),。其最大的優(yōu)點(diǎn)是對(duì)推薦對(duì)象沒(méi)有特殊的要求,,能處理非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)結(jié)構(gòu),如音頻,、視頻等,,也無(wú)需向基于內(nèi)容的推薦那樣去考慮推薦對(duì)象的內(nèi)容及關(guān)鍵字的抽取等。但也存在著數(shù)據(jù)稀疏,、冷啟動(dòng)等缺點(diǎn),。
1 系統(tǒng)總體設(shè)計(jì)
1.1 總體設(shè)計(jì)思想
基于協(xié)作過(guò)濾的個(gè)性化推薦系統(tǒng)是電子商務(wù)網(wǎng)站模擬了店鋪營(yíng)業(yè)員對(duì)用戶(hù)的推薦行為,盡可能準(zhǔn)確地獲取用戶(hù)的個(gè)性消費(fèi)愛(ài)好,,給不同用戶(hù)提供差異化的推薦服務(wù),。首先,需要建立一種合理的個(gè)性化推薦體系,,在該體系的指導(dǎo)下,,分析用戶(hù)的購(gòu)物行為進(jìn)而獲取用戶(hù)的興趣愛(ài)好數(shù)據(jù),構(gòu)建用戶(hù)興趣愛(ài)好模型,,并使用個(gè)性化推薦算法計(jì)算目標(biāo)用戶(hù)對(duì)每一個(gè)項(xiàng)目的期望值[4],。基于得出的用戶(hù)期望值,,個(gè)性化推薦系統(tǒng)就可以對(duì)不同的目標(biāo)用戶(hù)提供一種差異化的推薦服務(wù),。個(gè)性化推薦模型如圖1所示。
通過(guò)以上模型可知,,在本系統(tǒng)中主要涉及到3個(gè)角色,,分別是客戶(hù)端子系統(tǒng)、管理端子系統(tǒng)和個(gè)性化推薦子系統(tǒng),。而在作為核心部分的個(gè)性化推薦子系統(tǒng)中,,以用戶(hù)興趣愛(ài)好數(shù)據(jù)作為輸入?yún)?shù),使用協(xié)作過(guò)濾算法計(jì)算目標(biāo)用戶(hù)對(duì)項(xiàng)目的預(yù)測(cè)值[5],。
1.2 系統(tǒng)框架
個(gè)性化推薦系統(tǒng)基于用戶(hù)提交的興趣愛(ài)好信息和在購(gòu)物網(wǎng)站的瀏覽歷史信息提供個(gè)性化推薦服務(wù)和購(gòu)買(mǎi)建議,,其總體結(jié)構(gòu)分為前臺(tái)客戶(hù)端管理、后臺(tái)管理和個(gè)性化推薦3個(gè)模塊,。
2 系統(tǒng)應(yīng)用
2.1 客戶(hù)端子模塊
在個(gè)性化推薦系統(tǒng)中,,用戶(hù)作為最終的服務(wù)對(duì)象,參與了整個(gè)系統(tǒng)的服務(wù)過(guò)程,。在本模塊中,,用戶(hù)可以實(shí)現(xiàn)買(mǎi)賣(mài)交易,注冊(cè)成為本站的會(huì)員享受系統(tǒng)提供的個(gè)性化推薦服務(wù),,也可以對(duì)商品和店鋪根據(jù)提供的服務(wù)做出客觀(guān)評(píng)價(jià),。此外,,用戶(hù)可以申請(qǐng)?jiān)诒鞠到y(tǒng)開(kāi)啟自己的網(wǎng)上店鋪。
客戶(hù)端子系統(tǒng)的另一個(gè)重要功能就是根據(jù)用戶(hù)在本站的行為收集用戶(hù)的興趣愛(ài)好數(shù)據(jù),,并將其量化以建立用戶(hù)興趣模型,,作為個(gè)性化推薦系統(tǒng)向用戶(hù)提供推薦服務(wù)的有力依據(jù),保證推薦的高質(zhì)量和精準(zhǔn)性,。
2.2 管理端子模塊
為了確保系統(tǒng)的正常運(yùn)行,,電子商務(wù)個(gè)性化推薦系統(tǒng)需要具有一個(gè)后臺(tái)管理子系統(tǒng)對(duì)整個(gè)系統(tǒng)進(jìn)行配置管理。主要功能模塊包括:訂單管理,、會(huì)員管理,、權(quán)限管理、管理員登錄,、系統(tǒng)配置管理,、商品管理、店鋪管理,、廣告管理,、信息管理和個(gè)性化推薦模塊管理。
為了增加個(gè)性化推薦系統(tǒng)的推薦質(zhì)量,,加強(qiáng)推薦的彈性范圍,,系統(tǒng)還允許管理員在個(gè)性化推薦模塊管理及時(shí)修改算法閾值,從而更進(jìn)一步提供系統(tǒng)的靈活性和擴(kuò)展性,。
2.3 個(gè)性化推薦模塊
個(gè)性化推薦模塊遵循入-處理-輸出IPO(Input-Process-Output)模式[6],,作為系統(tǒng)的核心部分,主要由數(shù)據(jù)表述,、發(fā)現(xiàn)最近鄰居和產(chǎn)生推薦數(shù)據(jù)集[7]3個(gè)階段組成,,其基本架構(gòu)如圖2所示。
?。?)數(shù)據(jù)表述階段
數(shù)據(jù)表述階段最重要的是建立用戶(hù)興趣模型,。用戶(hù)興趣模型建立的第一步是獲取用戶(hù)興趣數(shù)據(jù),目前主要有兩種方法,。一種是顯式獲取,,即用戶(hù)主動(dòng)參與電子商務(wù)網(wǎng)站的反饋活動(dòng),要求用戶(hù)中斷正常的瀏覽行為對(duì)資源項(xiàng)目進(jìn)行評(píng)分,,這是獲取用戶(hù)興趣最佳的方式,,不足之處是,顯式獲取需要為用戶(hù)帶來(lái)了額外的負(fù)擔(dān),,匆忙中填寫(xiě)的反饋信息很大程度上并不能客觀(guān)地反映用戶(hù)偏好,。另一種是隱式獲取,主要是以Web使用挖掘,、人工智能和知識(shí)發(fā)現(xiàn)等理論為基礎(chǔ),,利用JavaScript,、AJAX等應(yīng)用技術(shù)分析用戶(hù)的瀏覽行為,獲取用戶(hù)興趣偏好并轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的過(guò)程,,它的優(yōu)勢(shì)主要在于整個(gè)過(guò)程不需要用戶(hù)的主動(dòng)參與,,不會(huì)中斷用戶(hù)正常的瀏覽行為,也不會(huì)給用戶(hù)帶來(lái)額外負(fù)擔(dān),,能夠得到比顯示反饋更豐富的用戶(hù)偏好信息,。因此,,這里采用“以顯式獲取用戶(hù)興趣愛(ài)好為主,,隱式獲取為輔,顯式和隱式相結(jié)合”的混合用戶(hù)興趣獲取方式[8],,避免了中文分詞帶來(lái)的誤差和關(guān)鍵字抽取,。將混合方式獲得的用戶(hù)興趣數(shù)據(jù)先進(jìn)行降噪處理,降低噪聲對(duì)用戶(hù)興趣數(shù)據(jù)的干擾,,比如在獲取用戶(hù)在某個(gè)頁(yè)面上停留的時(shí)間信息時(shí),,可能由于瀏覽者中途離開(kāi)而導(dǎo)致數(shù)據(jù)失效等。為了方便存儲(chǔ)和計(jì)算,,對(duì)用戶(hù)興趣數(shù)據(jù)經(jīng)過(guò)降噪處理,,轉(zhuǎn)換成相應(yīng)的用戶(hù)對(duì)資源項(xiàng)目的評(píng)分,從而構(gòu)建了用戶(hù)興趣模型,。
本文借鑒MovieLens系統(tǒng)的用戶(hù)評(píng)分規(guī)則[1],,設(shè)定用戶(hù)顯式評(píng)分是一個(gè)0~5之間的數(shù)字,以0.5作為間隔共分為11個(gè)檔次,,表示用戶(hù)對(duì)商品的個(gè)性化偏好程度,,其轉(zhuǎn)換規(guī)則如下。
?、儆脩?hù)u購(gòu)買(mǎi)了某商品k但未評(píng)分,,則Ru,k=3.0,。
?、谟脩?hù)u對(duì)商品k的評(píng)分為score,則Ru,,k=score,。
③用戶(hù)點(diǎn)擊商品k的次數(shù)n與給定的除“0”外的10個(gè)分?jǐn)?shù)檔對(duì)應(yīng),,則Ru,,k=n×0.5,若Ru,,k>5.0則Ru,,k=5.0,。
④獲取時(shí)間與推測(cè)隱式評(píng)分對(duì)應(yīng)關(guān)系如下:
Ru,,k=1 (5≤t<10)2 (5≤t<10)3 (5≤t<10)4 (5≤t<10)5 (5≤t<10)
?、萜渌闆r下,Ru,,k=0,。
在一個(gè)典型的基于協(xié)作過(guò)濾技術(shù)的個(gè)性化推薦系統(tǒng)中,用戶(hù)興趣模型通常被表示為一個(gè)m×n的用戶(hù)-項(xiàng)目評(píng)估矩陣R,,m是用戶(hù)數(shù),,n是項(xiàng)數(shù),rij是第i個(gè)用戶(hù)對(duì)第j個(gè)項(xiàng)目的評(píng)估數(shù)值,,其具體值由顯式和隱式用戶(hù)興趣獲取的數(shù)據(jù)轉(zhuǎn)換得來(lái)[6],。用戶(hù)-項(xiàng)目評(píng)估矩陣R如表1所示。
?。?)發(fā)現(xiàn)最近鄰居集階段
用戶(hù)興趣模型建立后,,系統(tǒng)根據(jù)用戶(hù)興趣模型計(jì)算每一位用戶(hù)的用戶(hù)相似度,通過(guò)度量目標(biāo)用戶(hù)與所有候選鄰居間的相似度,,產(chǎn)生基于協(xié)作過(guò)濾的top-n鄰居用戶(hù)集,,然后根據(jù)這個(gè)鄰居用戶(hù)集,結(jié)合協(xié)作過(guò)濾推薦算法,,對(duì)用戶(hù)作出個(gè)性化推薦服務(wù)和購(gòu)買(mǎi)建議,。其中協(xié)作過(guò)濾推薦的示意圖如圖3所示。
協(xié)作過(guò)濾算法是目前使用最多,、應(yīng)用最成熟的推薦技術(shù),。它的應(yīng)用前提是:假設(shè)存在具有相似興趣偏好的用戶(hù)群,每個(gè)用戶(hù)都有與其興趣偏好相似的鄰居用戶(hù),。預(yù)測(cè)用戶(hù)對(duì)某一項(xiàng)目的偏好是根據(jù)鄰居用戶(hù)的偏好程度計(jì)算的,,也就是以屬性或興趣相近的用戶(hù)建議作為個(gè)性化推薦的基礎(chǔ)。協(xié)作過(guò)濾算法最大的優(yōu)勢(shì)在于不需要分析對(duì)象的特征屬性,,所以對(duì)推薦沒(méi)有特殊要求,,能處理非結(jié)構(gòu)化的復(fù)雜對(duì)象,如音頻,、視頻等[8],。
基于協(xié)作過(guò)濾推薦的上述優(yōu)點(diǎn),本文也采用協(xié)作過(guò)濾算法產(chǎn)生推薦,。協(xié)作過(guò)濾算法有基于用戶(hù)(User-based)協(xié)作過(guò)濾算法和基于項(xiàng)目(Item-based)協(xié)作過(guò)濾兩種[9],。這里分別采用基于用戶(hù)協(xié)作過(guò)濾算法和基于項(xiàng)目協(xié)作過(guò)濾算法兩種方式產(chǎn)生推薦。采用余弦相似性算法計(jì)算用戶(hù)相似度,它既可以用于基于用戶(hù)的協(xié)作過(guò)濾中,,也可以用于基于項(xiàng)目的協(xié)作過(guò)濾系統(tǒng)中,。此方法是將用戶(hù)評(píng)分看作n維向量項(xiàng)目空間上的向量,如果用戶(hù)對(duì)項(xiàng)目沒(méi)有進(jìn)行評(píng)分,,則將評(píng)分設(shè)置為默認(rèn)值0,,用戶(hù)間的相似性通過(guò)向量間的余弦?jiàn)A角來(lái)度量。余弦值越大表示用戶(hù)的相似程度越高,。設(shè)用戶(hù)i和用戶(hù)j在n維向量空間上的評(píng)分分別表示為向量和,,則用戶(hù)i和用戶(hù)j之間的相似性sim(i,j)為:
采用余弦性算法的用戶(hù)相似度處理過(guò)程如下:
輸入:用戶(hù)i和用戶(hù)j關(guān)于所有項(xiàng)目的評(píng)分
輸出:用戶(hù)i和用戶(hù)j的相似度
算法步驟:
第一步:判斷用戶(hù)i和用戶(hù)j的合法性,。
第二步:初始化sum(x2),、sum(y2)、sum(xy)分別為0,,n為項(xiàng)目個(gè)數(shù),。
第三步:計(jì)算sum(x2),、sum(y2),、sum(xy)的值:
for 每一條項(xiàng)目記錄
do
x=i1;y=j1,;
if x,,y都不為空
sum(x,y)+=x*y,;
sum(x2)+=x*x,;
sum(y2)+=y*y;
end if
end do
return sum(x,,y)/(sqrt(sum(x2))*sqrt(sum(y2))),;
將以上使用余弦相似性算法得到用戶(hù)X和用戶(hù)Y的相似度進(jìn)行降序排序,取前k個(gè)用戶(hù)做為目標(biāo)用戶(hù)的k鄰居用戶(hù)群,。
?。?)產(chǎn)生推薦數(shù)據(jù)集階段
在得到最近鄰居用戶(hù)集數(shù)據(jù)后,接下來(lái)根據(jù)計(jì)算出來(lái)的最近鄰居集預(yù)測(cè)評(píng)分并給目標(biāo)用戶(hù)產(chǎn)生推薦結(jié)果,。設(shè)目標(biāo)用戶(hù)u的最近鄰居集合用Tu表示,,則目標(biāo)用戶(hù)u對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分Pu,i可以通過(guò)用戶(hù)u對(duì)最近鄰居集Tu中項(xiàng)目的評(píng)分得到,,其中Pu,,i的計(jì)算方法如下:
上式中sim(u,n)表示用戶(hù)u與n之間的相似程度,,Rn,,i表示用戶(hù)n對(duì)項(xiàng)目i的評(píng)分,u和n分別表示用戶(hù)u和用戶(hù)n對(duì)項(xiàng)目的平均評(píng)分。通過(guò)上述方法計(jì)算用戶(hù)對(duì)所有未評(píng)分的項(xiàng)目的評(píng)分,,然后選擇其中預(yù)測(cè)評(píng)分最高的前若干項(xiàng)(top-n)作為推薦結(jié)果給當(dāng)前用戶(hù)[10],,通過(guò)這樣的基于用戶(hù)興趣相似度的推薦,網(wǎng)站就可以在恰當(dāng)?shù)臅r(shí)間向不同的用戶(hù)推薦合適的商品,。
基于項(xiàng)目的協(xié)作過(guò)濾推薦算法和基于用戶(hù)的協(xié)作過(guò)濾推薦算法基本一致,,且由于資源項(xiàng)目的相對(duì)靜態(tài)性,因此它的計(jì)算相對(duì)簡(jiǎn)單,。這里不再描述,。
基于協(xié)作過(guò)濾算法的電子商務(wù)個(gè)性化推薦系統(tǒng)改進(jìn)了傳統(tǒng)的基于文本的推薦技術(shù),擴(kuò)大了推薦范圍,,提高了推薦質(zhì)量,,單渠道用戶(hù)興趣獲取模式變成了多渠道用戶(hù)興趣獲取模式,既避免了顯式用戶(hù)興趣獲取時(shí)帶來(lái)的不良用戶(hù)體驗(yàn),,也消除了單純顯式獲取用戶(hù)興趣數(shù)據(jù)導(dǎo)致的數(shù)據(jù)稀疏性問(wèn)題,。
參考文獻(xiàn)
[1] Chong Jiang. Research of an e-commerce personalized recommendation system[D]. Changsha: Central South University, 2009.
[2] Ting Wen. Research of mining personalized service based on Web content and Log[D]. Dalian: Dalian University of Technology,, 2007.
[3] Zhao Liang,, Hu Naijing, Zhang Shouzhi. Design of personalized recommendation algorithm[J]. Computer Research and Development,, 2002:78-84.
[4] Li Dandan. Research of an e-commerce personalized recommendation based on hybrid algorithm[D]. Tianjing: Tianjing Finance University,, 2008.
[5] Jie Yang. Appliation and research of an personalized recommendation system[D]. Beijing: University of Science and Technoloy of China, 2009.
[6] Wei Lu. Application of an e-commerce personalized recommendation system based on collaborative filtering algorithm[D].Beijing: Beijing University of Posts and Telecommunications,, 2007.
[7] MASSA P,, AVESANI P. Trust-aware collaborative filtering for recommender systems[C]. Proceedings of International Conference on Cooperative Information Systems, 2004:240-249.
[8] BADRUL SARWAR,, GEORGE KARYPIS,, JOSEPH KONSTAN, et al. Item-Based collaborative filtering recommendation Algorithms[C]. Proceedings of the Tenth International Conference on World Wide Web,, 2003:285-295.
[9] CHEN Y L,, CHENG L C. A novel collaborative filtering approach for recommending ranked items[J]. Expert System with Applications, 2008,,34(4):2396-2405.
[10] ADOMAVICIUS G,, TUZHILIN A. Towad the next generation of recommender systems:A survey of-the state-of-the—art and possible extensions[J]. IEEE Transaction on Knowledge and Data Engineering, 2005,, 17(6):734-749.