摘 要: 分析了當(dāng)前空間信息服務(wù)在個(gè)性化推薦方面所存在的問(wèn)題,充分考慮用戶(hù)行為對(duì)空間信息服務(wù)個(gè)性化推薦的約束,,匹配過(guò)程中的“需求”與空間信息服務(wù)“操作”的映射關(guān)系,,提出針對(duì)不同用戶(hù)需求的空間信息服務(wù)三層模型。該模型將用戶(hù)的歷史操作抽象為二元組,,以此二元組作為約束條件,,通過(guò)語(yǔ)義的相似度匹配,有效且準(zhǔn)確地進(jìn)行空間信息服務(wù)的個(gè)性化推薦,。
關(guān)鍵詞: 空間信息服務(wù),;三層模型;個(gè)性化推薦
人類(lèi)社會(huì)進(jìn)入信息時(shí)代,,服務(wù)提供商提供的規(guī)范化,、標(biāo)準(zhǔn)化服務(wù)并不能滿(mǎn)足用戶(hù)的差異性需求。個(gè)性化服務(wù)通過(guò)收集和分析用戶(hù)信息來(lái)學(xué)習(xí)用戶(hù)的興趣和行為,,從而實(shí)現(xiàn)主動(dòng)推薦的目的[1],,成為目前研究的熱點(diǎn)。
國(guó)內(nèi)外研究人員對(duì)空間信息服務(wù)匹配[2-4],、空間信息服務(wù)組合[5-7],、空間信息服務(wù)質(zhì)量評(píng)價(jià)[8]以及個(gè)性化系統(tǒng)中用戶(hù)建模[9-12]等方面進(jìn)行了大量研究。這些研究主要關(guān)注于如何對(duì)空間信息服務(wù)進(jìn)行語(yǔ)義表達(dá),、空間信息服務(wù)的有效匹配,、服務(wù)組合的有序展開(kāi)以及怎樣通過(guò)各種質(zhì)量屬性參數(shù)來(lái)衡量服務(wù)的好壞等。然而它們卻存在著一個(gè)共同的問(wèn)題,,即都是面向服務(wù)本身,,忽略了用戶(hù)需求,,分離用戶(hù)與服務(wù)兩者之間的映射關(guān)系,,使得每個(gè)服務(wù)的匹配沒(méi)有結(jié)合其用戶(hù)的需求而獨(dú)立進(jìn)行或是僅僅憑借用戶(hù)所輸入的幾個(gè)服務(wù)參數(shù)來(lái)檢索服務(wù),其結(jié)果必然導(dǎo)致最后所得到的服務(wù)無(wú)法滿(mǎn)足用戶(hù)的復(fù)雜需求,,迫使用戶(hù)做出二次或多次服務(wù)檢索,,不利于個(gè)性化服務(wù)的有效開(kāi)展,。
本文提出一種面向用戶(hù)復(fù)雜需求、針對(duì)單個(gè)空間信息服務(wù)的三層組織模型,,在空間信息服務(wù)個(gè)性化推薦過(guò)程中,,根據(jù)用戶(hù)的歷史行為,通過(guò)源服務(wù)拆分以及用戶(hù)建模等步驟,,準(zhǔn)確地將具體的用戶(hù)行為映射到抽象的空間信息服務(wù)上,,滿(mǎn)足了動(dòng)態(tài)變化的用戶(hù)人群對(duì)空間信息服務(wù)的不同需求。
1 幾個(gè)定義
為了建立起針對(duì)用戶(hù)約束的個(gè)性化推薦三層模型,,首先給出以下幾個(gè)概念:
定義1:空間信息源服務(wù):服務(wù)提供者提供的單個(gè)具體空間信息服務(wù)稱(chēng)為源服務(wù),。一個(gè)源服務(wù)必須包含以下變量,即:
So=Name+URL+Operation+QoS+DomainFeature
其中,,So表示某一目標(biāo)服務(wù),;Name為服務(wù)的名稱(chēng);URL表示服務(wù)的訪問(wèn)地址,;Operation為該服務(wù)所支持的各種操作,;QoS為該服務(wù)的質(zhì)量,包含服務(wù)響應(yīng)時(shí)間,、價(jià)格,、穩(wěn)定度、可用性等參數(shù),;DomainFeature為空間信息服務(wù)的領(lǐng)域特性,,如空間數(shù)據(jù)服務(wù)應(yīng)包含Data format、Spatial resolution,、Spatial reference system,、Extent,描述內(nèi)容參考了ISO19115元數(shù)據(jù)標(biāo)準(zhǔn),。
定義2:空間信息原子服務(wù):只封裝了一個(gè)操作的空間服務(wù)為原子服務(wù),。原子服務(wù)使用一個(gè)三元組來(lái)表示,,即:
Sa=<f,Op,,IO>
其中,,f表示服務(wù)Sa能完成的功能,它以語(yǔ)句形式描述該原子服務(wù)的功能信息,;Op表示服務(wù)Sa中封裝的單一操作,;IO表示操作Op中輸入輸出接口參數(shù),其中從參數(shù)名(param Value),、參數(shù)描述(description),、參數(shù)類(lèi)型(type)、單位(unit)和比例系數(shù)(scale)5個(gè)方面來(lái)描述,。
2 空間信息服務(wù)三層組織模型的構(gòu)建
傳統(tǒng)的三層服務(wù)模型[5-6],,主要針對(duì)原子服務(wù)如何組合以及服務(wù)鏈的有序展開(kāi)等問(wèn)題,其思想是將整條服務(wù)鏈拆分為多個(gè)獨(dú)立的原子服務(wù),,研究這些原子服務(wù)之間的接口關(guān)系,,便于前置服務(wù)輸出接口所得到的參數(shù)與后置服務(wù)的輸入接口所需要的參數(shù)相匹配,從而使服務(wù)組合有效開(kāi)展,。而本文中的三層模型,,針對(duì)的是復(fù)雜多變的用戶(hù)人群以及用戶(hù)動(dòng)態(tài)的需求,從用戶(hù)需求的角度來(lái)研究如何組織服務(wù),,從而實(shí)現(xiàn)空間信息領(lǐng)域的個(gè)性化推薦,。
用戶(hù)對(duì)空間信息服務(wù)的需求往往不是單一的,而是由多個(gè)單純需求構(gòu)成的復(fù)雜體,,反映在用戶(hù)操作或行為上就是多個(gè)操作或行為的復(fù)雜集合體,,反映在服務(wù)上就是服務(wù)的各類(lèi)參數(shù)和所包含的原子服務(wù)??臻g信息服務(wù)的個(gè)性化推薦,,其實(shí)質(zhì)是服務(wù)本身所含有的原子服務(wù)和用戶(hù)模型耦合作用的結(jié)果。
根據(jù)以上分析,,從功能角度組織服務(wù),,將源服務(wù)(對(duì)象服務(wù))拆分為原子服務(wù),再將用戶(hù)需求拆分為單個(gè)行為或操作,,通過(guò)原子服務(wù)與用戶(hù)單個(gè)操作或行為的映射關(guān)系,,實(shí)現(xiàn)一個(gè)服務(wù)-用戶(hù)的分級(jí)模型,便于源服務(wù)與多用戶(hù)的不同需求和單個(gè)用戶(hù)的多個(gè)需求進(jìn)行匹配,;實(shí)現(xiàn)針對(duì)用戶(hù)歷史行為或操作集合所做出的服務(wù)個(gè)性化推薦,。具體模型如圖1所示,即源服務(wù)層-原子服務(wù)層-用戶(hù)層。三層模型實(shí)現(xiàn)兩個(gè)映射關(guān)系:源服務(wù)與原子服務(wù)之間的映射,,原子服務(wù)與用戶(hù)之間的映射,。
2.1 源服務(wù)到原子服務(wù)的映射
源服務(wù)拆分為原子服務(wù),是要將源服務(wù)的功能進(jìn)行分解,,而這些功能實(shí)質(zhì)上是由原子服務(wù)來(lái)實(shí)現(xiàn)的,,例如在ArcWeb服務(wù)中位置查找Web服務(wù)(The Place Finder Sample Web Service),客戶(hù)端調(diào)用某一源服務(wù)中的Find-Place原子服務(wù),,傳遞位置名稱(chēng),然后得到這個(gè)位置的確切定位,。過(guò)程如下:FindPlace(placeName:string,,placeFinder-Options:placeFinder Options):LocationInfo。反之,,如果一個(gè)源服務(wù)中沒(méi)有FindPlace原子服務(wù),,則該服務(wù)就不能提供這一功能。
在源服務(wù)拆分為原子服務(wù)的過(guò)程中,,并不是真正地對(duì)某個(gè)具體的源服務(wù)進(jìn)行拆分,,而是為了便于與用戶(hù)的單個(gè)需求進(jìn)行匹配所做的工作。服務(wù)提供者發(fā)布源服務(wù),,通過(guò)對(duì)其WSDL進(jìn)行解析,,建立起由源服務(wù)—原子服務(wù)的映射關(guān)系,原子服務(wù)與源服務(wù)的關(guān)系可以表示為:
Soi=Sai0+Sai1+…+Sain(1)
Soj=Saj0+Saj1+…+Sajm(2)
其中Soi為某一源服務(wù),,可以表示為Sai0,、Sai1、…,、Sain等原子服務(wù)的總和,;同樣源服務(wù)Soj也可以表示為Saj0、Saj1,、…,、Sajm等原子服務(wù)的總和。式(1),、式(2)中的原子服務(wù)個(gè)數(shù)m與n可以相等或不等,,原子服務(wù)項(xiàng)可以相同或不同。
2.2 用戶(hù)分析與建模
空間信息Web服務(wù)是在Web服務(wù)技術(shù)和標(biāo)準(zhǔn)基礎(chǔ)之上實(shí)現(xiàn)的地理空間信息網(wǎng)上在線(xiàn)服務(wù),。主要的應(yīng)用客戶(hù)包括發(fā)現(xiàn)客戶(hù),、地圖瀏覽客戶(hù)、影像使用客戶(hù),、增值客戶(hù)和傳感器客戶(hù)等,。這些人群大致可以分為3類(lèi):(1)面向程序的開(kāi)發(fā)人員:指對(duì)服務(wù)進(jìn)行增值服務(wù)開(kāi)發(fā)的用戶(hù)。這類(lèi)用戶(hù)更關(guān)注于服務(wù)質(zhì)量(QoS);(2)面向空間數(shù)據(jù)的用戶(hù):指通過(guò)GIS相關(guān)的軟件產(chǎn)品使用空間信息服務(wù)所提供數(shù)據(jù)的用戶(hù),。這類(lèi)用戶(hù)關(guān)注于服務(wù)所含有的空間實(shí)體的屬性(如位置信息,、幾何性質(zhì)、拓?fù)潢P(guān)系等),;(3)空間信息服務(wù)的終極用戶(hù):指只使用空間信息服務(wù),,而不對(duì)服務(wù)進(jìn)行二次處理的用戶(hù),也即普通大眾,。這類(lèi)用戶(hù)可以通過(guò)查詢(xún)空間信息服務(wù)解決方案得到最新的空間信息報(bào)告,、地圖和感興趣的應(yīng)用程序。
因?yàn)榍皟煞N用戶(hù)和第三種用戶(hù)對(duì)服務(wù)的關(guān)注程度存在遞進(jìn)關(guān)系,,即開(kāi)發(fā)人員>數(shù)據(jù)用戶(hù)>大眾用戶(hù),,因此針對(duì)第三種用戶(hù)進(jìn)行分析與建模可對(duì)構(gòu)建另外兩種用戶(hù)模型提供幫助,。以下對(duì)第三類(lèi)用戶(hù)進(jìn)行分析,,這類(lèi)用戶(hù)在使用空間信息服務(wù)時(shí),其興趣將反應(yīng)在其行為上,,具體表現(xiàn)為在示例地圖上(示例地圖是能提供所有操作的服務(wù),,且該服務(wù)不參與服務(wù)推薦)的操作。對(duì)用戶(hù)所進(jìn)行的操作進(jìn)行采集和預(yù)處理,,根據(jù)用戶(hù)記錄拆分其操作集合為離散的操作,,每一個(gè)操作采用一個(gè)二元組(動(dòng)詞,名詞)來(lái)表示,,其中操作的本身用動(dòng)詞表示,,操作的對(duì)象用名詞表示,用戶(hù)二元組簡(jiǎn)寫(xiě)為U(V,,N),,如檢索一個(gè)位置或查詢(xún)某一地點(diǎn)在規(guī)定時(shí)間內(nèi)的可達(dá)性,分別表述為(search, place)和(compute, extent),。用戶(hù)模型通常由多個(gè)二元組組成,,表達(dá)了用戶(hù)的復(fù)雜需求?;谝陨戏治?,三類(lèi)用戶(hù)模型中包含的具體內(nèi)容如表1所示。
2.3 原子服務(wù)與用戶(hù)興趣的雙向映射
原子服務(wù)與用戶(hù)操作的匹配,,主要通過(guò)挑選出f中的動(dòng)_名關(guān)鍵詞,,與用戶(hù)二元組(動(dòng)_名詞)進(jìn)行語(yǔ)義匹配。本文將動(dòng),、名詞匹配等級(jí)分為exact,、subsume、sibling和irrelevant,其中exact表示完全匹配關(guān)系,,subsume表示包含關(guān)系,,sibling表示類(lèi)似關(guān)系,irrelevant表示不相干關(guān)系,,在匹配過(guò)程中,,優(yōu)先級(jí)為exact> subsume>sibling>irrelevant。
為定量表示原子服務(wù)與用戶(hù)二元組的相關(guān)關(guān)系,,分別對(duì)動(dòng),、名詞的4個(gè)等級(jí)賦予權(quán)值ω,即exact級(jí),,ω=1,;subsume級(jí),ω=0.6,;sibling級(jí),ω=0.4,;irrelevant級(jí),,ω=0。其中定義ω的標(biāo)準(zhǔn)應(yīng)符合:(1)人們對(duì)原子服務(wù)匹配成功的語(yǔ)義相似度要求,,相似度越高,,匹配越準(zhǔn)確,一般要求相似度要大于0.4,;(2)便于區(qū)分4個(gè)等級(jí)的差異性,。定義原子服務(wù)與用戶(hù)二元組的相似度Φ及動(dòng)名詞在二元組中的權(quán)重ω,有如下關(guān)系:
Φ=ωV×ΦV+ωN×ΦN(3)
其中ΦV表示原子服務(wù)與用戶(hù)二元組的動(dòng)詞相似度,,ΦN表示原子服務(wù)與用戶(hù)二元組的名詞相似度,,ωV、ωN分別表示用戶(hù)二元組的動(dòng)詞與名詞在二元組中的權(quán)值,,有約束條件ωV+ωN=1,。
2.4 個(gè)性化推薦過(guò)程
一般的個(gè)性化推薦是根據(jù)用戶(hù)所發(fā)出的明確請(qǐng)求,向用戶(hù)推薦其感興趣的信息和商品的過(guò)程,。而空間信息服務(wù)的個(gè)性化推薦是根據(jù)用戶(hù)在示例地圖中的歷史操作或使用網(wǎng)絡(luò)服務(wù)的歷史情況,,向用戶(hù)推薦其感興趣的網(wǎng)絡(luò)服務(wù)過(guò)程。本文提出的模型在個(gè)性化推薦中的具體應(yīng)用如圖2所示,。在有效時(shí)間內(nèi),,通過(guò)對(duì)用戶(hù)歷史行為的記錄展開(kāi)篩選服務(wù),進(jìn)而對(duì)該服務(wù)進(jìn)行推薦,。
3 模擬應(yīng)用實(shí)驗(yàn)
3.1 實(shí)驗(yàn)準(zhǔn)備
設(shè)計(jì)源服務(wù)組織模型并下載Esri以及本地的服務(wù)等200多個(gè)服務(wù)WSDL,,組成源服務(wù)數(shù)據(jù);解析WSDL得到源服務(wù)所包含的操作組成原子服務(wù),借鑒ArcGIS Soap標(biāo)準(zhǔn)對(duì)原子服務(wù)功能f進(jìn)行描述,。個(gè)性化推薦通過(guò)隱性方式收集用戶(hù)在頁(yè)面上的行為,,抽象出用戶(hù)二元組。
3.2 實(shí)驗(yàn)過(guò)程
本文以一個(gè)仿真實(shí)驗(yàn)為例進(jìn)行分析,。對(duì)用戶(hù)的歷史操作或行為進(jìn)行采集,,論證能否通過(guò)三層模型篩選出滿(mǎn)足用戶(hù)需求的源服務(wù)。
過(guò)程簡(jiǎn)述為:首先采集用戶(hù)的歷史行為,,并對(duì)這些用戶(hù)行為進(jìn)行抽象,,組成代表用戶(hù)復(fù)雜興趣的二元組集合,計(jì)算單個(gè)二元組與原子服務(wù)的相似度,,取相似度最大的原子服務(wù),。因?yàn)橛脩?hù)操作不僅是一個(gè),通常情況下是多個(gè),,以每個(gè)二元組所對(duì)應(yīng)的原子服務(wù)為索引,,組成索引集,檢索出源服務(wù)并進(jìn)行推薦,。
將實(shí)驗(yàn)源服務(wù)拆分為原子服務(wù),,如表2所示。
通過(guò)javascript腳本以及session的建立與銷(xiāo)毀來(lái)記錄用戶(hù)的行為日志,,發(fā)現(xiàn)在有效的時(shí)間段,,用戶(hù)在示例地圖上進(jìn)行了如下操作:(1)用鼠標(biāo)在地圖上進(jìn)行定位;(2)分析該位置在2 min內(nèi)所能到達(dá)的區(qū)域,,構(gòu)建其模型為:用戶(hù)=<Locate,,Point>+<Analyse,Extent>,。其中,,借助wordnet工具包將原子服務(wù)f語(yǔ)句中的動(dòng)詞和名詞挑選出來(lái)作為關(guān)鍵詞匹配計(jì)算,采用Lin算法計(jì)算原子服務(wù)與用戶(hù)二元組的相似度(ΦV,,ΦN),,設(shè)定動(dòng)詞與名詞在二元組中的權(quán)重都為0.5,即ωV=ωN=0.5,。用戶(hù)與原子服務(wù)的相似度計(jì)算結(jié)果如表3所示,。
抽取出分別對(duì)應(yīng)用戶(hù)兩個(gè)二元組的最大相似度原子服務(wù)(表3中原子服務(wù)3和2),將其作為索引集,,檢索源服務(wù),,得到源服務(wù)結(jié)果(表2中服務(wù)2和5,服務(wù)效果如圖3(a)所示),,推薦給用戶(hù),;對(duì)于噪聲源服務(wù)(表2中服務(wù)3等,,服務(wù)效果如圖3(b)所示),拒絕推薦,。
3.3 實(shí)驗(yàn)分析與結(jié)論
通過(guò)模擬實(shí)驗(yàn),,用戶(hù)模型代表了用戶(hù)的兩方面需求:定位和分析通達(dá)性。根據(jù)表3所示用戶(hù)與原子服務(wù)的相似度計(jì)算結(jié)果,,用戶(hù)的這兩方面需求由原子服務(wù)ToMapPoints和Solve(表3中原子服務(wù)3和2)實(shí)現(xiàn),。根據(jù)源服務(wù)與原子服務(wù)的關(guān)系(表2)可知,包含這兩個(gè)原子服務(wù)的源服務(wù)(表2中源服務(wù)2和5)能提供用戶(hù)所要求的功能,,符合推薦條件,。
由以上分析得出以下結(jié)論:傳統(tǒng)空間信息服務(wù)模型以服務(wù)本身為考慮對(duì)象,忽略了對(duì)用戶(hù)信息的挖掘,,檢索出的服務(wù)其功能并不一定滿(mǎn)足用戶(hù)的需求,,迫使用戶(hù)做出二次甚至多次的檢索,影響服務(wù)質(zhì)量,;本文模型有效地克服了這一缺點(diǎn),,在對(duì)用戶(hù)歷史信息進(jìn)行挖掘后,經(jīng)過(guò)原子服務(wù)這一橋梁,,把用戶(hù)需求與服務(wù)功能有機(jī)地結(jié)合在一起,,所篩選出的源服務(wù)也必然具有與用戶(hù)需求相一致的功能。
傳統(tǒng)的空間信息服務(wù)組織模式已難以滿(mǎn)足廣大不同用戶(hù)的需要,,個(gè)性化在空間信息服務(wù)中的應(yīng)用是當(dāng)前研究的一大難點(diǎn)。本文嘗試以用戶(hù)為研究對(duì)象,,提出面向用戶(hù)需求的三層組織模型,,該模型充分挖掘了用戶(hù)信息,將用戶(hù)需求與服務(wù)功能有機(jī)地聯(lián)系起來(lái),,為實(shí)現(xiàn)空間信息服務(wù)領(lǐng)域的個(gè)性化推薦提供一種更為便利的組織形式,,且實(shí)例證明該三層模型能有效且迅速地對(duì)用戶(hù)行為作出響應(yīng),從眾多的空間服務(wù)中篩選出最滿(mǎn)足用戶(hù)需要的服務(wù),,為未來(lái)空間信息服務(wù)領(lǐng)域的智能化和個(gè)性化研究提供新的思路,。
參考文獻(xiàn)
[1] 曾春,邢春曉,,周立柱.個(gè)性化服務(wù)技術(shù)綜述[J].軟件學(xué)報(bào),,2002,13(10):1952-1961.
[2] 鄔群勇,,鄭孝苗,,康凌駿.語(yǔ)義地理信息服務(wù)的三級(jí)匹配發(fā)現(xiàn)算法[J].廈門(mén)大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,,51(2):53-57.
[3] 王強(qiáng),,王家耀,,姜艷媛,等.基于P2P和本體的空間信息服務(wù)發(fā)布與發(fā)現(xiàn)[J].測(cè)繪科學(xué)技術(shù)學(xué)報(bào),,2009,,26(6):68-71.
[4] 王強(qiáng),王家耀,,姜艷媛.本體支持的智能化空間信息服務(wù)發(fā)現(xiàn)[J].信息工程大學(xué)學(xué)報(bào),,2010,11(2):46-50.
[5] 高巖,,那俊,,張斌,等.支持動(dòng)態(tài)服務(wù)組合的Web服務(wù)三層組織模型[J].小型微型計(jì)算機(jī)系統(tǒng),,2006,,27(10):89-92.
[6] 張永勝,徐麗麗,,齊峰,,等.基于三層組織模型的一種Web服務(wù)組合策略[J].計(jì)算機(jī)工程與應(yīng)用,2008,,44(22):89-91.
[7] 羅安,,王艷東,龔健雅.顧及上下文的空間信息服務(wù)組合語(yǔ)義匹配方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),,2011,,36(3):368-372.
[8] 章漢武,龔俊,,吳華意.地理空間信息服務(wù)質(zhì)量評(píng)價(jià)的概念與方法[J].測(cè)繪科學(xué),,2012,37(1):161-164.
[9] 裴仰軍.個(gè)性化服務(wù)中用戶(hù)興趣模型的研究[D].重慶:重慶大學(xué),,2005.
[10] 唐燦,,朱征宇.基于模糊興趣模型的個(gè)性化推薦算法[J].計(jì)算機(jī)工程與應(yīng)用,2006,,42(9):170-172.
[11] 韓旭.個(gè)性化推薦系統(tǒng)用戶(hù)興趣建模方式的研究[J].數(shù)字技術(shù)與應(yīng)用,,2010(11):46,48.
[12] 牛亞真,,祝忠明.個(gè)性化服務(wù)中跨系統(tǒng)用戶(hù)建模方法研究綜述[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),,2012,28(5):5-10.