劉尹平,王篤會(huì),,任朝陽(yáng)
?。暇┼]電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
摘要:在線(xiàn)社交網(wǎng)絡(luò)是伴隨著互聯(lián)網(wǎng)技術(shù)發(fā)展產(chǎn)生的,,它屬于眾多復(fù)雜網(wǎng)絡(luò)中的一種,。近年來(lái),對(duì)于在線(xiàn)社交網(wǎng)絡(luò)的研究不斷深入,,研究方向可以細(xì)分為網(wǎng)絡(luò)拓?fù)涮卣?/a>的分析,、虛擬社區(qū)劃分算法的研究、傳播動(dòng)力學(xué)研究,、網(wǎng)絡(luò)采樣與重構(gòu),、網(wǎng)絡(luò)拓?fù)渥R(shí)別等。大數(shù)據(jù)研究的興起使得在線(xiàn)社交網(wǎng)絡(luò)的研究更加受到人們的關(guān)注,。當(dāng)前,,人們的日常生活幾乎離不開(kāi)在線(xiàn)社交網(wǎng)絡(luò),也因此每天都會(huì)有大量的用戶(hù)數(shù)據(jù)產(chǎn)生,,分析,、利用這些數(shù)據(jù)可以幫助人們了解自己并創(chuàng)造更多的價(jià)值,。
關(guān)鍵詞:在線(xiàn)社交網(wǎng)絡(luò);拓?fù)涮卣?;虛擬社區(qū)劃分算法,;采樣;重構(gòu);大數(shù)據(jù)
0引言
BOCCALETTI S等人[1]2006年發(fā)表的文章中,,從復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)特征,、動(dòng)力學(xué)兩個(gè)角度對(duì)復(fù)雜網(wǎng)絡(luò)進(jìn)行了理論研究及具體應(yīng)用分析。在國(guó)內(nèi),,方錦清等人將復(fù)雜網(wǎng)絡(luò)的相關(guān)研究定義為一門(mén)新的交叉科學(xué)——網(wǎng)絡(luò)科學(xué)[2],,其涉及圖論、統(tǒng)計(jì)物理學(xué),、現(xiàn)代控制理論,、非線(xiàn)性科學(xué)等諸多領(lǐng)域的研究理論。
社交網(wǎng)絡(luò)是一種常見(jiàn)的復(fù)雜網(wǎng)絡(luò),,是指由許多節(jié)點(diǎn)構(gòu)成的一種社會(huì)結(jié)構(gòu),,可以抽象為由多個(gè)節(jié)點(diǎn)及節(jié)點(diǎn)之間的鏈路構(gòu)成的圖,它是伴隨著人類(lèi)的誕生而產(chǎn)生的,,這里的節(jié)點(diǎn)可以是個(gè)人也可以是組織,,節(jié)點(diǎn)之間的鏈路對(duì)應(yīng)于各種社會(huì)關(guān)系,比如朋友關(guān)系,。
在線(xiàn)社交網(wǎng)絡(luò)是互聯(lián)網(wǎng)與傳統(tǒng)社交網(wǎng)絡(luò)的結(jié)合,,是一種在信息網(wǎng)絡(luò)上由社會(huì)個(gè)體集合及個(gè)體之間的連接關(guān)系構(gòu)成的社會(huì)性結(jié)構(gòu),它的產(chǎn)生與計(jì)算機(jī)技術(shù)的飛速發(fā)展息息相關(guān),。這種社會(huì)性結(jié)構(gòu)也可以抽象為由節(jié)點(diǎn)和鏈路構(gòu)成的圖,。節(jié)點(diǎn)可以是個(gè)人或者組織,也可以是網(wǎng)絡(luò)ID等虛擬個(gè)體,,鏈路則代表各種社會(huì)關(guān)系,,或者收發(fā)消息等多種動(dòng)作行為[3]。
復(fù)雜網(wǎng)絡(luò),、社交網(wǎng)絡(luò),、在線(xiàn)社交網(wǎng)絡(luò)三者的關(guān)系可以理解為,社交網(wǎng)絡(luò)為復(fù)雜網(wǎng)絡(luò)的一種,,因此具有許多復(fù)雜網(wǎng)絡(luò)的特征,,而在線(xiàn)社交網(wǎng)絡(luò)可以理解為一種特殊的社交網(wǎng)絡(luò)。因此,,在線(xiàn)社交網(wǎng)絡(luò)也具有復(fù)雜性,,其復(fù)雜性主要表現(xiàn)在以下三個(gè)方面:(1)節(jié)點(diǎn)的復(fù)雜性,網(wǎng)絡(luò)中每一個(gè)節(jié)點(diǎn)都具有不同的屬性、特征,,同一個(gè)節(jié)點(diǎn)還可能具有復(fù)雜的時(shí)間演化行為,。(2)結(jié)構(gòu)復(fù)雜性,具體來(lái)說(shuō),,就是網(wǎng)絡(luò)節(jié)點(diǎn)之間關(guān)系混亂,,連接交錯(cuò)復(fù)雜,且隨時(shí)可能發(fā)生動(dòng)態(tài)變化,。比如,,你會(huì)在不斷改變的生活環(huán)境中不斷地結(jié)交一些新朋友,同時(shí)也可能失去一些朋友,。(3)結(jié)構(gòu)與節(jié)點(diǎn)之間相互影響,,比如,朋友圈的組成結(jié)構(gòu)影響你的言行舉止,,而你結(jié)交新的朋友就會(huì)改變你朋友圈的結(jié)構(gòu),。圖1描述了社交網(wǎng)絡(luò)的生長(zhǎng)過(guò)程。
近年來(lái),,對(duì)于在線(xiàn)社交網(wǎng)絡(luò)的研究不斷深入,研究方向可以細(xì)分為網(wǎng)絡(luò)拓?fù)涮卣鞯姆治?、虛擬社區(qū)劃分算法的研究,、傳播動(dòng)力學(xué)研究、網(wǎng)絡(luò)采樣與重構(gòu),、網(wǎng)絡(luò)拓?fù)渥R(shí)別等,。
1在線(xiàn)社交網(wǎng)絡(luò)的拓?fù)涮匦苑治?/strong>
在線(xiàn)社交網(wǎng)絡(luò)可以是無(wú)向網(wǎng)絡(luò)也可以是有向網(wǎng)絡(luò),MSN,、QQ,、微信等在線(xiàn)實(shí)時(shí)通信平臺(tái)需要雙方認(rèn)證才可以建立朋友關(guān)系,基于這種方式形成的在線(xiàn)社交網(wǎng)絡(luò)結(jié)構(gòu)中鏈路是無(wú)向的,,而通過(guò)Twitter,、微博等可以建立單向的關(guān)系,比如在新浪微博中,,你可以關(guān)注自己喜歡的明星但明星并不一定會(huì)關(guān)注你,,這樣就會(huì)形成有向在線(xiàn)社交網(wǎng)絡(luò)。
1.1無(wú)標(biāo)度特性
在無(wú)向網(wǎng)絡(luò)中節(jié)點(diǎn)的度指網(wǎng)絡(luò)中與該節(jié)點(diǎn)直接相連的邊的數(shù)目,,度分布P(k)定義為一個(gè)隨機(jī)選擇的節(jié)點(diǎn)度為k的概率,,也就是網(wǎng)絡(luò)中度為k的節(jié)點(diǎn)數(shù)目與網(wǎng)絡(luò)節(jié)點(diǎn)總數(shù)目的比值。
無(wú)標(biāo)度的概念是BARABSI A L和ALBERTT R[4]提出的,。經(jīng)研究發(fā)現(xiàn),,現(xiàn)實(shí)生活中的許多復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn)度分布函數(shù)服從冪律分布,其表現(xiàn)為,大部分的節(jié)點(diǎn)擁有的鄰居節(jié)點(diǎn)數(shù)很少,,只有少部分的節(jié)點(diǎn)擁有大量的鄰居節(jié)點(diǎn),。由于冪律分布函數(shù)具有無(wú)標(biāo)度性質(zhì),因此又稱(chēng)這種特征為“無(wú)標(biāo)度”特性,。在線(xiàn)社交網(wǎng)絡(luò)作為復(fù)雜網(wǎng)絡(luò)中的一種,,也具有無(wú)標(biāo)度特性。
1.2小世界特性
在無(wú)權(quán)網(wǎng)絡(luò)中,,從一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)的路徑需要經(jīng)過(guò)的邊數(shù)稱(chēng)為兩節(jié)點(diǎn)間的距離,。當(dāng)網(wǎng)絡(luò)中兩節(jié)點(diǎn)之間存在不止一條路徑時(shí),其中距離最短的一條稱(chēng)為連接兩節(jié)點(diǎn)的最短路徑,,此距離即為最短路徑長(zhǎng)度,。N個(gè)節(jié)點(diǎn)構(gòu)成的網(wǎng)絡(luò)中任意兩節(jié)點(diǎn)間距離的均值定義為整個(gè)網(wǎng)絡(luò)的平均路徑長(zhǎng)度。
“小世界”概念由社會(huì)心理學(xué)家MILGRAM S提出,,來(lái)自于其曾進(jìn)行的一次“郵件傳播”的實(shí)驗(yàn),,也被稱(chēng)為“六度分割”理論。WATTS D J和STROGATZ S H 1998年第一次提出了小世界模型[5],。在線(xiàn)社交網(wǎng)絡(luò)擁有大量的節(jié)點(diǎn)和鏈路,,網(wǎng)絡(luò)拓?fù)涫謴?fù)雜,但令人驚訝的是,,任意兩節(jié)點(diǎn)的最短路徑和網(wǎng)絡(luò)平均路徑都非常小,,這種現(xiàn)象被形象地稱(chēng)為“小世界”特征。研究表明,,2010年人人網(wǎng)的用戶(hù)之間的平均距離為5.38[6],,而2011年全球Facebook上兩個(gè)用戶(hù)之間的平均距離僅為4.74。然而,,對(duì)于網(wǎng)絡(luò)“小世界”特性的研究均基于無(wú)權(quán)網(wǎng)絡(luò),,并沒(méi)有考慮網(wǎng)絡(luò)中節(jié)點(diǎn)連接的強(qiáng)弱不同。
真實(shí)的在線(xiàn)社交網(wǎng)絡(luò)的特性不僅局限于無(wú)標(biāo)度特性與小世界特性,,有些在線(xiàn)社交網(wǎng)絡(luò)還具有聚類(lèi)特性,、社區(qū)結(jié)構(gòu)特性等。因此,,建立真實(shí)社交網(wǎng)絡(luò)的模型仍存在挑戰(zhàn),。
2在線(xiàn)社交網(wǎng)絡(luò)虛擬社區(qū)劃分
在線(xiàn)社交網(wǎng)絡(luò)由若干“群”或“簇”構(gòu)成。這些群或簇的內(nèi)部節(jié)點(diǎn)連接緊密,,而群或簇間的連接則相對(duì)比較稀疏,。也就是說(shuō),在線(xiàn)社交網(wǎng)絡(luò)與諸多復(fù)雜網(wǎng)絡(luò)一樣,,具有“社區(qū)結(jié)構(gòu)”的特征[7],。
目前,對(duì)于社區(qū)結(jié)構(gòu)的定義有許多不同的方法,比如:如果圖G內(nèi)所有節(jié)點(diǎn)間連接的度的總和大于其與其他部分圖相連的度的總和,,則圖G為一個(gè)社區(qū)結(jié)構(gòu)[1],。不同的定義方法對(duì)應(yīng)著不同的虛擬社區(qū)劃分算法,具體來(lái)說(shuō),,虛擬社區(qū)劃分算法有兩類(lèi),,一類(lèi)是靜態(tài)虛擬社區(qū)劃分算法,另一類(lèi)是動(dòng)態(tài)虛擬社區(qū)劃分算法,。
經(jīng)典的靜態(tài)虛擬社區(qū)劃分算法包括Kmeans算法,、分裂算法、凝聚算法,、譜分析算法等[8],。其中,Kmeans算法是最知名的聚類(lèi)算法,,該算法給出一組歐幾里得節(jié)點(diǎn)并根據(jù)節(jié)點(diǎn)數(shù)目給出一個(gè)正整數(shù)k,,將數(shù)據(jù)集劃分為k個(gè)不相交的子集。計(jì)算機(jī)根據(jù)k值隨機(jī)選擇k個(gè)點(diǎn)作為初始中心點(diǎn),,計(jì)算所有節(jié)點(diǎn)到k個(gè)中心點(diǎn)的平方歐式距離并將節(jié)點(diǎn)歸于距離最短的那個(gè)集群,。重新計(jì)算k個(gè)集群的中心點(diǎn)并進(jìn)行迭代,使得所有點(diǎn)到中心點(diǎn)的平方歐式距離之和最短,,同時(shí)不同集群中心點(diǎn)的距離最長(zhǎng),。這種算法可以實(shí)現(xiàn)較好的劃分效果,但k值需要人為估計(jì),。
對(duì)于動(dòng)態(tài)虛擬社區(qū)的劃分,當(dāng)前的一個(gè)普遍方法是將連續(xù)時(shí)間分割成一些離散的時(shí)間步,,分別抽取社區(qū)結(jié)構(gòu),,然后引入演化特征來(lái)解釋隨時(shí)間的變化這些劃分之間的差異,從而得到網(wǎng)絡(luò)和其中社區(qū)的發(fā)展趨勢(shì),。
在線(xiàn)社交網(wǎng)絡(luò)的虛擬社區(qū)劃分可以應(yīng)用于廣告的精準(zhǔn)投放,,將相似的人群劃分在同一社區(qū),針對(duì)不同社區(qū)投放不同的廣告,,以減少成本增加商業(yè)利潤(rùn),。此外,虛擬社區(qū)劃分也可用于在線(xiàn)社交網(wǎng)絡(luò)的推薦系統(tǒng),,同一社區(qū)的節(jié)點(diǎn)屬性更具有相似性,,因此也更有可能成為朋友。
3在線(xiàn)社交網(wǎng)絡(luò)上的傳播動(dòng)力學(xué)
復(fù)雜網(wǎng)絡(luò)的動(dòng)力學(xué)定義為,,網(wǎng)絡(luò)在“外部刺激”的推動(dòng)下,,或者“內(nèi)部消息”的觸發(fā)下,節(jié)點(diǎn)自身信息狀態(tài)改變或者節(jié)點(diǎn)間連接關(guān)系發(fā)生變化,從而導(dǎo)致整個(gè)網(wǎng)絡(luò)發(fā)生明顯的或者不明顯的“質(zhì)變”,,這種改變可以是在某種規(guī)則約束下執(zhí)行的,,也可能是隨機(jī)的。
傳播是一種常見(jiàn)的網(wǎng)絡(luò)動(dòng)力學(xué)行為[9],。目前,,關(guān)于在線(xiàn)社交網(wǎng)絡(luò)上傳播動(dòng)力學(xué)研究的文章有許多,比如對(duì)于微博中的謠言傳播的研究,。在線(xiàn)社交網(wǎng)絡(luò)上傳播的不僅只有謠言,,也可以是口碑、情緒等,。研究傳播動(dòng)力學(xué)的前提是對(duì)在線(xiàn)網(wǎng)絡(luò)進(jìn)行建模,,基于代理的建模是其中一種常見(jiàn)的方法,即利用現(xiàn)有的計(jì)算機(jī)技術(shù)建立基于代理的網(wǎng)絡(luò)模型,,該模型由許多自治的,、相互交互的“代理”組成。代理具有自身的行為,,也可與其他代理進(jìn)行交互,,這種交互會(huì)影響代理自身的行為。根據(jù)模型應(yīng)用環(huán)境的不同,,模型中的代理可以代表個(gè)人,、家庭、公司甚至是國(guó)家,?;诖淼慕2捎谩白缘紫蛏稀钡慕K枷耄ㄟ^(guò)對(duì)一個(gè)個(gè)代理的建模,,就可以將不同代理的屬性和行為的多樣性從整個(gè)系統(tǒng)的行為中表現(xiàn)出來(lái),。
研究在線(xiàn)社交網(wǎng)絡(luò)上的傳播動(dòng)力學(xué)有著重要的實(shí)際意義,例如,,研究謠言在在線(xiàn)社交網(wǎng)絡(luò)中的傳播過(guò)程,、傳播規(guī)律可以為政府及有關(guān)部門(mén)的征兆預(yù)警、判斷分析及公共宣傳工作提供保障,。因此,,研究不同類(lèi)型的信息在在線(xiàn)社交網(wǎng)絡(luò)中的傳播過(guò)程,揭示信息傳播的一般規(guī)律與特性,,提出科學(xué)有效的控制策略,,是傳播研究領(lǐng)域的重要課題。
4在線(xiàn)社交網(wǎng)絡(luò)采樣與重構(gòu)
參考文獻(xiàn)[10]中指出,,網(wǎng)絡(luò)采樣與網(wǎng)絡(luò)重構(gòu)與網(wǎng)絡(luò)構(gòu)建的發(fā)展趨勢(shì)密切相關(guān),。一方面,,由于受到現(xiàn)有技術(shù)的限制,對(duì)于許多網(wǎng)絡(luò)只能通過(guò)采樣的方法獲得數(shù)據(jù),;另一方面,,即使能夠獲得完整的數(shù)據(jù),有些網(wǎng)絡(luò)問(wèn)題的研究也需要對(duì)網(wǎng)絡(luò)進(jìn)行采樣,。例如,,研究在線(xiàn)社交網(wǎng)絡(luò)上的傳播動(dòng)力學(xué)問(wèn)題時(shí),一般只在部分子網(wǎng)絡(luò)進(jìn)行研究,。此外,,在處理大規(guī)模數(shù)據(jù)可視化的問(wèn)題時(shí)也需要有效的采樣。
目前被廣泛應(yīng)用的采樣算法有廣度優(yōu)先采樣,、Frontier采樣,、Forest Fire采樣等。每種采樣算法都有其優(yōu)缺點(diǎn),,以FF(Forest Fire)采樣算法為例,,F(xiàn)F采樣算法基于隨機(jī)游走思想,它首先隨機(jī)地選取一個(gè)節(jié)點(diǎn)作為森林火災(zāi)的發(fā)源地,,然后選取與該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)作為下一步有可能被燒到的樹(shù)木,,每一個(gè)節(jié)點(diǎn)(樹(shù)木)被燒到的概率為P,P的大小決定了抽樣效果的好壞,,文獻(xiàn)[11]指出P=0.8時(shí)抽樣的效果最好,。FF算法采集的子網(wǎng)雖然連通性較好,且具有小世界特性,,但由于更傾向于獲取度值較大的節(jié)點(diǎn),,因此樣本節(jié)點(diǎn)之間的連接將逐漸具有超線(xiàn)性關(guān)系,所以無(wú)法實(shí)現(xiàn)對(duì)原始網(wǎng)絡(luò)的真實(shí)采樣,。
與網(wǎng)絡(luò)采樣相對(duì)應(yīng)的一個(gè)問(wèn)題是網(wǎng)絡(luò)重構(gòu)(Network Reconstruction),,即能否以及如何從部分網(wǎng)絡(luò)數(shù)據(jù)推測(cè)得到整個(gè)網(wǎng)絡(luò)的數(shù)據(jù)。這一問(wèn)題也被稱(chēng)為網(wǎng)絡(luò)完整性(Network Completion),、網(wǎng)絡(luò)推斷(Network inference)或逆向工程網(wǎng)絡(luò)(Reverse Engineering Network)。
網(wǎng)絡(luò)重構(gòu)的問(wèn)題最早由GUIMER R和SALESPARDO M提出[12],,他們基于隨機(jī)分塊模型來(lái)進(jìn)行網(wǎng)絡(luò)重構(gòu),,隨機(jī)分塊模型的基本思想是將節(jié)點(diǎn)分為相互獨(dú)立的組,兩個(gè)節(jié)點(diǎn)之間存在鏈路的概率只與節(jié)點(diǎn)所在的組有關(guān),,文獻(xiàn)[12]中指出,,不僅可以預(yù)測(cè)兩個(gè)未連接的節(jié)點(diǎn)之間是否存在鏈路,同時(shí)也可以判斷網(wǎng)絡(luò)中存在的虛假邊,。鏈路預(yù)測(cè)也是網(wǎng)絡(luò)重構(gòu)相關(guān)的研究之一,,鏈路預(yù)測(cè)的主要思想是利用節(jié)點(diǎn)之間屬性相似性或者網(wǎng)絡(luò)結(jié)構(gòu)的相關(guān)性等來(lái)恢復(fù)丟失連邊[13],,例如基于共同鄰居指標(biāo)的鏈路預(yù)測(cè),即兩個(gè)節(jié)點(diǎn)擁有的共同鄰居越多,,它們之間存在鏈路的可能性就越大,。鏈路預(yù)測(cè)技術(shù)可用于在線(xiàn)社交網(wǎng)絡(luò)的推薦系統(tǒng),兩個(gè)陌生人有很多的共同朋友或者擁有許多的共同愛(ài)好,,那么他們能夠成為朋友的概率就很大,。
5在線(xiàn)社交網(wǎng)絡(luò)拓?fù)渥R(shí)別
近年來(lái),無(wú)論是對(duì)復(fù)雜網(wǎng)絡(luò)還是對(duì)具體的在線(xiàn)社交網(wǎng)絡(luò)的研究,,大多是研究網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)在已知條件下的網(wǎng)絡(luò)動(dòng)力學(xué)問(wèn)題,,或者是研究網(wǎng)絡(luò)結(jié)構(gòu)的各種特征參數(shù),如平均距離,、度分布等對(duì)網(wǎng)絡(luò)動(dòng)力學(xué)的影響[14],。然而實(shí)際的網(wǎng)絡(luò)存在各種不確定性的信息,網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)目,、拓?fù)溥B接等往往只有部分已知,,并且還可能不斷地變化。假設(shè)網(wǎng)絡(luò)動(dòng)力學(xué)演化是可以測(cè)量獲取的,,那么能否根據(jù)網(wǎng)絡(luò)動(dòng)力學(xué)演化來(lái)估計(jì)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),,是一個(gè)極具挑戰(zhàn)性的問(wèn)題。如果說(shuō)在已知網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)條件下研究網(wǎng)絡(luò)動(dòng)力學(xué)問(wèn)題是正問(wèn)題的話(huà),,那么對(duì)于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的識(shí)別則屬于反演問(wèn)題(或者反問(wèn)題),。顯然,反問(wèn)題比正問(wèn)題困難,,而且一般來(lái)說(shuō)反問(wèn)題的解是不唯一的,,解反問(wèn)題是需要附加補(bǔ)充條件的。
對(duì)于網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)識(shí)別問(wèn)題,,目前國(guó)內(nèi)已經(jīng)取得一些重要進(jìn)展,。陸君安等人提出基于自適應(yīng)同步的網(wǎng)絡(luò)動(dòng)力學(xué)參數(shù)和拓?fù)渥R(shí)別方法[15],指出動(dòng)力學(xué)信息對(duì)于拓?fù)渥R(shí)別并非是充分的,,為了識(shí)別網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),,需要滿(mǎn)足經(jīng)內(nèi)連耦合動(dòng)力學(xué)映射后的一簇函數(shù)組在同步流形上線(xiàn)性無(wú)關(guān)的條件。如果需要同時(shí)識(shí)別網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和動(dòng)力學(xué)參數(shù),,則需要滿(mǎn)足經(jīng)內(nèi)連耦合動(dòng)力學(xué)和節(jié)點(diǎn)動(dòng)力學(xué)映射后的兩簇函數(shù)組在同步流形上線(xiàn)性無(wú)關(guān)的條件,。對(duì)于具體的在線(xiàn)社交網(wǎng)絡(luò),可以考慮利用其上的傳播等動(dòng)力學(xué)行為推測(cè)其具體結(jié)構(gòu),,進(jìn)一步研究動(dòng)力學(xué)行為與網(wǎng)絡(luò)結(jié)構(gòu)之間的相互影響,。
6結(jié)論
在線(xiàn)社交網(wǎng)絡(luò)各方面的研究目前已經(jīng)取得了相當(dāng)多的研究成果,同時(shí)也受到了越來(lái)越多人的關(guān)注與投入,,在線(xiàn)社交網(wǎng)絡(luò)研究與大數(shù)據(jù)研究的結(jié)合是當(dāng)前的一個(gè)研究熱點(diǎn),,未來(lái)將會(huì)有更好的發(fā)展與應(yīng)用,。
大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常用軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合[16],。2013年新浪公司全年財(cái)報(bào)中指出,,截至2013年12月份,新浪微博注冊(cè)用戶(hù)數(shù)達(dá)2.81億,,微博活躍用戶(hù)數(shù)達(dá)1.67億,,每天產(chǎn)生約2億條微博數(shù)據(jù)。2012年3月美國(guó)政府發(fā)布《大數(shù)據(jù)研究和發(fā)展倡議》,,時(shí)至今日,,大數(shù)據(jù)顯然已成為一種競(jìng)爭(zhēng)資源。在線(xiàn)社交網(wǎng)絡(luò)每天都有大量數(shù)據(jù)產(chǎn)生,,如何利用這些數(shù)據(jù),,結(jié)合已有的在線(xiàn)社交網(wǎng)絡(luò)理論研究成果,分析人們的生活和行為,,挖掘政治,、社會(huì)、文化,、商業(yè),、健康等領(lǐng)域的信息,以便于更好地服務(wù)于用戶(hù)并從中獲利,,將具有廣闊發(fā)展前景,。
參考文獻(xiàn)
[1] BOCCALETTI S, .LATORA V, MORENO Y, et al.Complex network:structure and dynamics [J/OL].Physics Reports,2006,424:17530.[20160320].http://www.sciencedirect.com/science/article/pii/S037015730500462X.
?。?] 方錦清,,汪小帆,鄭志剛,,等.一門(mén)嶄新的交叉科學(xué):網(wǎng)絡(luò)科學(xué)(上)[J].物理學(xué)進(jìn)展,,2007,27(3):239343.
?。?] 方濱興,,許進(jìn),李建華,,等.在線(xiàn)社交網(wǎng)絡(luò)分析[M].北京:電子工業(yè)出版社,,2014.
[4] BARABáSI A L, ALBERT R. Emergence of scaling in random networks[J/OL].Science ,1999,286(5439):50912.[20160320].http://science.sciencemag.org/content/286/5439/509.
?。?] WATTS D J, STROGATZ S H. Collective dynamics of smallworld networks[J/OL]. Nature, 1998,393(6684):440442. [20160320].http://apps.webofknowledge.com/full_record.do?product=UA&search_mode=GeneralSearch&qid=9&SID=N2CCOYPK3reQ14t9giD&page=1&doc=3.
[6] Jiang Jing,,WILSON C,,Wang Xiao,,et al.Understanding latent interactions in online social networks [J/OL].ACM Transactions on the Web,2010,7(4):369382.[20160320].http://apps.webofknowledge.com/full_record.do?product=UA&search_mode=GeneralSearch&qid=6&SID=N2CCOYPK3reQ14t9giD&page=1&doc=1.
?。?] 鄭浩原,,黃戰(zhàn).復(fù)雜網(wǎng)絡(luò)社區(qū)挖掘———改進(jìn)的層次聚類(lèi)算法[J ].微型機(jī)與應(yīng)用,2011,,30(16):8588.
?。?] 顧宏博,奚杰杰,,吳晶.基于關(guān)聯(lián)系數(shù)的社區(qū)劃分算法[J].微型機(jī)與應(yīng)用,,2015,34(18):1719.
?。?] MORENO Y, NEKOVEE M, PACHECO A F. Dynamics of rumor spreading in complex networks[J/OL]. Physical Review E, 2004, 69(6 Pt 2):066130. [20160320].http://journals.aps.org/pre/abstract/10.1103/PhysRevE.69.066130.
?。?0] 汪小帆.網(wǎng)絡(luò)科學(xué)發(fā)展研究[J].學(xué)科發(fā)展報(bào)告,2013,,36(4):111119.
?。?1] LESKOVEC J,F(xiàn)ALOUTSOS C.Sampling from large graphs[C].The Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2006:2023.
?。?2] GUIMERà R,,SALESPARDO M.Missing and spurious interactions and reconstruction of complex network[C].Proceeding of National Academy of Science of the United States of America,2009:2207322078.
?。?3] 呂琳媛,,周濤.鏈路預(yù)測(cè)[M].北京:高等教育出版社,2013.