《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 網頁排序算法在社會認知管理效果評價中的應用
網頁排序算法在社會認知管理效果評價中的應用
2016年微型機與應用第12期
邱繼遠,,岳振軍,,榮傳振,,蘇豐龍
(中國人民解放軍理工大學 通信工程學院,江蘇 南京 210007)
摘要: 描述了當前突發(fā)公共事件中社會認知管理的現狀,,針對當前突發(fā)公眾事件中社會認知管理水平不高,沒有統(tǒng)一的認知管理水平評價標準等問題,,提出了應用網頁排序打分的方法來對突發(fā)事件中主流媒體網絡信息發(fā)布受公眾關注度的情況進行評價,,從而間接評價網絡媒體在社會認知管理中發(fā)揮的作用,。針對傳統(tǒng)PageRank算法偏重舊網頁的現象,對算法進行了改進,,增加了時間權重,。在Hadoop分布式計算平臺上實現了該算法,并對比分析了算法改進前后的排序結果,。
Abstract:
Key words :

  邱繼遠,,岳振軍,榮傳振,,蘇豐龍

 ?。ㄖ袊嗣窠夥跑娎砉ご髮W 通信工程學院,江蘇 南京 210007)

  摘要:描述了當前突發(fā)公共事件中社會認知管理的現狀,,針對當前突發(fā)公眾事件中社會認知管理水平不高,,沒有統(tǒng)一的認知管理水平評價標準等問題,提出了應用網頁排序打分的方法來對突發(fā)事件中主流媒體網絡信息發(fā)布受公眾關注度的情況進行評價,,從而間接評價網絡媒體在社會認知管理中發(fā)揮的作用,。針對傳統(tǒng)PageRank算法偏重舊網頁的現象,對算法進行了改進,,增加了時間權重,。在Hadoop分布式計算平臺上實現了該算法,并對比分析了算法改進前后的排序結果,。

  關鍵詞:認知管理; 突發(fā)性公共事件; Hadoop,;PageRank;時效性

0引言

  當前,,國際形勢復雜多變,,國內改革逐步深化,各類問題和矛盾引發(fā)的突發(fā)性公共事件頻繁出現,。社會認知管理在處置突發(fā)事件中的作用日益凸顯,,它能夠在突發(fā)性公共事件發(fā)生時對公眾的心理活動過程進行干預和引導,從而及時有效地糾正公眾認知的偏差,。信息發(fā)布作為社會認知管理的主要手段,,有多種方式,在大數據時代背景下,,網絡信息的發(fā)布是極為重要的一種方式,。對網絡信息發(fā)布的受關注程度進行評價,能夠在一定程度上體現政府的認知管理效果,。針對當前媒體網絡建設水平參差不齊,、信息發(fā)布受公眾關注度不高、缺乏有效的信息評價機制的現狀,,本文致力于通過基于Hadoop[14]的網頁排序技術對突發(fā)性公共事件中各網站信息發(fā)布的受關注度進行綜合排序打分,,找出影響關注度的主要因素,,以此來推動網站信息發(fā)布水平的提升,進而提升政府的社會認知管理水平,。

1當前認知管理中存在的問題

  在大數據時代,,由于信息傳播的速度和廣度前所未有,因此政府開展認知管理活動更加困難,。宋園園[5]認為,,在大數據背景下的突發(fā)公共事件中,政府,、媒體和公眾是危機管理的三大核心力量,,本文分別從這三個方面探討當前認知管理中存在的問題。

  在政府層面存在的問題主要有:管理者缺乏社會認知管理意識,,官本位思想依然存在,,政府在信息系統(tǒng)方面還相對薄弱等。在媒體層面,,存在官方媒體信息傳播職能相對弱化,、個別媒體單純地只做政府的發(fā)言人和撰稿人、信息收集渠道過窄,、信息發(fā)布不全不準等問題,。在公眾層面,存在公共危機意識薄弱,、對各種媒介信息的判斷能力普遍較差等問題,。

  當前,由于國內外對社會認知管理的研究還沒有形成統(tǒng)一的理論體系,,缺乏對認知管理水平的評價標準,。針對該問題,本文引入信息檢索技術中的網頁排序技術,,通過對公共突發(fā)事件發(fā)生后媒體的網絡信息發(fā)布受關注程度進行評價,,進而對影響受關注度的因素加以分析,提出建議,,提升社會認知管理水平。

2PageRank算法

  PageRank算法由斯坦福大學的PAGE L[6]提出,該排序算法根據網頁間鏈接信息迭代計算得到,。用有向圖G(V,E)表示網絡頁面間的鏈接關系,,其中V是網頁集合,E是邊集(當且僅當存在從頁面i到頁面j的鏈接時,,存在相應的邊),。

  計算PageRank的過程是求矩陣特征向量的過程:M表示有向圖G的聯接矩陣, 當存在節(jié)點j到i的邊時,矩陣元素[i,j]的值為1/Nj,否則賦值0,其滿足:

  x=Mx(1)

  其中,x表示各頁面構成的向量,。根據構成可得,矩陣M最大特征值為1;x為1對應的特征向量,使用簡單迭代法對以上公式求解,。M必須滿足兩個條件,迭代過程才會收斂:(1)M是非循環(huán)的;(2)M為強制連通,。條件(1)由網絡結構來保證,條件(2)通過在迭代過程中增加一個阻尼因子c來保證。新公式定義如下:

  2.png

  此時,在保證迭代收斂的同時,PageRank定義轉變如下:設頁面z1, z2,,…,,zn鏈接指向頁面i,則

  3.png

  其中阻尼因子c為0.15,N(z)n為網頁(z)n的出鏈個數,(1-c)為阻尼系數,。

  PageRank算法中,,由于網頁的內外部鏈接需要時間的積累,收錄數與反鏈數隨著時間的積累而增加, PageRank的計算方法會使新網頁PR值偏低,導致歧視新網頁的現象,。而公共危機發(fā)生后對信息發(fā)布時效性要求較高,,故需要在傳統(tǒng)算法的基礎上添加時間權重。公眾對信息的實時需求較高,網頁被檢索到的時間與公共事件發(fā)生的時間差值越大,則網頁內容價值相對越低,。信息發(fā)布時間差Td的計算公式為:

  Td=(Eq-Ec)×24+(Fq-Fc)(4)

  式中:Eq,、Fq分別為檢索時間的天數、小時;Ec,、Fc分別為網頁發(fā)布時間的天數,、小時。

  3NK64KX4]PEI6DO%NWP_P11.png

  Ti表示突發(fā)公共事件發(fā)生后,,信息發(fā)布距事件發(fā)生在各時間段的賦值,。

3實驗結果及分析

  整個實驗包括數據集的獲取、預處理,、實驗設計和結果分析四個部分,。本文使用3臺PC搭建Hadoop的分布式計算平臺,分別為PC1~PC3,。其中:PC1作Master,;PC2~PC3作Slave。每臺PC具體配置硬件環(huán)境為:Intel Core 2 Duo 2.20 GHz CPU,;2 GB內存,;300 GB硬盤;千兆網卡,。軟件環(huán)境為Radhat 7,;Hadoop 0.20。

  3.1網頁數據的獲取

  本文以新聞類應用為例,,網絡蜘蛛負責獲取網頁數據, 網頁來自新華網,、環(huán)球網、搜狐,、新浪,、網易、騰訊、鳳凰網等各大門戶網站,,設定查詢時間為突發(fā)公共事件72小時以內上述網站有關的新聞報道,,經過約24小時網絡蜘蛛的運行共爬取5×104張符合條件的新聞網頁。

  3.2實驗設計及結果分析

  3.2.1實驗設計

  本文分別以“青島38元一只大蝦事件”,、“美軍拉森號艦艇進入南海島礁12海里事件”等查詢詞作為突發(fā)公共事件類應用實驗參數,,以PageRank值的變化量小于0.000 1作為算法收斂條件,求得事件發(fā)生后72小時內各網站報道的新聞頁面的PR平均值,。依據數值大小進行排名,。

  3.2.2實驗結果分析

  表1顯示,在事件1~3中,,環(huán)球網和新華網在排序中較靠后,,沒有較強從屬關系的鳳凰、網易等網頁排序較靠前,。事件4中,,環(huán)球網和新華網排名有所提升,但仍然沒有排在前列,。

001.jpg 

  表2顯示,,在添加時間權重后,環(huán)球網和新華網排名有所下降,。

  

002.jpg

  綜上所述,,可以得到如下啟示:一是在突發(fā)公共事件中官方網站發(fā)布的消息受到的公眾關注度遠低于當前主流媒體所發(fā)布的消息,在綜合排名中相對位置比較靠后,;二是在對外的突發(fā)事件中,,官方媒體排序相對較高,說明在對外事件中,,公眾對官網消息的認可度較高,;三是在加入時間權重后,官方網站的排名更加靠后,,說明官方網站消息的時效性不強,,遠遠滯后于當前主流媒體;四是在統(tǒng)計中發(fā)現,,官方網站發(fā)布的新聞數量和篇幅都遠低于主流媒體,,所報道內容不全面、不完整也是官方網頁受關注度不高的原因,。

4結論

  本文通過對公共突發(fā)事件和認知管理特點的研究,,提出了通過PageRank排序算法對突發(fā)公共事件網絡新聞報道進行關注度排名的方法,并將算法在Hadoop分布式計算平臺上實現,。實驗結果在一定程度上能夠反映各大主流媒體在突發(fā)事件的網絡新聞傳播中受公眾關注的程度。

參考文獻

  [1] RAJARAMAN A,,ULLMAN J D.大數據互聯網大規(guī)模數據挖掘分布式處理[M].北京:人民郵電出版社,,2013.

  [2] 陸嘉恒.大數據挑戰(zhàn)與NoSQL 數據庫技術[M].北京:電子工業(yè)出版社,, 2013.

 ?。?] 馬東杰.基于IEEE 802.15.4的接人算法研究[D].秦皇島:燕山大學,2012.

 ?。?] Wen Hao,,Lin Chang,Chen Zhijia,,et al.An improved Markov model for IEEE 802.15.4 slotted CSMA/CA mechanism[J].Journal of Computer Science and Technology,,2009,24(3):495504.

 ?。?] 宋園園.公共危機治理中認知管理的解析與構建[J].行政領導,2012(20):1418.

 ?。?] BRIN S, MOTWANI R, PAGE L, et al. What can you do with a Web in your pocket Bull[J]. Data Engineering Bulletin,1998,21(1):3747.


此內容為AET網站原創(chuàng),未經授權禁止轉載,。