《電子技術(shù)應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 設計應用 > 基于重點突發(fā)詞的突發(fā)事件檢測方法
基于重點突發(fā)詞的突發(fā)事件檢測方法
2020年電子技術(shù)應用第11期
富雅玲1,,楊文忠1,,2,,吾守爾·斯拉木1,楊蒙蒙1,,梁 凡1
1.新疆大學 信息科學與工程學院,,新疆 烏魯木齊830046; 2.中國電子科學研究院 社會安全風險感知與防控大數(shù)據(jù)應用國家工程實驗室,,新疆 烏魯木齊830000
摘要: 由于突發(fā)事件具有突發(fā)性,、聚眾性、破壞性,,針對微博中發(fā)布的突發(fā)事件,,避免由突發(fā)事帶來一系列社會問題,,提出一種結(jié)合用戶影響力和突發(fā)詞的突發(fā)事件檢測方法。為提取大量重點突發(fā)詞,,使用詞影響力和詞狀態(tài)兩個指標計算詞突發(fā)值,,將大于一定閾值的詞作為突發(fā)詞;采用凝聚層次聚類方法,,對突發(fā)詞集的共現(xiàn)矩陣進行聚類得到熱點話題。之后將結(jié)果放入訓練好的分類器對熱點話題進行分類,最終得到突發(fā)事件及其類型,。使用真實的微博數(shù)據(jù)對其進行實驗,,對比使用分類器前后的實驗結(jié)果,該方法可以有效過濾一般熱點話題,,提高突發(fā)事件檢測的準確率,。
中圖分類號: TP391.1
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200148
中文引用格式: 富雅玲,楊文忠,,吾守爾·斯拉木,,等. 基于重點突發(fā)詞的突發(fā)事件檢測方法[J].電子技術(shù)應用,2020,,46(11):82-86.
英文引用格式: Fu Yaling,,Yang Wenzhong,Woxur Silamu,,et al. Method of bursty events detection based on key bursty-words[J]. Application of Electronic Technique,,2020,46(11):82-86.
Method of bursty events detection based on key bursty-words
Fu Yaling1,,Yang Wenzhong1,,2,Woxur Silamu1,,Yang Mengmeng1,,Liang Fan1
1.College of Information Science and Engineering,Xinjiang University,,Urumqi 830046,,China; 2.National Engineering Laboratory of Social Security Risk Perception and Prevention and Control of Big Data Application,, Chinese Academy of Electronic Sciences,,Urumqi 830000,China
Abstract: Because of the suddenness, crowd-gathering and destructiveness of bursty events, this paper proposes an bursty event detection method combining user influence and bursty-words for the bursty events published in weibo to avoid a series of social problems caused by bursty events. In order to extract a large number of key burst-words, we need to first calculate the bursty value of words, using two indicators: word influence and word state, taking words larger than a certain threshold as burst words; adopting cohesive hierarchical clustering method, hot topics are clustered by the co-occurrence matrix of burst word sets. After that, the results were put into the trained classifier to classify hot topics, and finally the bursty events and their types were obtained. The real microblog data were used to conduct bursty events on them. The experimental results before and after the use of the classifier were compared. This method can effectively filter common hot topics and improve the accuracy of emergency detection.
Key words : bursty event,;burst word,;clustering;classification,;event detection

0 引言

    微博因其良好的服務和海量的用戶而被大眾所熟知,,現(xiàn)已成為國內(nèi)最大的社交媒體,。突發(fā)事件具有突發(fā)性和破壞性,在發(fā)生突發(fā)性事件,,網(wǎng)民在社交媒體上進行傳播,,沒有相應的法律條款來對事件采取相應措施,對應急管理會形成一些障礙,,如果不能及時遏制事件發(fā)展的趨勢,,將會給社會帶來一些負面影響。社交網(wǎng)絡中的突發(fā)事件是指在社交網(wǎng)絡中先前若干時間段內(nèi)該事件很少被用戶討論或者被討論頻次呈現(xiàn)平穩(wěn)分布,,但在當前時間段內(nèi)以高頻次出現(xiàn)的事件[1],。事件檢測有助于及時了解人們對事件的看法和實際情況,減少突發(fā)事件信息搜索的任務,,這一工作為自然語言處理(NLP)和機器學習的研究提供了方向[2],。因此,快速有效地檢測到突發(fā)事件,,及時消除突發(fā)事件可能帶來的社會負面效應,,變得尤為重要。綜合以上分析,,提出一種結(jié)合用戶影響力和突發(fā)詞的突發(fā)事件檢測方法,,對突發(fā)事件及其類型進行檢測。




本文詳細內(nèi)容請下載:http://forexkbc.com/resource/share/2000003060




作者信息:

富雅玲1,,楊文忠1,,2,吾守爾·斯拉木1,,楊蒙蒙1,,梁  凡1

(1.新疆大學 信息科學與工程學院,新疆 烏魯木齊830046,;

2.中國電子科學研究院 社會安全風險感知與防控大數(shù)據(jù)應用國家工程實驗室,,新疆 烏魯木齊830000)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。