傳統(tǒng)的數(shù)據(jù)采集方法包括人工錄入,、調(diào)查問卷、電話隨訪等方式,,大數(shù)據(jù)時代到來后,,一個突出的變化是數(shù)據(jù)采集的方法有了質(zhì)的飛躍,下面所介紹的數(shù)據(jù)采集方式的突破直接改變著大數(shù)據(jù)應(yīng)用的場景,。
移動互聯(lián)網(wǎng)的興起讓面向移動設(shè)備的數(shù)據(jù)采集技術(shù)有了迅速發(fā)展,,目前使用最多的常稱為Android或iOS的采集SDK(Software Develop Kit),這種技術(shù)能幫助統(tǒng)計APP的基礎(chǔ)數(shù)據(jù),,包括用戶數(shù),、活躍情況,、流失比例、使用時長等,;用戶的位置,、安裝列表、通訊情況等通過授權(quán)也可以采集,。網(wǎng)絡(luò)爬蟲是另一類廣泛使用的互聯(lián)網(wǎng)采集技術(shù),,常被用于進(jìn)行大規(guī)模全網(wǎng)信息采集、輿情監(jiān)控,、競品分析等領(lǐng)域,。
物聯(lián)網(wǎng)也和大數(shù)據(jù)息息相關(guān),因為物聯(lián)網(wǎng)的關(guān)鍵技術(shù)之一是無線射頻標(biāo)簽(RFID):當(dāng)安裝有RFID微型標(biāo)簽的讀卡器在近距離發(fā)出信號時,,帶有RFID的物品能自動返回其唯一的序列號,,這樣就能實現(xiàn)自動大批量辨識物品信息的工作,。RFID技術(shù)解決了物品信息與互聯(lián)網(wǎng)實現(xiàn)自動連接的問題,,結(jié)合后續(xù)的大數(shù)據(jù)挖掘工作,能發(fā)揮其強大的威力,。
在工業(yè)制造業(yè)里,,傳感器(Sensor)是另一類常見的大數(shù)據(jù)采集裝置,它能將測量到的信息按一定規(guī)律變換為電信號輸出,,通常用于自動檢測和控制等環(huán)節(jié),。傳感器的種類極為豐富:大到機械設(shè)備、汽車,、飛機,、建筑物,小到一部智能手機,、一個智能設(shè)備,,都可以安裝很多種傳感器,傳遞溫度,、壓力,、位置、位移,、光敏,、距離、化學(xué)感應(yīng),、生物,、磁場等各類信號。未來攜帶傳感器+大數(shù)據(jù)平臺的智能設(shè)備將越來越多,,基于傳感器數(shù)據(jù)的大數(shù)據(jù)應(yīng)用才剛剛起步,,如智能醫(yī)療,,智慧城市等,這方面有著廣闊的前景,。