“大數(shù)據(jù)”是近年來IT行業(yè)的熱詞,,大數(shù)據(jù)在各個(gè)行業(yè)的應(yīng)用逐漸變得廣泛起來。那么,,什么是大數(shù)據(jù),?大數(shù)據(jù)時(shí)代怎么理解呢?
大數(shù)據(jù)的定義:大數(shù)據(jù),,又稱巨量資料,,指的是所涉及的數(shù)據(jù)資料量規(guī)模巨大到無法通過人腦甚至主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取,、管理,、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊,。
大數(shù)據(jù)的特點(diǎn):數(shù)據(jù)量大,、數(shù)據(jù)種類多、要求實(shí)時(shí)性強(qiáng),、數(shù)據(jù)所蘊(yùn)藏的價(jià)值大,。在各行各業(yè)均存在大數(shù)據(jù),但是眾多的信息和咨詢是紛繁復(fù)雜的,,我們需要搜索,、處理、分析,、歸納,、總結(jié)其深層次的規(guī)律。
大數(shù)據(jù)的采集:科學(xué)技術(shù)及互聯(lián)網(wǎng)的發(fā)展,,推動(dòng)著大數(shù)據(jù)時(shí)代的來臨,,各行各業(yè)每天都在產(chǎn)生數(shù)量巨大的數(shù)據(jù)碎片,數(shù)據(jù)計(jì)量單位已從從Byte,、KB,、MB、 GB,、TB發(fā)展到PB,、EB、ZB、YB甚至BB,、NB,、DB來衡量。大數(shù)據(jù)時(shí)代數(shù)據(jù)的采集也不再是技術(shù)問題,,只是面對(duì)如此眾多的數(shù)據(jù),,我們?cè)鯓硬拍苷业狡鋬?nèi)在規(guī)律。
大數(shù)據(jù)的挖掘和處理:大數(shù)據(jù)必然無法用人腦來推算,、估測(cè),,或者用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式計(jì)算架構(gòu),,依托云計(jì)算的分布式處理,、分布式數(shù)據(jù)庫(kù)、云存儲(chǔ)和虛擬化技術(shù),,因此,,大數(shù)據(jù)的挖掘和處理必須用到云技術(shù)。