隨著大數(shù)據(jù)時代的到來,,流動的數(shù)據(jù)已成為連接全世界的載體,,也成為促進(jìn)經(jīng)濟社會發(fā)展、便利人們生產(chǎn)生活的源動力,。伴隨著數(shù)據(jù)流動,,尤其是為了解決流動過程中產(chǎn)生的一系列問題,“數(shù)據(jù)治理”一詞逐漸興起,。而要了解數(shù)據(jù)治理,,還得從數(shù)據(jù)、治理這些基本概念說起,。
1. 數(shù)據(jù)
什么是數(shù)據(jù),?傳統(tǒng)意義上,數(shù)據(jù)是指人類對事物進(jìn)行測量的結(jié)果,。如今,,數(shù)據(jù)的概念有了很多延展。一般而言,,數(shù)據(jù)是指對客觀事件進(jìn)行記錄并可以鑒別的符號,,是對客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號或這些物理符號的組合,。這些物理符號具有抽象,、非隨機的特點。
從數(shù)據(jù)的定義來看,,數(shù)據(jù)具有兩個特征,,一個是差異性,,另一個是規(guī)律性。差異性主要體現(xiàn)為數(shù)據(jù)多數(shù)描述的是事物的數(shù)量特征,,現(xiàn)實世界中每件事,、每個人、每種物都有不同的特征,,因此反映于數(shù)據(jù)也會有各種不同的表現(xiàn),,甚至從表面看起來可能是雜亂無章的。規(guī)律性則主要體現(xiàn)為,,數(shù)據(jù)是具有一定規(guī)律的,,對數(shù)據(jù)進(jìn)行分析研究,很重要的目的就是從數(shù)據(jù)中找出某種規(guī)律和關(guān)聯(lián),。簡而言之,,正因為數(shù)據(jù)具有差異性,才有必要對數(shù)據(jù)進(jìn)行研究與分析,;也正因為數(shù)據(jù)存在規(guī)律性,,對其研究才有價值。
時下,,人們往往容易將數(shù)據(jù)與大數(shù)據(jù)混淆,。實際上,兩者是有區(qū)別的,。
對于大數(shù)據(jù),,麥肯錫全球研究所給出的定義如下:大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲,、管理,、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合;高德納(Gartner)咨詢公司給出的定義如下:大數(shù)據(jù)是需要新處理模式才能具有更強的決策力,、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量,、高增長率和多樣化的信息資產(chǎn)。維克托· 邁爾· 舍恩伯格在《大數(shù)據(jù)時代》一書中提出,,大數(shù)據(jù)不能用隨機分析法(抽樣調(diào)查)這樣的捷徑,,而要對所有數(shù)據(jù)進(jìn)行分析處理。
業(yè)界普遍認(rèn)為,,大數(shù)據(jù)具有數(shù)據(jù)規(guī)模海量(Volume),、數(shù)據(jù)流轉(zhuǎn)快速(Velocity)、數(shù)據(jù)類型多樣(Variety)和數(shù)據(jù)價值巨大(Value)四大特征,。
?。?)數(shù)據(jù)規(guī)模海量
當(dāng)前,以大數(shù)據(jù),、物聯(lián)網(wǎng),、人工智能為核心特征的數(shù)字化浪潮正席卷全球,,全世界每時每刻都在產(chǎn)生大量的數(shù)據(jù)。從1956年IBM發(fā)明世界上第一個機械硬盤,,兩臺冰箱大小卻只有5MB容量,,到現(xiàn)在淘寶網(wǎng)4億用戶每天產(chǎn)生幾十TB的數(shù)據(jù),數(shù)據(jù)總量呈指數(shù)級增長,。衡量數(shù)據(jù)大小的單位也從MB到GB,,到TB,再到PB,、EB,,相信后面還會不斷出現(xiàn)新的記錄單位。當(dāng)數(shù)據(jù)數(shù)量和規(guī)模發(fā)展到一定程度時,,現(xiàn)有的數(shù)據(jù)存儲,、分析、計算的方案和技術(shù)勢必不能滿足現(xiàn)實需求,,迫切需要更智能的算法,、更強大的數(shù)據(jù)處理平臺和更新的數(shù)據(jù)處理技術(shù)來挖掘數(shù)據(jù)價值。
?。?)數(shù)據(jù)流轉(zhuǎn)快速
與傳統(tǒng)的圖書、報紙,、廣播等數(shù)據(jù)載體不同,,數(shù)據(jù)產(chǎn)生和傳播的速度非常快,,數(shù)據(jù)被高速地創(chuàng)建,、移動、匯集到服務(wù)器,?;诖耍髷?shù)據(jù)對數(shù)據(jù)處理有著非常嚴(yán)格的要求,。大數(shù)據(jù)的處理需符合秒級定律,,一般要在秒級時間范圍內(nèi)給出對數(shù)據(jù)的分析結(jié)果。響應(yīng)時間過長,,數(shù)據(jù)就失去了價值,。換言之,誰的數(shù)據(jù)處理速度快,,誰在大數(shù)據(jù)時代就具備優(yōu)勢,。
(3)數(shù)據(jù)類型多樣
傳感器,、智能設(shè)備及移動互聯(lián)網(wǎng)的飛速發(fā)展使數(shù)據(jù)變得更加復(fù)雜,,除了傳統(tǒng)的關(guān)系型數(shù)據(jù),,還包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),。大數(shù)據(jù)時代,,需要處理的數(shù)據(jù)不僅是海量的,而且是不同種類,、不同格式和不同來源的,,因此需要一套專門的格式、標(biāo)準(zhǔn)來進(jìn)行處理,。
?。?)數(shù)據(jù)價值巨大
大數(shù)據(jù)最大的特點在于通過各種數(shù)據(jù)分析和挖掘方法,發(fā)現(xiàn)諸多看似無關(guān)的數(shù)據(jù)之間暗含的規(guī)律和關(guān)聯(lián),。例如,,阿里巴巴集團(tuán)每天擁有幾億人的購物數(shù)據(jù),通過分析這些數(shù)據(jù)就可以知道各種產(chǎn)品和市場發(fā)展的走勢,,也可以知道不同用戶的愛好和需求,,從而進(jìn)行針對性的推薦,以提高平臺的交易量,。不過,,我們也要看到,雖然大數(shù)據(jù)的價值巨大,,但并不是所有數(shù)據(jù)都擁有這樣的價值,。如果把大數(shù)據(jù)比作一座金礦,有價值的數(shù)據(jù)就是其中的黃金,,這種價值需要一系列加工和處理才可能得到釋放,。
在數(shù)字經(jīng)濟的發(fā)展歷程中,數(shù)據(jù)起到了核心和關(guān)鍵作用,,人們對數(shù)據(jù)價值的認(rèn)識也是由淺入深,、由簡單趨向復(fù)雜??傮w來看,,數(shù)據(jù)價值的發(fā)展主要分為三個階段:第一階段是數(shù)據(jù)資源階段,數(shù)據(jù)是記錄,、反映現(xiàn)實世界的一種資源,;第二階段是數(shù)據(jù)資產(chǎn)階段,數(shù)據(jù)不僅是一種資源,,還是一種資產(chǎn),,是個人或企業(yè)資產(chǎn)的重要組成部分,是創(chuàng)造財富的基礎(chǔ),;第三階段是數(shù)據(jù)資本階段,,數(shù)據(jù)的資源和資產(chǎn)的特性得到進(jìn)一步發(fā)揮,,與價值進(jìn)行結(jié)合,通過交易等各種流動方式,,最終變?yōu)橘Y本,。
(5)數(shù)據(jù)資源
與傳統(tǒng)的農(nóng)業(yè)經(jīng)濟和工業(yè)經(jīng)濟不同,,數(shù)字經(jīng)濟得以發(fā)展的基礎(chǔ)是信息技術(shù)和海量數(shù)據(jù),。隨著信息技術(shù)與經(jīng)濟社會的交匯融合,數(shù)據(jù)成為國家的基礎(chǔ)性戰(zhàn)略資源,,成為驅(qū)動經(jīng)濟社會發(fā)展的新興生產(chǎn)要素,,與勞動、土地,、資本等其他生產(chǎn)要素一同為經(jīng)濟社會的發(fā)展創(chuàng)造價值,。
但是,數(shù)據(jù)與這些傳統(tǒng)生產(chǎn)要素不同,,它具有可再生,、無污染、無限性的特征,??稍偕侵笖?shù)據(jù)資源不是從大自然獲得的,而是人類自己生產(chǎn)出來的,,通過加工處理后的數(shù)據(jù)還可以成為新的數(shù)據(jù)資源,;無污染是指數(shù)據(jù)在獲得與使用的過程中不會污染環(huán)境;無限性是指數(shù)據(jù)在使用過程中不會變少,,而是越變越多。因此,,傳統(tǒng)資源越用越少,,但數(shù)據(jù)資源是越用越多。
數(shù)據(jù)成為資源,,也是發(fā)現(xiàn)和利用數(shù)據(jù)價值的一個過程,,這一點與傳統(tǒng)資源如石油比較相似。首先,,要發(fā)現(xiàn)各種有用數(shù)據(jù)的來源,,如同勘探油礦;其次,,要采集滿足特定需求的數(shù)據(jù),,如同采油;然后,,要把采集到的數(shù)據(jù)按應(yīng)用需求進(jìn)行標(biāo)準(zhǔn)化,、結(jié)構(gòu)化處理,,如同煉油;最后,,將加工處理后形成的數(shù)據(jù)與實際應(yīng)用相結(jié)合,,最大程度地發(fā)揮數(shù)據(jù)的作用。因此,,在這個階段,,數(shù)據(jù)是作為一種具有使用價值的資源幫助管理者決策,從而實現(xiàn)其經(jīng)濟效益,,同時也成為數(shù)字經(jīng)濟發(fā)展的關(guān)鍵生產(chǎn)要素,。
(6)數(shù)據(jù)資產(chǎn)
隨著數(shù)字經(jīng)濟的發(fā)展,,人們發(fā)現(xiàn),,數(shù)據(jù)不僅僅是資源,還具備資產(chǎn)的特質(zhì),。所謂資產(chǎn),,是指由企業(yè)過去經(jīng)營交易或由各項事項形成的、被企業(yè)擁有或控制的,、預(yù)期會給企業(yè)帶來經(jīng)濟利益的資源,。從資產(chǎn)的界定來看,它具有現(xiàn)實性,、可控性和經(jīng)濟性三個基本特征?,F(xiàn)實性是指資產(chǎn)必須是現(xiàn)實已經(jīng)存在的,還未發(fā)生的事物不能稱為資產(chǎn),;可控性是指對企業(yè)的資產(chǎn)要有所有權(quán)或控制權(quán),;經(jīng)濟性是指資產(chǎn)預(yù)期能給企業(yè)帶來經(jīng)濟效益。結(jié)合資產(chǎn)的特征,,數(shù)據(jù)資產(chǎn)便是指企業(yè)在生產(chǎn)經(jīng)營管理活動中形成的,,可擁有或可控制其產(chǎn)生及應(yīng)用全過程的、可量化的,、預(yù)期能給企業(yè)帶來經(jīng)濟效益的數(shù)據(jù),。實現(xiàn)數(shù)據(jù)可控制、可量化與可變現(xiàn)屬性,,體現(xiàn)數(shù)據(jù)價值的過程,,就是數(shù)據(jù)資產(chǎn)化過程。當(dāng)前,,數(shù)據(jù)已經(jīng)滲入各行各業(yè),,逐步成為企業(yè)不可或缺的戰(zhàn)略資產(chǎn),企業(yè)所掌握的數(shù)據(jù)規(guī)模、數(shù)據(jù)的鮮活程度,,以及采集,、分析、處理,、挖掘數(shù)據(jù)的能力決定了企業(yè)的核心競爭力,。
(7)數(shù)據(jù)資本
2016年3月,,麻省理工科技評論與甲骨文公司聯(lián)合發(fā)布了名為《數(shù)據(jù)資本的興起》的研究報告,。報告指出,數(shù)據(jù)已經(jīng)成為一種資本,,和金融資本一樣,,能夠產(chǎn)生新的產(chǎn)品和服務(wù)。但是,,與實物資本不同,,數(shù)據(jù)資本也有自身的特性。例如,,非競爭性,,即實物資本不能多人同時使用,但是數(shù)據(jù)資本由于數(shù)據(jù)的易復(fù)制拷貝特點,,其使用方可以無限多,;不可替代性,即實物資本是可以替換的,,人們可以用一桶石油替換另一桶石油,,而數(shù)據(jù)資本則不行,因為不同的數(shù)據(jù)包含不同的信息,,其所包含的價值也是不同的,。數(shù)據(jù)資本化的過程,就是將數(shù)據(jù)資產(chǎn)的價值和使用價值折算成股份或出資比例,,通過數(shù)據(jù)交易和數(shù)據(jù)流動變?yōu)橘Y本的過程,。換句話說,數(shù)據(jù)作為資本的價值要在數(shù)據(jù)交易和流動中才能得到充分體現(xiàn),。這也引發(fā)了當(dāng)前業(yè)界的一大難題,即數(shù)據(jù)產(chǎn)權(quán)問題,。只有確定了數(shù)據(jù)產(chǎn)權(quán)問題,,數(shù)據(jù)交易才具備順利開展的前提基礎(chǔ)。
2. 治理
對于對大數(shù)據(jù)感興趣的人來說,,“數(shù)據(jù)治理”這個詞并不陌生,。但要全面深刻地理解數(shù)據(jù)治理,還應(yīng)該從“治理”說起。在英語中,,“治理”一詞源自拉丁文“gubernare”,,原意是控制、引導(dǎo)和操縱,,后來逐漸演化成“governor”及“government”,。
治理的概念是20世紀(jì)90年代在全球范圍內(nèi)逐步興起的。治理理論的主要創(chuàng)始人之一詹姆斯· N.羅西瑙認(rèn)為,,治理是通行于規(guī)制空隙之間的那些制度安排,,當(dāng)兩個或更多規(guī)制出現(xiàn)重疊、沖突時或者在相互競爭的利益之間需要調(diào)解時發(fā)揮作用的原則,、規(guī)范,、規(guī)則和決策程序。另一位治理研究專家格里·斯托克指出,,治理的本質(zhì)在于它所偏重的統(tǒng)治機制并不依靠政府的權(quán)威和制裁,;它所要創(chuàng)造的結(jié)構(gòu)和秩序不能從外部強加;它發(fā)揮作用是要依靠多種進(jìn)行統(tǒng)治的以及互相發(fā)生影響的行為者的互動,。
國內(nèi)學(xué)者俞可平提出,,治理具有四個特征:1)治理不是一套規(guī)則條例,也不是一種活動,,而是一個過程,;2)治理的建立不以支配為基礎(chǔ),而以調(diào)和為基礎(chǔ),;3)治理同時涉及公共和私營部門,;4)治理并不意味著一種正式制度,而有賴于持續(xù)的相互作用,。
國際組織對治理也有各自的理解,。世界銀行認(rèn)為,治理是“為發(fā)展而管理一個國家經(jīng)濟和社會資源的權(quán)力”,。聯(lián)合國全球治理委員會將治理界定為“個人和各種公共或私營的機構(gòu)管理共同事務(wù)的諸多方式之總和,,一種使相互沖突的利益得以調(diào)和并采取聯(lián)合行動的持續(xù)過程”。
綜上所述,,治理就是政府,、企業(yè)、個人以及非政府組織等主體為了管理共同事務(wù),,以正式制度,、規(guī)則和非正式安排的方式相互協(xié)調(diào)并持續(xù)互動的一個過程。
3. 數(shù)據(jù)治理
數(shù)據(jù)治理具有治理的很多特征,。例如,,需要政府、企業(yè)、個人以及非政府組織等共同努力,,也需要建立一套立法,、規(guī)章、制度和規(guī)則,。然而,,由于治理的是數(shù)據(jù),它又有很多自身的特點,。目前,,關(guān)于數(shù)據(jù)治理的定義亦是眾說紛紜。
根據(jù)國際標(biāo)準(zhǔn)化組織IT服務(wù)管理與IT治理分技術(shù)委員會,、國際數(shù)據(jù)治理研究所(DGI),、IBM數(shù)據(jù)治理委員會等機構(gòu)的觀點,數(shù)據(jù)治理意指建立在數(shù)據(jù)存儲,、訪問,、驗證、保護(hù)和使用之上的一系列程序,、標(biāo)準(zhǔn),、角色和指標(biāo),以期通過持續(xù)的評估,、指導(dǎo)和監(jiān)督,,確保富有成效且高效的數(shù)據(jù)利用,實現(xiàn)企業(yè)價值,。數(shù)據(jù)治理的范圍如圖1所示,。
圖1 數(shù)據(jù)治理的范圍
中國在國際場合首次提出“數(shù)據(jù)治理”的概念,是2014年6月在悉尼召開的ISO/IEC JTC1/SC40(IT治理和IT服務(wù)管理分技術(shù)委員會)第一次全會上,。這個概念一經(jīng)提出,,即引發(fā)了國際同行的興趣和持續(xù)研討。
2014年11月,,在荷蘭召開的SC40/WG1(IT治理工作組)第二次工作組會議上,,中國代表提出了《數(shù)據(jù)治理白皮書》的框架設(shè)想,分析了世界上包括國際數(shù)據(jù)管理協(xié)會(DAMA),、國際數(shù)據(jù)治理研究所,、IBM、高德納咨詢公司等組織在內(nèi)的主流的數(shù)據(jù)治理方法論,、模型,,獲得了國際IT治理工作組專家的一致認(rèn)可。2015年3月,,中國信息技術(shù)服務(wù)標(biāo)準(zhǔn)(ITSS)數(shù)據(jù)治理研究小組通過走訪調(diào)研,形成了金融、移動通信,、央企能源,、互聯(lián)網(wǎng)企業(yè)在數(shù)據(jù)治理方面的典型案例,進(jìn)一步明確了數(shù)據(jù)治理的定義和范圍,,并于2015年5月在巴西圣保羅召開的SC40/WG1第三次工作組會議上正式提交了《數(shù)據(jù)治理白皮書》國際標(biāo)準(zhǔn)研究報告,。報告認(rèn)為,數(shù)據(jù)是資產(chǎn),,通過服務(wù)產(chǎn)生價值,。數(shù)據(jù)治理主要是在數(shù)據(jù)產(chǎn)生價值的過程中,治理團(tuán)隊對其做出的評價,、指導(dǎo),、控制。
上述幾個關(guān)于數(shù)據(jù)治理的界定,,內(nèi)涵已經(jīng)十分豐富,,要義也得到了明確的體現(xiàn),但還是未能囊括數(shù)據(jù)治理的全部,。
首先,,數(shù)據(jù)不僅僅是企業(yè)或機構(gòu)的資產(chǎn),更是現(xiàn)代國家的一種基礎(chǔ)戰(zhàn)略資源,。曾有人提出,,大數(shù)據(jù)時代世界上最有價值的資源不再是石油,而是數(shù)據(jù),。這種提法絲毫未夸大數(shù)據(jù)的重要作用,。煤炭和石油等傳統(tǒng)資源是有限的,而大數(shù)據(jù)作為新型資源,,由于具有可復(fù)制,、遞增、共享等特性,,其開發(fā)和增長是無限的,。更重要的是它改變了傳統(tǒng)要素格局,新知識和新技術(shù)替代資本成為經(jīng)濟發(fā)展的主導(dǎo)因素,,符合智慧,、綠色、共享和低成本的可持續(xù)發(fā)展理念,,將助力實現(xiàn)發(fā)展方式的真正轉(zhuǎn)變,。
其次,數(shù)據(jù)治理的目的不僅僅是確保數(shù)據(jù)的高效利用和實現(xiàn)企業(yè)價值,,更是為了提升政府公共管理能力和國家治理能力,。正如《數(shù)據(jù)治理白皮書》所描述的,,企業(yè)開展有效的數(shù)據(jù)治理,會通過改進(jìn)決策,、縮減成本,、降低風(fēng)險和提高安全合規(guī)等方式將價值回饋于業(yè)務(wù),并最終體現(xiàn)為增加收入和利潤,。但是,,擁有數(shù)據(jù)的往往并不只是企業(yè)。有統(tǒng)計顯示,,政府擁有全社會80%的數(shù)據(jù)資源,,通過運用大數(shù)據(jù)、云計算等現(xiàn)代信息技術(shù),,形成“用數(shù)據(jù)決策,、用數(shù)據(jù)管理、用數(shù)據(jù)服務(wù)”的公共管理與服務(wù)機制,,能夠有效提升政府公共管理能力和國家治理能力,,促進(jìn)經(jīng)濟社會的快速健康發(fā)展。
再次,,開展數(shù)據(jù)治理不僅僅局限于企業(yè),,政府和個人更是數(shù)據(jù)治理的重要主體。當(dāng)前,,無論國際,、國內(nèi),提到數(shù)據(jù)治理基本都是指企業(yè)行為,,但實際上政府在數(shù)據(jù)治理中能夠發(fā)揮更主動的作用,。例如,開展數(shù)據(jù)治理頂層設(shè)計,、推動政務(wù)數(shù)據(jù)開放共享,、建立完善的數(shù)據(jù)權(quán)責(zé)體系等。個人也應(yīng)該積極參與數(shù)據(jù)治理,。由于政府和企業(yè)收集的信息中有相當(dāng)大的部分是個人信息和數(shù)據(jù),,而近年來泄露、濫用和非法買賣個人信息的現(xiàn)象十分嚴(yán)重,,給部分民眾造成了巨大的經(jīng)濟損失和精神傷害,。所以,個人參與數(shù)據(jù)治理主要是積極保護(hù)個人信息和維護(hù)個人權(quán)益,。
最后,,數(shù)據(jù)治理不僅僅依靠模型和框架,還要采用法律,、行政,、教育,、道德倫理等方法和手段。當(dāng)前,,圍繞對數(shù)據(jù)的采集,、分析、挖掘,、應(yīng)用、共享和保護(hù)等出現(xiàn)了諸多問題,,亟需通過出臺數(shù)據(jù)立法和行政規(guī)章制度加以明確和規(guī)范,。針對數(shù)據(jù)利用過程中出現(xiàn)的一系列安全隱患,要加強網(wǎng)絡(luò)安全教育和培訓(xùn),,提升從業(yè)人員的專業(yè)素質(zhì)和普通民眾的意識技能,。對于那些倒買倒賣生物特征信息等敏感數(shù)據(jù)的行為,要輔之以倫理和道德方面的分析和教化,,必要時可在立法中加大處罰力度,。
綜上所述,從宏觀層面看,,數(shù)據(jù)治理是指政府等公共機構(gòu),、企業(yè)等私營機構(gòu)以及個人,為了最大程度地挖掘和釋放數(shù)據(jù)價值,,推動數(shù)據(jù)安全,、有序流動而采取政策、法律,、標(biāo)準(zhǔn),、技術(shù)等一系列措施的過程,如圖2所示,。從微觀層面看,,數(shù)據(jù)治理是不同的機構(gòu)對各種各樣的元數(shù)據(jù)進(jìn)行處理和分析的過程,如圖3所示,。換句話說,,無論何種主體以何種方式,只要圍繞數(shù)據(jù)安全,、有序流動所采取的行動,,就是數(shù)據(jù)治理的范疇。
圖2 宏觀層面的數(shù)據(jù)治理
圖3 微觀層面的數(shù)據(jù)治理