3D打印,、移動(dòng)互聯(lián)、機(jī)器人,、量子通信,、大數(shù)據(jù)、干細(xì)胞,、納米技術(shù)……日新月異的當(dāng)代科技一方面沖擊著我們的大腦,,另一方面已在影響乃至改變我們的生活。這些前沿科技領(lǐng)域在國內(nèi)外的進(jìn)展如何,?中國科學(xué)家身處其中發(fā)揮了何種作用,?公眾從正在醞釀的科技變革中汲取了怎樣的便利與實(shí)惠?未來又將如何發(fā)展,?本報(bào)從今天開始,,推出年終專稿“新科技改變生活”系列報(bào)道,系統(tǒng)梳理,、展示這些技術(shù)領(lǐng)域的研用現(xiàn)狀以及它們對(duì)社會(huì)生活帶來的沖擊,、改變及重構(gòu)。
經(jīng)常上網(wǎng)的你大概對(duì)這樣的場(chǎng)景并不陌生:當(dāng)你習(xí)慣性地瀏覽網(wǎng)頁時(shí),,卻驚訝地發(fā)現(xiàn)廣告欄里竟然出現(xiàn)了前幾天在購物網(wǎng)站里搜索過的商品,。“是誰干的?他怎么知道我想要買什么,?”第一次遇見這樣的狀況,,被看穿的感覺一定不好受。然而,,這恰恰是大數(shù)據(jù)時(shí)代帶給我們的一個(gè)“驚喜”。
這些年,在信息技術(shù)領(lǐng)域紅極一時(shí)的“大數(shù)據(jù)”,,正不知不覺地加緊滲透到我們的生活中,。它前所未有地豐富了我們的生活并產(chǎn)生了極大的便捷,同時(shí)也對(duì)公眾的個(gè)人隱私構(gòu)成威脅,。
任何新技術(shù)的應(yīng)用似乎都難以避免一種窘境:在機(jī)遇與風(fēng)險(xiǎn)之間尋找平衡,。信息技術(shù)領(lǐng)域同樣如此。未來,,大數(shù)據(jù)應(yīng)用將在解決現(xiàn)實(shí)問題上產(chǎn)生更多亮點(diǎn),,也必將遇到信息安全方面更為嚴(yán)峻的挑戰(zhàn)。
全方位滲透生活
早在1980年,,美國未來學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書中,,將大數(shù)據(jù)贊頌為“第三次浪潮的華彩樂章”。不過,,直到2009年,,“大數(shù)據(jù)”才開始成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。
今天,,“大數(shù)據(jù)”已經(jīng)在各行各業(yè)衍生出形形色色的數(shù)據(jù)應(yīng)用,。中國工程院院士李國杰曾表示:“推動(dòng)大數(shù)據(jù)研究的動(dòng)力主要來自企業(yè)的經(jīng)濟(jì)效益”。IBM,、谷歌,、亞馬遜、Facebook等跨國巨頭正是發(fā)展大數(shù)據(jù)技術(shù)的主要推動(dòng)者,。
2008年推出的“谷歌流感趨勢(shì)”,,至今看來仍不失為一個(gè)典型的大數(shù)據(jù)應(yīng)用范例。谷歌設(shè)計(jì)人員認(rèn)為,,人們輸入的搜索關(guān)鍵詞代表了他們的即時(shí)需要,。他們編入了“溫度計(jì)”、“肌肉疼痛”,、“發(fā)燒”,、“噴嚏”等與流感有關(guān)的關(guān)鍵詞,當(dāng)用戶輸入這些關(guān)鍵詞時(shí),,系統(tǒng)便會(huì)開始跟蹤分析,,創(chuàng)建流感圖表和地圖。
為了驗(yàn)證“谷歌流感趨勢(shì)”預(yù)警系統(tǒng)的正確性,,谷歌多次把測(cè)試結(jié)果與美國疾病控制與預(yù)防中心的報(bào)告作對(duì)比,,結(jié)果證實(shí)兩者存在很大的相關(guān)性。
中科院軟件研究所副研究員張敏告訴《中國科學(xué)報(bào)》記者:“這正是大數(shù)據(jù)的應(yīng)用方式之一,,即發(fā)現(xiàn)統(tǒng)計(jì)規(guī)律,。”她認(rèn)為,,大數(shù)據(jù)的應(yīng)用方式還包括分析個(gè)體規(guī)律和集成形成知識(shí)。
在國內(nèi),,購物網(wǎng)站對(duì)大數(shù)據(jù)應(yīng)用顯得極為積極,。中科院軟件所的幾名研究人員曾幫助淘寶網(wǎng)進(jìn)行廣告排序的改進(jìn)。他們抓取了淘寶網(wǎng)近900萬條廣告點(diǎn)擊數(shù)據(jù),,通過分析廣告類目,、展現(xiàn)位置、商品價(jià)格,、圖片內(nèi)容等因素對(duì)用戶行為的影響,,建立了用戶偏好模型。
“我們基于這些用戶偏好分析,,幫助淘寶網(wǎng)建立了新的廣告排序算法,,在線上測(cè)試中將廣告收益提高了5.5%。”該所副研究員楊達(dá)對(duì)《中國科學(xué)報(bào)》記者說,。
電商平臺(tái)的偏好,,僅僅是大數(shù)據(jù)應(yīng)用的冰山一角。在醫(yī)療,、商業(yè),、教育、金融,、軍事,、科研等領(lǐng)域,大數(shù)據(jù)技術(shù)也正在如火如荼地應(yīng)用著,。
連接虛擬與現(xiàn)實(shí)
今年7月,,華東師范大學(xué)一名女生收到來自學(xué)校勤助中心的短信:“同學(xué)你好,發(fā)現(xiàn)你上個(gè)月餐飲消費(fèi)較少,,不知是否有經(jīng)濟(jì)困難,?如有困難,可電話,、短信或郵件我,。”
事實(shí)上,這名女生因?yàn)闇p肥減少了飯卡支出,,觸發(fā)了學(xué)校對(duì)于飯卡消費(fèi)數(shù)據(jù)的監(jiān)控系統(tǒng),。這個(gè)監(jiān)控系統(tǒng)通過對(duì)飯卡消費(fèi)數(shù)據(jù)分析,了解學(xué)生的經(jīng)濟(jì)狀況,,推測(cè)如果花銷顯著少于正常情況,,校方是否應(yīng)采取必要的干預(yù)措施。
這名女生把短信截圖發(fā)到微博上,,立即引來一片贊揚(yáng)聲:“負(fù)責(zé)的學(xué)校,,讓冰冷的數(shù)據(jù)有了人性之美,。”
這一案例也成為業(yè)內(nèi)人士一直津津樂道的一個(gè)觀點(diǎn):大數(shù)據(jù)技術(shù)應(yīng)用不能僅在數(shù)據(jù)上下功夫,還需要更多地與現(xiàn)實(shí)生活相結(jié)合,。
大數(shù)據(jù)被寄予厚望的地方或許恰恰在于此——其創(chuàng)造價(jià)值的過程本身就是一場(chǎng)“商業(yè)和科學(xué)革命”,。因而,,數(shù)據(jù)處理與分析等基礎(chǔ)技術(shù)的突破已經(jīng)不是當(dāng)前的最大障礙,,關(guān)鍵在于如何從商業(yè)、社會(huì)的角度充分理解數(shù)據(jù),。
“數(shù)據(jù)背后是網(wǎng)絡(luò),,網(wǎng)絡(luò)背后是人,研究網(wǎng)絡(luò)數(shù)據(jù)實(shí)際上是研究人組成的社會(huì)網(wǎng)絡(luò),。”在2012年5月召開的第424次香山科學(xué)會(huì)議上,,李國杰提出建立一門大數(shù)據(jù)研究的“網(wǎng)絡(luò)數(shù)據(jù)科學(xué)”,重點(diǎn)研究數(shù)據(jù)背后的社會(huì)網(wǎng)絡(luò),。
就在他提出建立這門新型交叉學(xué)科之前的兩個(gè)月,,美國聯(lián)邦政府宣布了“大數(shù)據(jù)研究和發(fā)展倡議”計(jì)劃,擬用2億美元提高從大量數(shù)字?jǐn)?shù)據(jù)中訪問,、組織,、收集發(fā)現(xiàn)信息的工具和技術(shù)水平。
《大數(shù)據(jù)時(shí)代》一書的中文譯者周濤認(rèn)為,,大數(shù)據(jù)分析和利用與提升國家競(jìng)爭(zhēng)力及國民幸福程度密切相關(guān),,數(shù)據(jù)儲(chǔ)備和數(shù)據(jù)分析能力將成為未來新型國家最重要的核心戰(zhàn)略能力。
周濤稱:“包括與國家安全,、社會(huì)穩(wěn)定相關(guān)的尖端武器制造與性能模擬實(shí)驗(yàn),,群體事件以及謠言的預(yù)警和干預(yù);與國家科技能力相關(guān)的等離子即高能粒子實(shí)驗(yàn)分析,,納米材料及生物基因工程,;與國民經(jīng)濟(jì)繁榮相關(guān)的經(jīng)濟(jì)金融態(tài)勢(shì)感知與失穩(wěn)預(yù)測(cè),精準(zhǔn)營銷與智能物流倉儲(chǔ)等,。”
面向2020年,,中國也將在戰(zhàn)略高度上將信息科技發(fā)展作為主戰(zhàn)場(chǎng)之一,在新科技革命進(jìn)程中,,加速人,、機(jī)、物三元世界的融合發(fā)展,。
挑戰(zhàn)信息安全
通過立法和各種有效手段保護(hù)個(gè)人隱私刻不容緩
回到文章開頭,,被大數(shù)據(jù)應(yīng)用猜到購物喜好的尷尬大概源于對(duì)個(gè)人隱私泄露的不安。的確,,目前大數(shù)據(jù)應(yīng)用面臨的挑戰(zhàn)之一便是對(duì)個(gè)人隱私信息的擔(dān)憂,。
張敏回憶起前些年看過的一個(gè)科幻故事,,描寫的是當(dāng)時(shí)的作者暢想的現(xiàn)代生活:主人公早晨醒來打開一部類似手機(jī)的機(jī)器,機(jī)器自動(dòng)彈出了主人公將要前往地點(diǎn)的路線及相關(guān)信息,,不僅如此,,主人公最喜歡的餐廳和電影也被自動(dòng)推送出來。
“你能相信嗎,,有一臺(tái)機(jī)器比你自己還了解你,。”張敏感嘆。不過在她看來,,這樣美好的未來對(duì)于個(gè)人隱私也是相當(dāng)危險(xiǎn)的,。
“棱鏡計(jì)劃”是談?wù)摯髷?shù)據(jù)時(shí)不得不提的事件。根據(jù)美國中情局前職員愛德華·斯諾登提供的信息,,美國情報(bào)機(jī)構(gòu)在2007年開始的“棱鏡”竊聽計(jì)劃中,,對(duì)美國9家互聯(lián)網(wǎng)公司的數(shù)據(jù)進(jìn)行挖掘工作,從音頻,、視頻,、圖片、郵件,、文檔以及連接信息中分析個(gè)人的聯(lián)系方式與行動(dòng),。該計(jì)劃一經(jīng)曝光,便受到國際社會(huì)的譴責(zé),。
然而,,《大數(shù)據(jù)時(shí)代》作者舍恩·伯格在評(píng)論斯諾登事件時(shí)曾表示,令他驚奇的并不是“棱鏡計(jì)劃”本身,,而是大家對(duì)這個(gè)計(jì)劃如此驚奇,,大多數(shù)人竟然仍以小數(shù)據(jù)的經(jīng)驗(yàn)和視野來看待它。
從大數(shù)據(jù)應(yīng)用創(chuàng)新的角度來看,,“棱鏡計(jì)劃”無疑是一個(gè)非常出色的案例,,同樣暴露了大數(shù)據(jù)應(yīng)用對(duì)個(gè)人隱私的威脅。
大數(shù)據(jù)時(shí)代如何保護(hù)個(gè)人隱私是一個(gè)共同關(guān)心的問題,。在前不久召開的中國計(jì)算機(jī)學(xué)會(huì)青年計(jì)算機(jī)科技論壇上,,南京大學(xué)計(jì)算機(jī)系教授仲盛介紹,傳統(tǒng)互聯(lián)網(wǎng)對(duì)個(gè)人信息保護(hù)的方式之一便是“去識(shí)別”,,即去掉姓名等關(guān)鍵信息,。那么,大數(shù)據(jù)時(shí)代,,“去識(shí)別”還能保護(hù)隱私嗎,?
例如,一家醫(yī)院在提供醫(yī)療服務(wù)時(shí)發(fā)現(xiàn)張家村有兩名45歲的男性患有某種疾病,,其中一名未婚,。在這條信息里,,病人的個(gè)人信息雖然被去除了,但只要知道張家村有誰滿足45歲和未婚兩個(gè)條件,,依然能知道究竟是誰患病,。
仲盛指出,正是數(shù)據(jù)集成暴露了個(gè)人隱私,。“即使每一個(gè)機(jī)構(gòu)發(fā)布的數(shù)據(jù)都是安全的,,但把它們結(jié)合在一起便什么都知道了。”他說,。
從技術(shù)而言,,科學(xué)家至今還沒有最有效的辦法為個(gè)人隱私“上保險(xiǎn)”,。大數(shù)據(jù)時(shí)代的信息安全恐怕需要新的社會(huì)規(guī)則來規(guī)范使用數(shù)據(jù)的行為,。
2013年年初,世界經(jīng)濟(jì)論壇發(fā)表《解除個(gè)人信息的價(jià)值:從收集到使用》的報(bào)告,,甚至建議所有數(shù)據(jù)收集都應(yīng)當(dāng)使用密碼,,以達(dá)到“限制使用數(shù)據(jù)”的目的。
大數(shù)據(jù)的應(yīng)用對(duì)公眾信息安全來說無疑增加了一個(gè)新的維度,。李國杰在接受媒體采訪時(shí)曾表示:“如何通過立法和各種手段真正保護(hù)個(gè)人的隱私,,這是國家需要高度重視的一個(gè)新的安全問題。”