形形色色設(shè)備產(chǎn)生的數(shù)據(jù)量時刻不停地飛速增長,如何利用每天產(chǎn)生的天文數(shù)字量級數(shù)據(jù),成為科技業(yè)面臨的一道難題,。
根據(jù)思科的數(shù)據(jù),,全球互聯(lián)網(wǎng)吞吐量在2016年為1.2ZB(1ZB相當(dāng)于10億TB或1萬億GB),,預(yù)計到2021年將增長到3.3ZB每年,。洶涌上漲的數(shù)據(jù)洪流,波峰越來越高,,在2016年,,每天數(shù)據(jù)流量同比增長了32%,而流量最高的1小時數(shù)據(jù)吞吐量同比增長了51%,。
數(shù)據(jù)源于思科
當(dāng)上述統(tǒng)計也不完整,,實際上沒有人知道全球每天產(chǎn)生多少數(shù)據(jù),,因為并不是所有設(shè)備的數(shù)據(jù)都會連入互聯(lián)網(wǎng)。
數(shù)據(jù)量本身意義不大,,如何量化數(shù)據(jù)的價值才是關(guān)鍵所在,,但在如何應(yīng)用數(shù)據(jù),以實現(xiàn)其價值方面,,當(dāng)前還沒有行之有效的方法,。
想挖掘數(shù)據(jù)的真正價值,,就要對天量數(shù)字與模擬數(shù)據(jù)進(jìn)行過濾,,并充分考慮應(yīng)用場景,這就像沙里淘金,,大多數(shù)可能無功而返,。不過,隨著計算力的提高以及大規(guī)模并行計算工具的成熟,,數(shù)據(jù)過濾分析--即找到更好的應(yīng)用數(shù)據(jù)方法--已經(jīng)能夠創(chuàng)造出頗具市場前景的商業(yè)模式,。
“眾多行業(yè)人士指出,不同數(shù)據(jù)應(yīng)用方法與其器件和商業(yè)模式相互關(guān)聯(lián),,并對其商業(yè),、市場以及商業(yè)模式產(chǎn)生影響,”Synopsys董事長兼共同CEO Aart de Geus說道,,“如果你能夠從中找到捷徑,,提升效率,或者全新的商業(yè)模式,,那就會是非常大的影響,。 ”這也意味著高利潤的可能,“你會看到,,所有從事數(shù)據(jù)處理的人都在仔細(xì)聆聽,,以解碼市場未來需求,或者自行判斷當(dāng)前市場需求,,”de Geus繼續(xù)說道,,“或者更進(jìn)一步,他們準(zhǔn)備置身于數(shù)據(jù)通路之中,,從而最靠近數(shù)據(jù)商業(yè)化的中心,。”
這正是資本瘋狂涌入的原因,,從數(shù)據(jù)挖掘到云端服務(wù),,從機器學(xué)習(xí)到工業(yè)物聯(lián)網(wǎng),每一個數(shù)據(jù)應(yīng)用場景都戰(zhàn)況激烈,。
“誰擁有數(shù)據(jù),,具備數(shù)據(jù)分析及處理能力,,誰就能把所有錢都賺走,”西門子Mentor事業(yè)部總裁兼CEO Wally Rhines這樣表示,。
現(xiàn)在還難說數(shù)據(jù)應(yīng)用是一個勝者通吃的游戲,,不過確實有不少科技巨頭在這個領(lǐng)域跑馬圈地,奮勇爭先,,例如亞馬遜,、谷歌、微軟,、Facebook和IBM等掰著手指頭就可以輸出來的大家伙,。
“收集上來的物聯(lián)網(wǎng)數(shù)據(jù)中,包含了設(shè)備大量的性能,、行為及應(yīng)用數(shù)據(jù),,”IBM美洲區(qū)銷售主管Christophe Begue說道,“我們接下來會把收集到的數(shù)據(jù)丟給Watson(IBM人工智能平臺)去分析,?!?/p>
現(xiàn)在的大問題是如何將這些數(shù)據(jù)變現(xiàn),有哪些人愿意為數(shù)據(jù)付費,。要將數(shù)據(jù)變現(xiàn),,首先要做到如下幾點:第一,行業(yè)里的公司要真正懂?dāng)?shù)據(jù)的價值,;其次,,公司要能夠快速應(yīng)對數(shù)據(jù)變化,只要比別人快百分之一秒,,券商就能夠以此牟利,,但現(xiàn)在大公司應(yīng)對數(shù)據(jù)變化的反應(yīng)時間通常是幾天甚至幾周;第三,,變現(xiàn)數(shù)據(jù)的價格要有競爭力,,不能波動太大。
IBM正準(zhǔn)備將全球供應(yīng)鏈的數(shù)據(jù)商業(yè)化,?!肮?yīng)鏈數(shù)據(jù)分為兩層,”Begue說道,,“第一層是零售與快速消費品(CPG)等數(shù)據(jù),,就是那些可能會影響到食品與飲料等銷售的數(shù)據(jù)。你可以在附近的一個商店收集天氣,、交通或運動賽事等相關(guān)信息,,并通過交通模式追蹤它。我們用Metro Pulse平臺來做數(shù)據(jù)分析,,該平臺會覆蓋500個數(shù)據(jù)元素,,用戶既可以購買數(shù)據(jù)用于深度學(xué)習(xí)或機器學(xué)習(xí)分析,,也可以全部委托IBM來做分析。第二層即我們正在導(dǎo)入市場的概念:供應(yīng)商風(fēng)險,。IBM將天氣與政局變化等諸多因素納入考慮,,從數(shù)據(jù)中分析供應(yīng)鏈的安全程度,并根據(jù)分析結(jié)果來提升供應(yīng)鏈的安全,。如果注意到15個因素有風(fēng)險,,那么你就會對這15個因素嚴(yán)密監(jiān)控?!?/p>
IBM的服務(wù)并不是值分析已有數(shù)據(jù),,還會給出建議,洞見未來,?!拔覀兪占_與半公開數(shù)據(jù),,有些數(shù)據(jù)只在IBM內(nèi)部使用,,我們建立預(yù)測模型。當(dāng)然,,我們也意識到,,在計劃和反應(yīng)之間,仍然存在差距,,‘決策室’概念有助于縮小計劃和行動之間的鴻溝,。”
智能制造
并不只外部收集的數(shù)據(jù)才有用,,工業(yè)生產(chǎn)中,,內(nèi)部產(chǎn)生的數(shù)據(jù)就很有價值。事實上,,整個智能制造的概念(德國稱為工業(yè)4.0,,也有人稱之為工業(yè)互聯(lián)網(wǎng))就是如何把內(nèi)部數(shù)據(jù)利用好。
“一言以蔽之,,工業(yè)物聯(lián)網(wǎng)是為了提升生產(chǎn)效率,,”O(jiān)ptimal+市場副總裁David Park說,“現(xiàn)在這些公司都偏愛流程分析和無庫存生產(chǎn),,但它們真正需要的是預(yù)測性分析,。預(yù)測性分析可以讓工廠受益,不過受益最多的是品牌商,,品牌商和工廠可不一定是一回事,。”
風(fēng)險在于,,數(shù)據(jù)不一定都是正確的,?;阱e誤數(shù)據(jù)而做出的決定,將導(dǎo)致結(jié)果難以預(yù)期,。
“如果數(shù)據(jù)沒問題,,那么可以把良率提高2%到3%,非常顯著的提高,,”Park說道,,“供應(yīng)鏈上通過檢測的任何元器件的所有時間段數(shù)據(jù)都會被收集。當(dāng)你拿到一些有劃痕的晶圓,,根據(jù)數(shù)據(jù)就能查出在哪一個環(huán)節(jié)晶圓被劃破,,你也可以查看元器件在現(xiàn)場的老化過程。如果汽車配備了預(yù)測性維護(hù)服務(wù),,那么你就能看到汽車在路上的相關(guān)數(shù)據(jù),。金融業(yè)同樣會受益,如果你手上有數(shù)十萬張發(fā)票,,靠人工是捋不清發(fā)票之間的相互關(guān)系的,。”
這種數(shù)據(jù)分析對于復(fù)雜供應(yīng)鏈特別重要,,半導(dǎo)體制造本身在數(shù)據(jù)分析與應(yīng)用上先進(jìn),,但整個半導(dǎo)體供應(yīng)鏈對數(shù)據(jù)的應(yīng)用,并不都能達(dá)到制造環(huán)節(jié)的水平,。
“有效利用數(shù)據(jù)是智能制造顧問委員會(隸屬于SEMI)的一大主題,,”SEMI協(xié)作技術(shù)平臺副總裁Tom Salmon說道,“獲取數(shù)據(jù)很重要,,但現(xiàn)在問題不是我們獲取的數(shù)據(jù)量不夠,,而是因為數(shù)據(jù)利用率只有10%左右。真正的挑戰(zhàn)在于我們應(yīng)該問什么樣的問題,,如何把數(shù)據(jù)應(yīng)用于制造,。所以可能會有可靠性問題,但不會有制程問題,?!?/p>
機器學(xué)習(xí)
找到關(guān)鍵數(shù)據(jù),在預(yù)設(shè)參數(shù)下利用機器對數(shù)據(jù)規(guī)律進(jìn)行外推,,這就是機器學(xué)習(xí)的基礎(chǔ),。這種方法已經(jīng)應(yīng)用于汽車自動駕駛領(lǐng)域,機器學(xué)習(xí)系統(tǒng)將輔助并最終取代人類去駕駛汽車,,自動駕駛系統(tǒng)做決策時,,需要根據(jù)行駛場景給出多種預(yù)案。
在半導(dǎo)體設(shè)計與制造中,也會利用機器學(xué)習(xí)來提高質(zhì)量,、可靠性及良率,。
“采用合適的比例來抽取數(shù)據(jù)做分析,就能應(yīng)用于未來的設(shè)計,,”eSilicon市場副總裁Mike Gianfagna說道,,“如何將機器學(xué)習(xí)算法應(yīng)用于新領(lǐng)域是關(guān)鍵,在過去7年中,,我們在這方面積累了很多經(jīng)驗,,我們知道如何挖掘開發(fā)數(shù)據(jù)的價值。當(dāng)你擁有大量數(shù)據(jù)時,,怎么去抽取分析這些數(shù)據(jù),?如果抽取數(shù)據(jù)比例太高,你會迷失在大量數(shù)據(jù)中,,如果抽取數(shù)據(jù)比例過低,,又可能得不出結(jié)論?!?/p>
Gianfagna表示,,在降低風(fēng)險與增加效率的基礎(chǔ)上,實現(xiàn)數(shù)據(jù)變現(xiàn)是機器學(xué)習(xí)的目標(biāo),?!耙龅竭@一點,你需要從全局上來看待大數(shù)據(jù)分析,。”
與很多由大云端服務(wù)商提供服務(wù)的大數(shù)據(jù)分析相比,,半導(dǎo)體設(shè)計和測試行業(yè)產(chǎn)生的數(shù)據(jù)量很少,,不過半導(dǎo)體設(shè)計與測試數(shù)據(jù)可能更復(fù)雜。
“當(dāng)前主要任務(wù)是收集數(shù)據(jù),,”NI解決方案市場總監(jiān)George Zafiropoulos說道,,“下一階段的目標(biāo)是通過數(shù)據(jù)分析來給出改進(jìn)方法。無須刻意尋找,,你就能發(fā)現(xiàn)數(shù)據(jù)中的價值嗎,?你要找的,是數(shù)據(jù)的趨勢和相關(guān)性,,可以將機器學(xué)習(xí)應(yīng)用于任何環(huán)節(jié),。如果軟件提示,本周四產(chǎn)線產(chǎn)出較低,,為什么會產(chǎn)出低,?或者特定溫度與特定電壓對產(chǎn)品性能的影響。(這些都可以用數(shù)據(jù)分析來指導(dǎo))”
Zafiropoulos指出,,可以將更好的芯片設(shè)計作為目標(biāo),?!白鳛楣こ處煟覀儑@設(shè)計來制定規(guī)則,,但如果你想面面俱到,,那么效率就不會高。如果在保證可靠性與性能基礎(chǔ)上,,可以減少保護(hù)規(guī)則,,那將會有很大價值。很多大數(shù)據(jù)分析都是針對多個數(shù)據(jù)采集點,,一座城市可能有一萬個傳感器,,每天產(chǎn)生大量數(shù)據(jù),而亞馬遜的訂單更是數(shù)不勝數(shù),。半導(dǎo)體數(shù)據(jù)比個人能處理的數(shù)據(jù)顯然要多,,但也遠(yuǎn)達(dá)不到亞馬遜交易數(shù)據(jù)這個量級?!?/p>
然而,,系統(tǒng)數(shù)據(jù)可能就比設(shè)計數(shù)據(jù)高幾個數(shù)量級了,特別是涉及多物理層仿真時,?!拔覀冋J(rèn)為,7納米將是首次導(dǎo)入機器學(xué)習(xí)和大數(shù)據(jù)分析的節(jié)點,,數(shù)據(jù)量將會膨脹,,處理速度也需要增加?!?ANSYS總經(jīng)理兼副總裁John Lee說道,,“你需要做同步熱分析。熱效應(yīng)影響系統(tǒng)的可靠性,,但如果數(shù)據(jù)量增大到當(dāng)前技術(shù)無法解決,,那么就要引入新的方法,所以我們需要大數(shù)據(jù)技術(shù),。最新的GPU有210億個晶體管,,而且可應(yīng)用于汽車,但這種規(guī)模的芯片發(fā)熱量巨大,,(如果散熱設(shè)計不好),,發(fā)熱時會增加對電路板的壓力,并可能導(dǎo)致板子彎曲,,但要知道,,車用芯片使用壽命長達(dá)十年。”
總結(jié)
大數(shù)據(jù)分析在半導(dǎo)體產(chǎn)業(yè)應(yīng)用還處于中段(發(fā)展期),。一方面,,為提高芯片的性能、效率和可靠性,,半導(dǎo)體產(chǎn)業(yè)的數(shù)據(jù)量在增長,,數(shù)據(jù)分析任務(wù)在增加;另一方面,,半導(dǎo)體產(chǎn)業(yè)也在發(fā)展各種技術(shù),,以充分挖掘數(shù)據(jù)用途。
這為產(chǎn)業(yè)帶來了新的增長機會,。Cadence 總裁兼CEO 陳立武表示,,2015年全球聯(lián)網(wǎng)汽車市場規(guī)模為240億美元,到2020年,,將發(fā)展到370億美元,,與之相應(yīng),深度學(xué)習(xí)市場規(guī)模2020年將達(dá)100億美元(2015年為6億美元),,云和數(shù)據(jù)中心市場規(guī)模將達(dá)800億美元(2015年650億美元),。“這將給半導(dǎo)體產(chǎn)業(yè)帶來機會,,”他說道,,“從優(yōu)化物聯(lián)網(wǎng)到云端,都將給半導(dǎo)體帶來很大的機會,?!?/p>
現(xiàn)在的問題是,圍繞這些數(shù)據(jù)還能做些什么,,以及到底如何去實現(xiàn),。這將是半導(dǎo)體產(chǎn)業(yè)的一個全新機會,也許會推動半導(dǎo)體產(chǎn)業(yè)發(fā)展登上一個新臺階,。