創(chuàng)造新一代人工智能的核心理論-AET-電子技術(shù)應(yīng)用

創(chuàng)造新一代人工智能的核心理論

日期： 2019-02-18

作者：株式會(huì)社阿波羅日本首席科學(xué)家顧澤蒼（中國(guó)籍）

關(guān)鍵詞： 人工智能視覺(jué)學(xué)習(xí)

20190219155912-14899[1].jpg

　　新一代人工智能超深度學(xué)習(xí)（ Super Deep Learning SDL）的創(chuàng)新發(fā)展歷程是：早在1991年到1993年，伴隨著大規(guī)集成電路極速發(fā)展的時(shí)期，大規(guī)集成電路的最小面積，最短配線長(zhǎng)度，同時(shí)還要考慮電氣特性的多目的最佳化解的獲得，成為當(dāng)時(shí)科學(xué)技術(shù)領(lǐng)域中最為關(guān)注的課題。在那個(gè)時(shí)代，由美國(guó)學(xué)界提出的導(dǎo)入“熵”的理論解決最佳化組合問(wèn)題，這一理論一時(shí)也被世界期待。但是，這個(gè)算法同目前深度學(xué)習(xí)相仿，計(jì)算復(fù)雜度極高。即使一個(gè)最簡(jiǎn)單的電路的計(jì)算，要花費(fèi)若干天。面對(duì)被世界推崇的理論，我們大膽的提出了“模糊事件概率測(cè)度”理論，通過(guò)用模糊事件概率測(cè)度判斷組合結(jié)果的價(jià)值，獲得了可以快速進(jìn)行大規(guī)模集成電路的最短配線長(zhǎng)，最小面積以及電氣特性的多目的組合最佳化的解的方法。

　　其實(shí)，當(dāng)今的深度學(xué)習(xí)中的“訓(xùn)練”，由于神經(jīng)網(wǎng)絡(luò)之間不像大規(guī)模集成電路具有模塊之間的連接關(guān)系，也不像圍棋具有規(guī)則，可以建立棋子之間的連接關(guān)系，作為不具有連接關(guān)系的神經(jīng)網(wǎng)絡(luò)從組合理論看，就是需要窮舉法才可以獲得最佳訓(xùn)練結(jié)果，黑箱問(wèn)題的出現(xiàn)，其原因就是神經(jīng)網(wǎng)絡(luò)的訓(xùn)練沒(méi)有獲得最佳解所造成的。

　　1994年到1999年，由于已經(jīng)知道傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)的致命問(wèn)題，為了同當(dāng)時(shí)的神經(jīng)網(wǎng)絡(luò)對(duì)抗，我們創(chuàng)建了“概率尺度自組織”的無(wú)監(jiān)督機(jī)器學(xué)習(xí)理論。在長(zhǎng)期的聲音識(shí)別，手寫(xiě)文字識(shí)別，圖像識(shí)別等模式識(shí)別領(lǐng)域中進(jìn)行了大量的應(yīng)用，證明了概率尺度自組織機(jī)器學(xué)習(xí)理論的特殊的應(yīng)用效果。

　　2000年到2014年，國(guó)際上個(gè)人信息法的制定，成為社會(huì)關(guān)注的焦點(diǎn)。由于當(dāng)時(shí)個(gè)人信息的67%是通過(guò)紙介質(zhì)文檔流失的，為此我們?cè)趪?guó)際上提出了新的代碼符號(hào)信息記錄的方法，由此“具有隱形結(jié)構(gòu)的第三代條碼網(wǎng)屏編碼誕生了，可以在A4的一張紙上埋入一本小說(shuō)的信息倍受業(yè)界的關(guān)注。在這十幾年中針對(duì)Google眼鏡，我們還提出了，可以把任何圖像直接通過(guò)概率尺度自組織的機(jī)器學(xué)習(xí)的手法，變換成不到十個(gè)字節(jié)的1036的代碼，就可以把任何圖像作為網(wǎng)絡(luò)入口，引導(dǎo)從網(wǎng)絡(luò)上下載各種文件，即ITC（Image To Code）理論，顛覆了當(dāng)今流行的AR技術(shù)。在這期間，我們還提出了“可以統(tǒng)一歐幾里德空間與概率空間的距離公式。

　　2014年到2016年我們將概率尺度自組織同神經(jīng)網(wǎng)絡(luò)理論結(jié)合，提出了分散機(jī)器學(xué)習(xí)的”超深度學(xué)習(xí)“理論，為人工智能的全面普及應(yīng)用給予了理論支持。我們是經(jīng)歷過(guò)上一個(gè)人工智能的研究的人，對(duì)于當(dāng)今火熱的AI熱潮，親身感到上一個(gè)人工智能的特點(diǎn)是知識(shí)庫(kù)，其突出的成果是日本成功的實(shí)現(xiàn)了有軌電車(chē)的自動(dòng)駕駛，由此在控制理論上產(chǎn)生了模糊控制的新理論。本次人工智能的特點(diǎn)就是機(jī)器學(xué)習(xí)，相信本次人工智能高潮的代表性成果一定是自動(dòng)駕駛汽車(chē)。因?yàn)闄C(jī)器學(xué)習(xí)可以把人的知識(shí)以概率分布的形式進(jìn)行記述，大大的簡(jiǎn)化了知識(shí)庫(kù)的形式，面對(duì)復(fù)雜的自動(dòng)駕駛汽車(chē)，機(jī)器學(xué)習(xí)可以將人的知識(shí)變成機(jī)器的智慧，使復(fù)雜的控制簡(jiǎn)化。知識(shí)庫(kù)只能記述宏觀知識(shí)，機(jī)器學(xué)習(xí)在自動(dòng)駕駛汽車(chē)中不僅可以高效率的學(xué)習(xí)人的宏觀知識(shí)，還可以學(xué)習(xí)微觀知識(shí)，一個(gè)以機(jī)器學(xué)習(xí)理論為核心的“機(jī)智獲得”的新的自動(dòng)控制理論將展現(xiàn)在我們面前。

　　下面我們重點(diǎn)討論深度學(xué)習(xí)所遺留下的問(wèn)題所在：

　　2016年初，AlphaGo連續(xù)打敗人類棋手，推崇深度學(xué)習(xí)的熱不斷的升溫。這說(shuō)明，深度學(xué)習(xí)是在實(shí)際應(yīng)用中被看好的，應(yīng)該肯定走機(jī)器學(xué)習(xí)這條路是時(shí)代發(fā)展的必由之路，必然會(huì)給我們帶來(lái)意想不到的應(yīng)用效果，但是，也應(yīng)該清醒的看到深度學(xué)習(xí)目前有很多關(guān)鍵問(wèn)題不能解決。雖然深度學(xué)習(xí)在圖像識(shí)別，聲音識(shí)別上確實(shí)具有一定的應(yīng)用效果，但是，在產(chǎn)業(yè)界的應(yīng)用，特別是在控制上的應(yīng)用還存在著很大的問(wèn)題。

　　必須要指出的是：深度學(xué)習(xí)的訓(xùn)練結(jié)果，是將目標(biāo)函數(shù)信息通過(guò)訓(xùn)練承載到海量的屬于歐幾里德空間的參數(shù)上，即深度學(xué)習(xí)是函數(shù)映射模型，將概率空間的目標(biāo)函數(shù)映射到歐幾里得空間，其結(jié)果需要將概率空間的某一類數(shù)據(jù)的所有可能出現(xiàn)的結(jié)果，用人工標(biāo)注后進(jìn)行接近無(wú)限次的訓(xùn)練。例如，一個(gè)語(yǔ)音識(shí)別的數(shù)據(jù)就需要2400萬(wàn)美元的人工標(biāo)注費(fèi)用，這是深度學(xué)習(xí)難于普及的致命問(wèn)題。

　　由于深度學(xué)習(xí)所構(gòu)造的神經(jīng)網(wǎng)絡(luò)，與大腦的機(jī)理又是風(fēng)馬牛不相干的，因此也不能看到在神經(jīng)元的方面會(huì)起到什么作用。得到的結(jié)論是：通過(guò)這樣的方式所產(chǎn)生的訓(xùn)練效果，與所投入的硬件開(kāi)銷(xiāo)不成比例。例如AlphaGo所需要的硬件開(kāi)銷(xiāo)是1000個(gè)CPU，200個(gè)GPU，還需要20萬(wàn)W的電力消耗。這樣的硬件開(kāi)銷(xiāo)如何普及？況且AlphaGo的設(shè)計(jì)者也指出深度學(xué)習(xí)在整個(gè)系統(tǒng)中的作用只占30％是次要地位。其實(shí)深度學(xué)習(xí)在如AlphaGo這種組合理論的應(yīng)用中，是否可以起到作用，目前沒(méi)有令人信服的理論依據(jù)。

　　圖1 深度學(xué)習(xí)需要搞清的幾個(gè)問(wèn)題

　　深度學(xué)習(xí)還有需要搞清如圖1所示的目前解釋不了的問(wèn)題。

　　首先需要搞清為什么層數(shù)越多訓(xùn)練結(jié)果的圖像越清晰？開(kāi)始我們?cè)J(rèn)為是承載目標(biāo)函數(shù)的信息的參數(shù)數(shù)量的提高使記錄的信息的信息量的提高，但是從數(shù)學(xué)上我們可以證明在同等節(jié)點(diǎn)的層與層的訓(xùn)練中，必定可以找到一組參數(shù)可使輸入信息完全等于輸出信息。這就說(shuō)明深度學(xué)習(xí)的層數(shù)越多圖像越清晰與訓(xùn)練的參數(shù)數(shù)量無(wú)關(guān)，這就剩下一個(gè)可以信服的原因，深度學(xué)習(xí)每一層所訓(xùn)練的結(jié)果實(shí)際獲得的是一組局域最佳解，神經(jīng)網(wǎng)絡(luò)可以用一個(gè)傳遞的函數(shù)模型來(lái)描述，可以認(rèn)為每一層訓(xùn)練后的解是比上一層更接近整體最佳解，所以參數(shù)越接近整體最佳解神經(jīng)網(wǎng)絡(luò)的傳輸率越高圖像就越清晰。因此用這個(gè)現(xiàn)象來(lái)解釋深度學(xué)習(xí)中間層越多應(yīng)用效果越好不是一個(gè)嚴(yán)謹(jǐn)?shù)目茖W(xué)性的解釋方法。所以包括發(fā)明人Hinton在內(nèi)并沒(méi)有人能在數(shù)學(xué)上證明深度學(xué)習(xí)具有突破性應(yīng)用效果的真實(shí)機(jī)理。

　　那么，深度學(xué)習(xí)的黑箱問(wèn)題是怎么回事？這里所謂的黑箱問(wèn)題是涉及兩個(gè)方面的問(wèn)題？一個(gè)是深度學(xué)習(xí)的不可分析性，出現(xiàn)問(wèn)題不能依據(jù)一定的理論進(jìn)行分析，這是因?yàn)樯疃葘W(xué)習(xí)屬于函數(shù)映射模型，映射結(jié)果很難反向推理。對(duì)于深度學(xué)習(xí)模型的原理實(shí)際上是很清楚的，至于人們把“深度學(xué)習(xí)”的應(yīng)用效果好的機(jī)理作為“天知”，我們?cè)诤竺鏁?huì)專題討論。

　　深度學(xué)習(xí)出現(xiàn)黑箱問(wèn)題的主要原因：其實(shí)深度學(xué)習(xí)所訓(xùn)練的機(jī)理就是在一個(gè)海量的數(shù)據(jù)空間里進(jìn)行組合，黑箱問(wèn)題就在于在海量數(shù)據(jù)空間里進(jìn)行窮舉時(shí)，會(huì)出現(xiàn)無(wú)窮的局域最佳解，其局域最佳解的分布曲線通過(guò)數(shù)學(xué)方法無(wú)法計(jì)算出，人為的實(shí)驗(yàn)也是目前圖靈機(jī)所做不到的，因此在訓(xùn)練中很可能會(huì)出現(xiàn)一個(gè)參數(shù)稍微改變輸出結(jié)果會(huì)突然崩潰，或者是所訓(xùn)練的結(jié)果并不是按照我們想象的結(jié)果進(jìn)行展開(kāi)。在組合空間中所獲得的局域最佳解出現(xiàn)在某一個(gè)情況下突然出現(xiàn)令人費(fèi)解的狀態(tài)是正常的，我們?cè)谕ㄟ^(guò)規(guī)則解決最佳組合的NP問(wèn)題中經(jīng)常會(huì)出這種現(xiàn)象，往往是通過(guò)程序的規(guī)則的不斷堆積來(lái)實(shí)現(xiàn)，對(duì)于深度學(xué)習(xí)要通過(guò)重新改變參數(shù)，尋求另一個(gè)局域最佳解的方法來(lái)解決。所以只要是知道深度學(xué)習(xí)的訓(xùn)練是數(shù)據(jù)最佳化組合的過(guò)程的特點(diǎn)，就不難理解深度學(xué)習(xí)的黑箱問(wèn)題。特別是作為概率空間的目標(biāo)函數(shù)的隨機(jī)性會(huì)引發(fā)黑箱問(wèn)題的發(fā)生。再有就是在“深度學(xué)習(xí)”的層與層之間節(jié)點(diǎn)的連接中，為了獲得非線性的分類結(jié)果，導(dǎo)入了激勵(lì)函數(shù)(Activation Function)。這也是引發(fā)黑箱問(wèn)題發(fā)生的重要隱患。

　　下面的問(wèn)題就是在模式識(shí)別的應(yīng)用上，是特征向量的質(zhì)量重要，還是通過(guò)學(xué)習(xí)進(jìn)行分類重要？回答很簡(jiǎn)單沒(méi)有好的特征向量的質(zhì)量再好的深度學(xué)習(xí)也是無(wú)濟(jì)于事的，在許多文章中都把深度學(xué)習(xí)可以直接抽取特征量作為深度學(xué)習(xí)的一大特點(diǎn)。其實(shí)深度學(xué)習(xí)在特征映射的方法上簡(jiǎn)直是極其傳統(tǒng)的處理方法，而且并沒(méi)有考慮圖像信息并不只是灰度信息，所以深度學(xué)習(xí)在模式識(shí)別上的應(yīng)用特點(diǎn)只能停留在大量的學(xué)習(xí)的作用上，下一代的機(jī)器學(xué)習(xí)模型在特征向量抽取質(zhì)量上努力，也一定會(huì)產(chǎn)生更好的突出效果。

　　最后需要搞清的一個(gè)重要問(wèn)題：深度學(xué)習(xí)的應(yīng)用效果好的機(jī)理是什么？為使我們所提出的模型可以超越“深度學(xué)習(xí)”，我們對(duì)“深度學(xué)習(xí)”的應(yīng)用效果好的機(jī)理做了一些研究，發(fā)現(xiàn)將目標(biāo)函數(shù)映射到大數(shù)據(jù)集上后，數(shù)據(jù)分類中的有效距離被擴(kuò)大了，比如人臉識(shí)別，被認(rèn)為是導(dǎo)入深度學(xué)習(xí)后應(yīng)用效果最明顯的案例，人臉的位置的特征信息充其量不過(guò)幾百個(gè)，傳統(tǒng)的模式識(shí)別的效果所以不如深度學(xué)習(xí)，這是因?yàn)閮蓚€(gè)最接近的特征向量的總體距離與概率分布的范圍之間的差是固定的，但是如果把人臉位置圖像信息通過(guò)深度學(xué)習(xí)的函數(shù)映射，大數(shù)據(jù)集可以“放大”幾百個(gè)人臉位置特征向量所構(gòu)成的距離，由于“深度學(xué)習(xí)”模型每增加一個(gè)中間層，復(fù)雜度為Ｏ（ｎｎ）就是一個(gè)指數(shù)性的提高，所以數(shù)據(jù)集的規(guī)模不可能無(wú)限增加，因此我們所提出的的新的模型的復(fù)雜度Ｏ（ｎ2）如果是接近線性的，就一定可以實(shí)現(xiàn)超越深度學(xué)習(xí)的數(shù)據(jù)集規(guī)模的特征數(shù)據(jù)集，就一定可以在應(yīng)用上超越“深度學(xué)習(xí)”的效果。

　　在“深度學(xué)習(xí)”被神化的高潮中，欺騙了絕大多數(shù)業(yè)界的專家們的一個(gè)問(wèn)題是：深度學(xué)習(xí)所采用如圖2所示的對(duì)損失函數(shù)的SGD評(píng)價(jià)方法，所得到的的訓(xùn)練結(jié)果是組合理論中的一個(gè)局域的最佳解，這一點(diǎn)深度學(xué)習(xí)的研究者在當(dāng)時(shí)并不理解，其實(shí)這么一個(gè)高次的組合空間不可能只有一個(gè)局域的最佳解。

　　圖2 隨機(jī)梯度下降法SDG示意圖

　　其實(shí)如圖3所示，深度學(xué)習(xí)的訓(xùn)練存在著復(fù)數(shù)個(gè)局域最佳解的事實(shí)，20多年前已經(jīng)被一些例如Hopfild等的早期人工智能科學(xué)家所認(rèn)識(shí)，力圖用組合理論的最短路徑訪問(wèn)的方法進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練，

　　圖3 Hopfild的聯(lián)想記憶與最佳組合理論示意圖

　　遺憾的是神經(jīng)網(wǎng)絡(luò)的組合空間規(guī)模之大，屬于圖靈機(jī)不可解的NP問(wèn)題，所以這些科學(xué)家的努力沒(méi)能成功，可是清楚的告訴我們后人傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)是走不下去的。

　　針對(duì)深度學(xué)習(xí)存在的上述問(wèn)題，超深度學(xué)習(xí)一舉將深度學(xué)習(xí)所存在的所有問(wèn)題全部給予解決。超深度學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)就是公式1所示的一個(gè)基于概率尺度的自組織的機(jī)器學(xué)習(xí)算法。

　　公式1

　　這里，給定一個(gè)屬于集合G的一組隨機(jī)分布的數(shù)值pi (i=1,2,…,m)，某一集合Gn-1中必然存在一個(gè)最大概率值A(chǔ)n-1，以及可以標(biāo)定最大概率空間的尺度Mn-1，如果把最大概率空間看成是新的一集合Gn，就可以通過(guò)迭代，獲得最終可以超越統(tǒng)計(jì)學(xué)公式化的解，為了區(qū)別于傳統(tǒng)的統(tǒng)計(jì)學(xué)的結(jié)果，我們可以把An-1稱為最大幾率值，把Mn-1，稱為最大幾率空間的尺度。這就是概率尺度自組織的模型。

　　概率尺度自組織在圖像識(shí)別中，可以從一個(gè)小區(qū)域的若干個(gè)像素灰度值通過(guò)概率尺度自組織得到一個(gè)最大幾率值，用于表達(dá)該區(qū)域的圖像特征。概率尺度自組織還具有遷移特性，可以自律的朝著大概率的方向遷移，當(dāng)圖像移位時(shí)可以自動(dòng)的遷移，這是傳統(tǒng)模式識(shí)別所做不到的。

　　圖4是概率尺度自組織具有向大概率方向遷移的特性。如圖4所示，概率尺度自組織在給定的任何地方，只要是初步滿足一定條件，通過(guò)迭代就可以自律的朝著大概率的方向遷移，中間遇到小概率的擾動(dòng)，也可以跨越小概率的阻擋最終落在大概率的位置上。

　　圖4 概率尺度自組織具有向大概率方向遷移的特性示意圖

　　在自動(dòng)駕駛的車(chē)道線識(shí)別與障礙物的3D識(shí)別的應(yīng)用中，還可以驗(yàn)證概率尺度自組織可以無(wú)訓(xùn)練的將圖像中最大概率分布的目標(biāo)圖像直接識(shí)別出，還可以按照?qǐng)D像中的各個(gè)最大概率的分布狀態(tài)進(jìn)行特征抽出，可以得到結(jié)構(gòu)化的特征信息抽出結(jié)果，從而實(shí)現(xiàn)圖像理解的識(shí)別效果。

　　例如圖5所示進(jìn)行人臉識(shí)別時(shí)可以自動(dòng)的尋找到概率分布最集中的人的臉部。傳統(tǒng)的摸著石頭過(guò)河的程序搜索方法存在一個(gè)嚴(yán)重的問(wèn)題是需要對(duì)人臉膚色的事先定義，這樣不同膚色在程序規(guī)則上就要調(diào)整，需要大量的程序進(jìn)行規(guī)則堆積，嚴(yán)重影響人臉識(shí)別精度的提高，采用概率尺度自組織按照人臉圖像的顏色分布，在整個(gè)圖像中是最大的概率，可以直接通過(guò)概率尺度自組織的遷移特性直接獲得人臉位置。

　　圖5 用概率尺度自組織的遷移特性獲得人臉位置示意圖

　　概率尺度自組織的遷移軌跡，以及最終的結(jié)果需要嚴(yán)格的對(duì)應(yīng)數(shù)據(jù)空間，用一維的概率尺度衡量二維空間的數(shù)據(jù)就會(huì)產(chǎn)生錯(cuò)誤的結(jié)果。另外概率尺度自組織的解也符合最佳化解的特性，遷移路徑與結(jié)果具有一定的邊界條件。

　　在模式識(shí)別中需要計(jì)算樣本數(shù)據(jù)與學(xué)習(xí)后登錄數(shù)據(jù)之間的距離，我們?cè)趯?shí)際大量應(yīng)用中所接觸的數(shù)據(jù)證明概率空間一定是存在于歐幾里得空間的，也就是說(shuō)在歐幾里德空間存在著無(wú)數(shù)個(gè)概率空間，因此如何找到一個(gè)跨越歐幾里得空間與概率空間的距離是提高模式識(shí)別的關(guān)鍵。這里我們提出了公式2的概率空間的距離的定義方法，設(shè)與是兩個(gè)集合的要素，與分別是集合要素與的復(fù)數(shù)個(gè)學(xué)習(xí)數(shù)據(jù)，通過(guò)多次的概率尺度自組織機(jī)器學(xué)習(xí)所得到的最大幾率空間的尺度，則從的概率空間到（j=1,2,…,n）的概率空間的跨越歐幾里得空間與概率空間的距離G可定義如下：

　　公式2

　　公式2雖然是定義出來(lái)的，但是可以嚴(yán)格證明其正確性，因?yàn)楦怕士臻g是測(cè)度等于1的空間，在概率空間中的距離誤差是概率密度，也可以證明最大幾率空間尺度就是概率密度的近似值。

　　下面具體介紹超深度學(xué)習(xí)的架構(gòu)，超深度學(xué)習(xí)與普通的深度學(xué)習(xí)最大的不同是，傳統(tǒng)的深度學(xué)習(xí)是通過(guò)層與層之間的復(fù)雜連接關(guān)系產(chǎn)生海量數(shù)據(jù)，這種人為的將問(wèn)題復(fù)雜化恐怕是典型學(xué)界的做法，這種做法可以引起眾多的學(xué)者們的興趣，是起到推動(dòng)人工智能在理論上的完善必不可少的過(guò)程，幾乎科學(xué)技術(shù)的發(fā)展都需要這個(gè)過(guò)程，當(dāng)發(fā)展到一定程度時(shí)，必定有人出來(lái)從另一條路出發(fā)將多年積累的理論顛覆，產(chǎn)生可以實(shí)際應(yīng)用的新理論。人工智能也一定要走這一道路。超深度學(xué)習(xí)就是拋磚引玉引發(fā)新一代人工智能創(chuàng)出的理論之一，同深度學(xué)習(xí)不同的是超深度學(xué)習(xí)是概率模型，可直接對(duì)數(shù)據(jù)進(jìn)行概率尺度自組織機(jī)器學(xué)習(xí)，可以定量的對(duì)輸入的隨機(jī)分布信息進(jìn)行分析，對(duì)數(shù)據(jù)進(jìn)行分類，沉淀深層信息，最終產(chǎn)生定量化的識(shí)別與分類，使傳統(tǒng)的系統(tǒng)只有通過(guò)實(shí)際數(shù)據(jù)的驗(yàn)證才可以知道識(shí)別精度與數(shù)據(jù)分類精度，成為識(shí)別結(jié)果的精度可計(jì)算性的系統(tǒng)，從而使模式識(shí)別與數(shù)據(jù)分類進(jìn)入一個(gè)嶄新的時(shí)代。

　　超深度學(xué)習(xí)始終基于最大概率尺度的自組織，所以是一個(gè)新的無(wú)監(jiān)督學(xué)習(xí)模型，無(wú)需海量數(shù)據(jù)來(lái)承載目標(biāo)函數(shù)的信息，是對(duì)具有隨機(jī)特性的輸入數(shù)據(jù)的直接學(xué)習(xí)，可以產(chǎn)生非常高效率的處理效果，無(wú)需巨大的硬件支持，一個(gè)最低的硬件配置就完全可以實(shí)現(xiàn)各種的人工智能的應(yīng)用，可做到的最佳分類，最佳的模式識(shí)別處理結(jié)果。

　　圖6 超深度學(xué)習(xí)架構(gòu)示意圖

　　超深度學(xué)習(xí)如圖6所示；超深度學(xué)習(xí)的每一個(gè)功能單元是由輸入層，腦神經(jīng)層，以及腦皮層組成的新型神經(jīng)網(wǎng)絡(luò)。在輸入層與腦神經(jīng)層之間的節(jié)點(diǎn)與節(jié)點(diǎn)之間直接連接著大量的概率尺度的自組織機(jī)器學(xué)習(xí)，構(gòu)成了分散機(jī)器學(xué)習(xí)處理系統(tǒng)。

　　在超深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)的層數(shù)是與大腦一致，在圖像識(shí)別時(shí)，提取的是圖像最大概率的特征值，判斷每一個(gè)特征值是否屬于某個(gè)已登陸的特征向量，是以最大幾率空間的尺度為依據(jù)，相當(dāng)于最大幾率空間的尺度是一個(gè)神經(jīng)元的閥值，所對(duì)應(yīng)的腦神經(jīng)層的節(jié)點(diǎn)就產(chǎn)生一個(gè)腦神經(jīng)信號(hào)輸入到腦皮層，以最大幾率空間的尺度為基準(zhǔn)值刺激腦皮層，腦皮層被刺激的信號(hào)越多越興奮，依據(jù)腦皮層的興奮程度決定是否為目標(biāo)函數(shù)信息，這豈不是與大腦的機(jī)理非常接近嗎？最大幾率空間的尺度就相當(dāng)于腦神經(jīng)的閥值，并不是深度學(xué)習(xí)中人為定義的參數(shù)，因此大腦機(jī)理應(yīng)該建立在概率空間的模型上，通過(guò)超深度學(xué)習(xí)的架構(gòu)終于搞清楚了，這也是通過(guò)算法仿真生物神經(jīng)的機(jī)理的一個(gè)重要的成果。

　　圖7 在如何深入上超深度學(xué)習(xí)與深度學(xué)習(xí)的比較

　　下面讀者會(huì)問(wèn)超深度學(xué)習(xí)只有三層如何深入，當(dāng)今的潮流是大模型，大數(shù)據(jù)，大硬件構(gòu)成的大系統(tǒng)是主流。如圖7所示；深度學(xué)習(xí)是靠大量的增加層數(shù)，由于復(fù)雜度是指數(shù)性的，其結(jié)果使系統(tǒng)很快就超負(fù)荷了。超深度學(xué)習(xí)是按照導(dǎo)入解決復(fù)雜系統(tǒng)問(wèn)題的空間映射原理，可以把任何的復(fù)雜系統(tǒng)的目標(biāo)函數(shù)映射到任意多的子空間，針對(duì)每一個(gè)子空間的目標(biāo)函數(shù)的信息用增加輸入層的節(jié)點(diǎn)的方法進(jìn)行深入，這使超深度學(xué)習(xí)可以把目標(biāo)函數(shù)的處理無(wú)限的深入下去，卻不增加系統(tǒng)的復(fù)雜度Ｏ（ｎ２）。利用這個(gè)特點(diǎn)可以無(wú)限的增加特征數(shù)據(jù)集的規(guī)模，深度學(xué)習(xí)的數(shù)據(jù)集只能幾百萬(wàn)個(gè)，而超深度學(xué)習(xí)可以達(dá)到數(shù)萬(wàn)以至數(shù)億個(gè)以上，隨著系統(tǒng)應(yīng)用的需要可以無(wú)限的增加機(jī)器學(xué)習(xí)的數(shù)量，可以預(yù)測(cè)今后的人工智能系統(tǒng)用的能力指標(biāo)將以有多少個(gè)機(jī)器學(xué)習(xí)來(lái)計(jì)算。50年來(lái)的計(jì)算機(jī)由簡(jiǎn)單的門(mén)電路組成發(fā)展至今原理沒(méi)有任何變化，使用的門(mén)電路的規(guī)模卻發(fā)生了巨大的變化，計(jì)算機(jī)的性能也出現(xiàn)了驚人的提高，相信未來(lái)的人工智能系統(tǒng)由眾多的機(jī)器學(xué)習(xí)組成的，其能力不管如何過(guò)高的估計(jì)也不會(huì)過(guò)分。

　　再有在目標(biāo)函數(shù)概率分布模型的優(yōu)勢(shì)上，通過(guò)小數(shù)據(jù)的訓(xùn)練可以獲得目標(biāo)函數(shù)的概率分布，可以相當(dāng)于無(wú)窮的函數(shù)映射的效果。這也是深度學(xué)習(xí)所望塵莫及的。由于超深度學(xué)習(xí)可以構(gòu)造比深度學(xué)習(xí)還大規(guī)模的分散機(jī)器學(xué)習(xí)模型，可以通過(guò)小數(shù)據(jù)的訓(xùn)練獲得超過(guò)深度學(xué)習(xí)的還要大規(guī)模的特征數(shù)據(jù)集，以及無(wú)限多的機(jī)器學(xué)習(xí)所構(gòu)成的大的分散處理硬件系統(tǒng)，因此超深度學(xué)習(xí)更加適應(yīng)時(shí)代潮流。

　　將任意一個(gè)圖像通過(guò)手機(jī)拍照后，通過(guò)超深度學(xué)習(xí)變換成一個(gè)

　　1036的代碼，導(dǎo)入了超深度學(xué)習(xí)無(wú)需通過(guò)噴印標(biāo)記的方式構(gòu)成光學(xué)可讀性二維碼，而是靠圖像的灰度的自然分布，自組織成一個(gè)二維碼，也就是說(shuō)可以通過(guò)手機(jī)拍攝商品標(biāo)識(shí)，直接生成一個(gè)可以連接網(wǎng)絡(luò)的二維碼，讓全世界的商品一夜之間就可連接網(wǎng)絡(luò)。

　　超深度學(xué)習(xí)的實(shí)際應(yīng)用的例子之一是如圖8所示；

　　圖8超深度學(xué)習(xí)實(shí)現(xiàn)圖像變換代碼的例子

　　超深度學(xué)習(xí)的圖像直接生成代碼，是對(duì)市場(chǎng)流行的開(kāi)源程序AR圖像識(shí)別技術(shù)的顛覆，AR技術(shù)是通過(guò)傳統(tǒng)的圖像輪廓識(shí)別，產(chǎn)生一個(gè)將近10兆字節(jié)識(shí)別結(jié)果的文件，由于識(shí)別結(jié)果所占用的容量，遠(yuǎn)比圖像本身的容量要大，所以一般識(shí)別引擎是放到網(wǎng)絡(luò)服務(wù)器上，用手機(jī)將被識(shí)別的圖像送到網(wǎng)上，網(wǎng)絡(luò)服務(wù)器識(shí)別圖像后將網(wǎng)絡(luò)下載的結(jié)果送回手機(jī)，這樣的應(yīng)用如果網(wǎng)絡(luò)環(huán)境差，就得不到很好的用戶體驗(yàn)。超深度學(xué)習(xí)克服了由于手機(jī)在不同情況下拍攝的圖像所產(chǎn)生的非常大的隨機(jī)分布信息，通過(guò)概率尺度的自組織變換成一個(gè)穩(wěn)定的代碼，這個(gè)代碼不到十個(gè)字節(jié)，可以把識(shí)別引擎放到手機(jī)上做在線圖像變換代碼的應(yīng)用。

　　超深度學(xué)習(xí)與深度學(xué)習(xí)在機(jī)理上的比較表1.

　　超深度學(xué)習(xí)與普通的深度學(xué)習(xí)的對(duì)比如表１所示;首先從方法上進(jìn)行比較：

　　深度學(xué)習(xí)是在歐幾里得空間里訓(xùn)練出海量的參數(shù)，用海量的參數(shù)承載目標(biāo)函數(shù)的信息，超深度學(xué)習(xí)是直接針對(duì)輸入的隨機(jī)分布數(shù)據(jù)進(jìn)行概率空間的自組織機(jī)器學(xué)習(xí)，將隨機(jī)分布的數(shù)據(jù)進(jìn)行去偽存真的處理，得出定量的并且穩(wěn)定的最大概率的解，以及可以提煉出深層的信息。

　　在前面已經(jīng)討論了，深度學(xué)習(xí)是將目標(biāo)函數(shù)映射到數(shù)據(jù)集的模型，因此面對(duì)具有隨機(jī)特性的數(shù)據(jù)，需要數(shù)百萬(wàn)次的訓(xùn)練，需要付出巨大的數(shù)據(jù)標(biāo)注費(fèi)用。超深度學(xué)習(xí)是概率模型，通過(guò)概率分布信息可以將小數(shù)據(jù)的訓(xùn)練生成具有無(wú)限映射效果的概率分布。

　　在計(jì)算復(fù)雜度上兩種模型具有截然不同的區(qū)別，因此在硬件開(kāi)銷(xiāo)上差距很大，在相同硬件環(huán)境下，超深度學(xué)習(xí)具有超越深度學(xué)習(xí)的應(yīng)用效果是不可置疑的。

　　深度學(xué)習(xí)是把概率空間的數(shù)據(jù)映射到歐幾里得空間的，所以要對(duì)概率空間的隨機(jī)數(shù)據(jù)進(jìn)行全部的訓(xùn)練，致使應(yīng)用成本巨大不易普及。

　　特別是深度學(xué)習(xí)的應(yīng)用效果是靠數(shù)據(jù)集的規(guī)模所產(chǎn)生的，超深度學(xué)習(xí)不僅在概率模型上優(yōu)于深度學(xué)習(xí)，在特征集的規(guī)模上同樣可以超越深度學(xué)習(xí)的數(shù)據(jù)規(guī)模，因此超深度學(xué)習(xí)在應(yīng)用效果上超越深度學(xué)習(xí)是名副其實(shí)的。

　　超深度學(xué)習(xí)與深度學(xué)習(xí)在應(yīng)用效果上的比較表2.

　　如表2所示；在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)上深度學(xué)習(xí)是數(shù)十層乃至數(shù)百層，這樣就使問(wèn)題的復(fù)雜度急劇擴(kuò)大，造成組合的空間無(wú)窮的大，導(dǎo)致不可能得到最佳組合的解，因此出現(xiàn)黑箱問(wèn)題等，超深度學(xué)習(xí)同大腦的構(gòu)造近似，只有輸入層，腦神經(jīng)層，以及腦皮層三層，而且數(shù)學(xué)模型很接近大腦的機(jī)理，證明超深度學(xué)習(xí)符合大腦的機(jī)理。

　　再有，在模型能力擴(kuò)大的方法上深度學(xué)習(xí)是靠增加隱藏層的數(shù)量來(lái)實(shí)現(xiàn)的！超深度學(xué)習(xí)是靠增加輸入層的節(jié)點(diǎn)的個(gè)數(shù)，通過(guò)將復(fù)雜系統(tǒng)空間的映射，把目標(biāo)函數(shù)變換成若干子空間，并把子空間的特征分量對(duì)應(yīng)輸入層的各個(gè)節(jié)點(diǎn)，通過(guò)擴(kuò)大節(jié)點(diǎn)的個(gè)數(shù)達(dá)到深入學(xué)習(xí)的目的。

　　下面準(zhǔn)備介紹一下我和我的團(tuán)隊(duì)正在進(jìn)行的超深度學(xué)習(xí)視覺(jué)芯片的開(kāi)發(fā)情況。

　　圖9是超深度學(xué)習(xí)視覺(jué)芯片的構(gòu)成，這個(gè)項(xiàng)目是同由日立，NEC以及三菱電機(jī)，三個(gè)公司的半導(dǎo)體事業(yè)部剝離組建的日本最大的芯片公司RENESAS公司聯(lián)合開(kāi)發(fā)的，采用硬件加軟件的形式。對(duì)于非常占用處理時(shí)間的顏色變換，以及為盡可能獲取圖像的本來(lái)信息，針對(duì)圖像的空間映射等采用硬件處理，算法用軟件處理。超深度學(xué)習(xí)獨(dú)特的兩種對(duì)抗學(xué)習(xí)以及無(wú)監(jiān)督學(xué)習(xí)的算法均在這一款芯片里搭載，因此，可以使這一芯片在圖像感知方面做到傳統(tǒng)的算法無(wú)可比擬的天衣無(wú)縫的精度與應(yīng)用效果。

　　圖9超深度學(xué)習(xí)視覺(jué)芯片的構(gòu)成

　　我們的超深度學(xué)習(xí)的研發(fā)戰(zhàn)略是，首先從算法上布局，既然已經(jīng)證實(shí)，導(dǎo)入超深度學(xué)習(xí)可以顛覆傳統(tǒng)的統(tǒng)計(jì)學(xué)的兩大參數(shù)，那么與這兩大參數(shù)有關(guān)的相關(guān)分析，回歸分析等等大量的統(tǒng)計(jì)學(xué)的數(shù)學(xué)模型，將成為超深度學(xué)習(xí)的重要架構(gòu)，這些成果可以分別通過(guò)論文的形式發(fā)表。同時(shí)將深度學(xué)習(xí)理論作為一個(gè)鏡子，逐一的將深度學(xué)習(xí)的一些特殊的算法在超深度學(xué)習(xí)上實(shí)現(xiàn)，在應(yīng)用上從圖像感知，語(yǔ)音感知到預(yù)測(cè)推論等的應(yīng)用可視化，在推廣上從提供SDK程序，SDL應(yīng)用電路板，SDL芯片以及開(kāi)源平臺(tái)，聯(lián)合開(kāi)發(fā)等等分別進(jìn)行，我們是原創(chuàng)單位因此不同我們的用戶競(jìng)爭(zhēng)，我們的角色是技術(shù)提供與服務(wù)，以及基礎(chǔ)性開(kāi)發(fā)，因此不獨(dú)立的進(jìn)行具體項(xiàng)目的開(kāi)發(fā)，可以為從事AI事業(yè)的創(chuàng)業(yè)公司進(jìn)行技術(shù)合作以及技術(shù)入股。

　　作為我們奉獻(xiàn)社會(huì)的超深度學(xué)習(xí)，由于不是通過(guò)組合方式訓(xùn)練海量的參數(shù)的，是直接對(duì)隨機(jī)分量的數(shù)據(jù)進(jìn)行概率自組織的學(xué)習(xí)，因此不存在黑箱問(wèn)題。而且，最大的特點(diǎn)是硬件要求門(mén)檻極低，普通一個(gè)芯片，任何一個(gè)移動(dòng)終端都可以立即應(yīng)用。超深度學(xué)習(xí)的基礎(chǔ)理論概念清楚，算法簡(jiǎn)單易懂，是可以大量普及的一個(gè)為大眾服務(wù)的AI算法。人工智能是國(guó)家戰(zhàn)略，自動(dòng)駕駛汽車(chē)是反映人工智能的國(guó)家水平的標(biāo)準(zhǔn)。為了證明超深度學(xué)習(xí)的能力，我們?cè)谏鐣?huì)的廣泛支持下，正在自動(dòng)駕駛汽車(chē)的開(kāi)發(fā)上驗(yàn)證超深度學(xué)習(xí)的應(yīng)用效果。目前所有的自動(dòng)駕駛研發(fā)團(tuán)隊(duì)，都因?yàn)榭刂七^(guò)于復(fù)雜沒(méi)有現(xiàn)成的人工智能模型的支持，而處于停滯不前的現(xiàn)狀。我們寄托超深度學(xué)習(xí)可以沖破自動(dòng)駕駛的難關(guān)，使L4級(jí)別的自動(dòng)駕駛不再是偽命題。

　　我是中國(guó)人，我愿意將我發(fā)明的超深度學(xué)習(xí)在中國(guó)產(chǎn)業(yè)化，為中國(guó)及世界的人工智能發(fā)展服務(wù)。我現(xiàn)在是中國(guó)軟件行業(yè)協(xié)會(huì)嵌入式系統(tǒng)分會(huì)和中國(guó)嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的理事、擔(dān)任著中國(guó)嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟新一代人工智能專業(yè)委員會(huì)主任職務(wù)。為促進(jìn)超深度學(xué)習(xí)在中國(guó)的產(chǎn)業(yè)化，我已將超深度學(xué)習(xí)的宣傳和產(chǎn)業(yè)化的代理授權(quán)給中國(guó)嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的負(fù)責(zé)人。希望通過(guò)中國(guó)嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的積極組織，加快進(jìn)行超深度學(xué)習(xí)的產(chǎn)業(yè)化工作。我衷心的希望國(guó)家有關(guān)部門(mén)和相關(guān)的企事業(yè)單位大力支持超深度學(xué)習(xí)的產(chǎn)業(yè)化。歡迎從事人工智能的研究和應(yīng)用的單位及專家、學(xué)者、技術(shù)人員加入到超深度學(xué)習(xí)的研究與推廣隊(duì)伍中來(lái)，共同為早日實(shí)現(xiàn)超深度學(xué)習(xí)的產(chǎn)業(yè)化做努力！

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

創(chuàng)造新一代人工智能的核心理論

日期： 2019-02-18

作者：株式會(huì)社阿波羅日本 首席科學(xué)家顧澤蒼（中國(guó)籍）

相關(guān)內(nèi)容

作者：株式會(huì)社阿波羅日本首席科學(xué)家顧澤蒼（中國(guó)籍）