完整解析AI人工智能：3大浪潮＋3大技術(shù)＋3大應(yīng)用-AET-電子技術(shù)應(yīng)用

完整解析AI人工智能：3大浪潮＋3大技術(shù)＋3大應(yīng)用

日期： 2018-05-26

關(guān)鍵詞： AI 羿戓制造深度學(xué)習(xí) 人工智能

　　所謂人工智能（Artificial Intelligence；縮寫(xiě)：AI），是指以人工方式來(lái)實(shí)現(xiàn)人類(lèi)所具有之智慧的技術(shù)。只不過(guò)，目前能實(shí)現(xiàn)與人類(lèi)智能同等的技術(shù)還不存在，世界上絕大多數(shù)的人工智能還是只能解決某個(gè)特定問(wèn)題。本篇文章是在我閱讀了幾本AI的相關(guān)書(shū)籍后，所概略統(tǒng)整出的架構(gòu)，希望讓初次接觸AI的讀者，能透過(guò)333口訣，快速理解AI到底是什么。

　　一、AI的三次浪潮

　　人工智能AI發(fā)展史

　　第一次AI浪潮

　　第一次AI浪潮起于1950～1960年，止于1980年代。由于出現(xiàn)在網(wǎng)絡(luò)之前，因此又被稱(chēng)為“古典人工智能”。這時(shí)期出現(xiàn)的“符號(hào)主義”與“聯(lián)結(jié)主義”，分別是日后“專(zhuān)家系統(tǒng)”與“深度學(xué)習(xí)”的雛形。只不過(guò)，雖然當(dāng)時(shí)的成果已能解開(kāi)拼圖或簡(jiǎn)單的游戲，卻幾乎無(wú)法解決實(shí)用的問(wèn)題。

　　第二次AI浪潮

　　第二次AI熱潮伴隨著計(jì)算機(jī)的普及，出現(xiàn)在1980年代。這時(shí)期所進(jìn)行的研究，是以灌輸「專(zhuān)家知識(shí)」作為規(guī)則，來(lái)協(xié)助解決特定問(wèn)題的“專(zhuān)家系統(tǒng)”（Expert system）為主。然而，縱使當(dāng)時(shí)有商業(yè)應(yīng)用的實(shí)例，應(yīng)用范疇卻很有限，熱潮也因此逐漸消退。

　　第三次AI浪潮

　　第三次AI浪潮則出現(xiàn)于2010年代，伴隨著高性能計(jì)算機(jī)、因特網(wǎng)、大數(shù)據(jù)、傳感器的普及，以及計(jì)算成本的下降，“機(jī)器學(xué)習(xí)”隨之興起。所謂機(jī)器學(xué)習(xí)（Machine leaning），是指讓計(jì)算機(jī)大量學(xué)習(xí)數(shù)據(jù)，使它可以像人類(lèi)一樣辨識(shí)聲音及影像，或是針對(duì)問(wèn)題做出合適的判斷。

　　二、AI的三大技術(shù)

　　快速了解了AI的發(fā)展史后，我們來(lái)看看當(dāng)代人工智能的三大代表性模型：遺傳算法、專(zhuān)家系統(tǒng)、類(lèi)神經(jīng)網(wǎng)絡(luò)。

　　1、遺傳算法

　　遺傳算法（Genetic algorithm；GA），又稱(chēng)為演化式算法（Evolutionary algorithm），是受達(dá)爾文演化論所啟發(fā)的人工智能。它透過(guò)「適者生存」的規(guī)則，將“優(yōu)秀的個(gè)體”想象成“好的答案”，透過(guò)演化的方式來(lái)找出最佳解。

　　2、專(zhuān)家系統(tǒng)

　　專(zhuān)家系統(tǒng)（Expert system），則是針對(duì)預(yù)設(shè)的問(wèn)題，事先準(zhǔn)備好大量的對(duì)應(yīng)方式。它應(yīng)用在很多地方，尤其是疾病診斷。只不過(guò)，專(zhuān)家系統(tǒng)只能針對(duì)專(zhuān)家預(yù)先考慮過(guò)的狀況來(lái)準(zhǔn)備對(duì)策，它并沒(méi)有自行學(xué)習(xí)的能力，因此還是有其局限性。

　　3、類(lèi)神經(jīng)網(wǎng)絡(luò)

　　從第三次AI浪潮所興起的機(jī)器學(xué)習(xí)（Machine learning）有許多種手法，其中最受矚目的，莫過(guò)于深度學(xué)習(xí)（Deep learning）了。所謂深度學(xué)習(xí)，是透過(guò)模仿人腦的“類(lèi)神經(jīng)網(wǎng)絡(luò)”（Neural network）來(lái)學(xué)習(xí)大量數(shù)據(jù)的手法。

　　類(lèi)神經(jīng)網(wǎng)絡(luò)的由來(lái)

　　若你去觀察腦的內(nèi)部，會(huì)發(fā)現(xiàn)有大量稱(chēng)為“神經(jīng)元”的神經(jīng)細(xì)胞彼此相連。一個(gè)神經(jīng)元從其他神經(jīng)元那里接收的電氣信號(hào)量達(dá)某一定值以上，就會(huì)興奮（神經(jīng)沖動(dòng)）；在某一定值以下，就不會(huì)興奮。

　　興奮起來(lái)的神經(jīng)元，會(huì)將電器信號(hào)傳送給下一個(gè)相連的神經(jīng)元。下一個(gè)神經(jīng)元同樣會(huì)因此興奮或不興奮。簡(jiǎn)單來(lái)說(shuō)，彼此相連的神經(jīng)元，會(huì)形成聯(lián)合傳遞行為。我們透過(guò)將這種相連的結(jié)構(gòu)來(lái)數(shù)學(xué)模型化，便形成了類(lèi)神經(jīng)網(wǎng)絡(luò)。

　　類(lèi)神經(jīng)網(wǎng)絡(luò)：深度學(xué)習(xí)

　　我們可以發(fā)現(xiàn)，經(jīng)模型化的的類(lèi)神經(jīng)網(wǎng)絡(luò)，是由“輸入層”（Input layer）、“隱藏層”（Hidden layer）及“輸出層”（Output layer）等三層所構(gòu)成。另外，學(xué)習(xí)數(shù)據(jù)則是由輸入數(shù)據(jù)以及相對(duì)應(yīng)的正確解答來(lái)組成。

　　以影像辨識(shí)為例，為了讓AI學(xué)習(xí)類(lèi)神經(jīng)網(wǎng)絡(luò)的模型，首先必須先將影像學(xué)習(xí)數(shù)據(jù)分割成像素?cái)?shù)據(jù)，然后將各像素值輸進(jìn)輸入層。

　　接受了數(shù)據(jù)的輸入層，將像素值乘上“權(quán)重”后，便傳送給后方隱藏層的神經(jīng)元。隱藏層的各個(gè)神經(jīng)元會(huì)累加前一層所接收到的值，并將其結(jié)果再乘上“權(quán)重”后，傳送給后方的神經(jīng)元。最后，經(jīng)由輸出層的神經(jīng)元的輸出，便可得到影像辨識(shí)的預(yù)測(cè)結(jié)果。

　　為了讓輸出層的值跟各個(gè)輸入數(shù)據(jù)所對(duì)應(yīng)的正解數(shù)據(jù)相等，會(huì)對(duì)各個(gè)神經(jīng)元的輸入計(jì)算出適當(dāng)?shù)摹皺?quán)重”值。

　　這個(gè)權(quán)重的計(jì)算，一般是使用“誤差倒傳遞算法”（Error Back Propagation），使用與正解數(shù)據(jù)之間的誤差，從輸出層逆推回去。透過(guò)各「權(quán)重」的調(diào)整，來(lái)縮小輸出層的值與正解數(shù)據(jù)的值之間的誤差，以建立出完成學(xué)習(xí)的模型。

　　由于過(guò)去類(lèi)神經(jīng)網(wǎng)絡(luò)之間進(jìn)行傳遞的權(quán)重值難以?xún)?yōu)化，因此曾有多數(shù)研究者對(duì)類(lèi)神經(jīng)網(wǎng)絡(luò)的研究持否定態(tài)度。直到2006年，辛頓（Geoffrey Hinton）開(kāi)發(fā)出自動(dòng)編碼器（Autoencoder）的手法，才突破了這項(xiàng)瓶頸。

　　自動(dòng)編碼器是指，在類(lèi)神經(jīng)網(wǎng)絡(luò)的輸入層和輸出層使用相同數(shù)據(jù)，并將隱藏層設(shè)置于二者之間，藉此用來(lái)調(diào)整類(lèi)神經(jīng)網(wǎng)絡(luò)之間的權(quán)重參數(shù)的一種手法。利用以自動(dòng)編碼器所獲得的類(lèi)神經(jīng)網(wǎng)絡(luò)權(quán)重參數(shù)值進(jìn)行初始化后，便能應(yīng)用「誤差倒傳遞算法」，提高多層類(lèi)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)準(zhǔn)確度。

　　透過(guò)類(lèi)神經(jīng)網(wǎng)絡(luò)，深度學(xué)習(xí)便成為了“只要將數(shù)據(jù)輸入類(lèi)神經(jīng)網(wǎng)絡(luò)，它就能自行抽出特征”的人工智能，而這又稱(chēng)為“特征學(xué)習(xí)”（feature learning）。

　　深度學(xué)習(xí)最擅長(zhǎng)的，是它能辨識(shí)圖像數(shù)據(jù)或波形數(shù)據(jù)這類(lèi)無(wú)法符號(hào)化的數(shù)據(jù)。自2010年代以來(lái)，如Google、Microsoft及Facebook等美國(guó)知名IT企業(yè)，都開(kāi)始著手深度學(xué)習(xí)的研究。例如，蘋(píng)果「Siri」的語(yǔ)音識(shí)別，Microsoft搜索引擎「Bing」所具備的影像搜尋等等，而Google的深度學(xué)習(xí)項(xiàng)目也已超過(guò)1,500項(xiàng)。

　　至于深度學(xué)習(xí)如此飛躍的成長(zhǎng)，要?dú)w功于硬設(shè)備的提升。圖形處理器（GPU）大廠輝達(dá)（NVIDIA）利用該公司的圖形適配器來(lái)提升深度學(xué)習(xí)的性能，提供鏈接庫(kù)（Library）和框架（framework）產(chǎn)品，并積極開(kāi)設(shè)研討課程。另外，Google也公開(kāi)了框架「TensorFlow」，可以將深度學(xué)習(xí)應(yīng)用于數(shù)據(jù)分析。

　　三、AI的三大應(yīng)用

　　據(jù)羿戓制造了解到，AI應(yīng)用領(lǐng)域主要可分為語(yǔ)音識(shí)別、影像辨識(shí)以及自然語(yǔ)言處理等三部分。

　　1、語(yǔ)音識(shí)別

　　語(yǔ)音識(shí)別部分，透過(guò)多年來(lái)語(yǔ)音識(shí)別競(jìng)賽CHiME的研究，已經(jīng)有了等同人類(lèi)的辨識(shí)度（CHiME，是針對(duì)實(shí)際生活環(huán)境下的語(yǔ)音識(shí)別，所進(jìn)行評(píng)測(cè)的國(guó)際語(yǔ)音識(shí)別競(jìng)賽）。此外，Apple、Google、Amazon也相繼提出可應(yīng)用于日常生活的服務(wù)，因此其成熟度已達(dá)到實(shí)用等級(jí)。

　　2、影像辨識(shí)

　　影像辨識(shí)部分，雖然一般圖片的辨識(shí)已有同等于人類(lèi)的辨識(shí)率，但動(dòng)態(tài)影像的辨識(shí)準(zhǔn)確度卻仍比不上人類(lèi)，目前還在進(jìn)行各種算法的測(cè)試。其中，影像辨識(shí)目前最火熱的應(yīng)用場(chǎng)域非自動(dòng)駕駛莫屬了。

　　整個(gè)汽車(chē)、信息通訊產(chǎn)業(yè)都正朝著自駕車(chē)的方向努力，例如Google持續(xù)進(jìn)行自動(dòng)駕駛的研究，TOYOTA也在美國(guó)設(shè)立豐田研究所，可以知道現(xiàn)階段的開(kāi)發(fā)已十分接近實(shí)用化。因此，我們可判斷目前影像辨識(shí)的成熟度是介在研究和實(shí)用等級(jí)之間。

　　3、自然語(yǔ)言處理

　　自然語(yǔ)言處理（Natural language processing；NLP），是試著讓人工智能能理解人類(lèi)所寫(xiě)的文字和所說(shuō)的話語(yǔ)。NLP首先會(huì)分解詞性，稱(chēng)之“語(yǔ)素分析”（morphemic analysis），在分解出最小的字義單位后，接著會(huì)進(jìn)行“語(yǔ)法分析”（syntactic analysis），最后再透過(guò)“語(yǔ)意分析”（semantic analysis）來(lái)了解含意。

　　輸出部分，自然語(yǔ)言處理也與生成文法（generative grammar）密切相關(guān)。生成文法理論認(rèn)為，只要遵循規(guī)則即可生成文句。這也代表著，只要把規(guī)則組合在一起，便可能生成文章。

　　在自然語(yǔ)言處理中，最具代表性的應(yīng)用就是“聊天機(jī)器人”（Chatbot）了，它是一種如真人般，可透過(guò)文字訊息與人對(duì)話的程序。2016年，臉書(shū)推出了“Facebook Messenger Platform”，而Line也推出了“Messaging API”，因而促使這種搭載NLP技術(shù)的聊天機(jī)器人成為矚目的焦點(diǎn)。

　　另外，由IBM所開(kāi)發(fā)的華生（IBM Watson），也是應(yīng)用NLP的人工智能而成。華生可以從維基百科等語(yǔ)料庫(kù)中抽取知識(shí)，學(xué)習(xí)詞匯與詞匯之間的相關(guān)性。現(xiàn)在，就連軟件銀行（SoftBank）機(jī)器人Pepper也是搭載華生系統(tǒng)。

　　只不過(guò)，由于在日常對(duì)話中，我們很常省略詞句，也不一定會(huì)提及時(shí)空背景，因此當(dāng)前的Chatbot尚無(wú)法與人類(lèi)進(jìn)行天花亂墜的對(duì)話。所以說(shuō)，現(xiàn)行多數(shù)的Chatbot廠商，還是會(huì)限定對(duì)話的環(huán)境與應(yīng)用領(lǐng)域。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

完整解析AI人工智能：3大浪潮＋3大技術(shù)＋3大應(yīng)用

日期： 2018-05-26

相關(guān)內(nèi)容