《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > MIT用19個(gè)神經(jīng)元實(shí)現(xiàn)自動(dòng)駕駛控制

MIT用19個(gè)神經(jīng)元實(shí)現(xiàn)自動(dòng)駕駛控制

2020-10-31
來(lái)源:量子位

  打造一個(gè)自動(dòng)駕駛控制系統(tǒng)需要多少個(gè)神經(jīng)元,?

  MIT的科學(xué)家告訴你,,最少只要19個(gè)!方法是向線(xiàn)蟲(chóng)這種初等生物學(xué)習(xí),。

20201030071437378.jpg

  最近,,來(lái)自MIT CSAIL,、維也納工業(yè)大學(xué)、奧地利科技學(xué)院的團(tuán)隊(duì)已經(jīng)開(kāi)發(fā)了一種基于線(xiàn)蟲(chóng)大腦的新型AI系統(tǒng),。研究成果登上了最近的《自然·機(jī)器智能》雜志,。

  他們發(fā)現(xiàn),具有19個(gè)控制神經(jīng)元的單個(gè)算法,,通過(guò)253個(gè)突觸將32個(gè)封裝的輸入特征連接到輸出,,可以學(xué)習(xí)把高維輸入映射到操縱命令。

  這種新的AI系統(tǒng)用少量人工神經(jīng)元控制車(chē)輛轉(zhuǎn)向,。而基于LSTM的神經(jīng)網(wǎng)絡(luò)打造同樣的自動(dòng)駕駛系統(tǒng),,網(wǎng)絡(luò)結(jié)構(gòu)則要復(fù)雜得多。

  

20201030071437459.gif

  △實(shí)現(xiàn)的車(chē)輛控制系統(tǒng)

  為何能做到這么少的神經(jīng)元數(shù)量,,論文共同一作MIT CSAIL博士后Ramin Hasani解釋說(shuō):

  與以前的深度學(xué)習(xí)模型相比,,每個(gè)單元內(nèi)信號(hào)的處理都遵循不同的數(shù)學(xué)原理。

  他們從秀麗隱桿線(xiàn)蟲(chóng)這種生物受到啟發(fā),在2018年提出了一種神經(jīng)元回路策略(Neuronal Circuit Policies,,NCP),。

  

20201030071438160.png

  NCP方法是重新利用生物神經(jīng)回路模型的功能,創(chuàng)建可解釋的控制智能體,,管理虛擬和現(xiàn)實(shí)世界的強(qiáng)化學(xué)習(xí)(RL)測(cè)試平臺(tái),。

  該方法對(duì)線(xiàn)蟲(chóng)的TW神經(jīng)回路進(jìn)行建模,這個(gè)回路主要負(fù)責(zé)線(xiàn)蟲(chóng)對(duì)外部機(jī)械觸摸刺激的反射反應(yīng),,通過(guò)掌握其突觸和神經(jīng)元參數(shù),,作為控制基本強(qiáng)化學(xué)習(xí)任務(wù)的策略。

  為了測(cè)試這種新的數(shù)學(xué)模型,,團(tuán)隊(duì)選擇了一項(xiàng)特別重要的測(cè)試任務(wù)——讓自動(dòng)駕駛汽車(chē)保持在車(chē)道上,。神經(jīng)網(wǎng)絡(luò)接收攝像機(jī)拍攝的道路圖像,然后自動(dòng)決定是向左還是向右轉(zhuǎn),。

 

20201030071438959.jpg

  諸如自動(dòng)駕駛之類(lèi)的復(fù)雜任務(wù),,往往需要具有數(shù)百萬(wàn)個(gè)參數(shù)的深度學(xué)習(xí)模型。但是,,用NCP方法能夠?qū)⒕W(wǎng)絡(luò)規(guī)模減少兩個(gè)數(shù)量級(jí),。

  而這個(gè)19神經(jīng)元極簡(jiǎn)自動(dòng)駕駛系統(tǒng)僅使用了7.5萬(wàn)個(gè)訓(xùn)練參數(shù),參數(shù)數(shù)量降低了2個(gè)數(shù)量級(jí),。

  NCP方法構(gòu)建的自動(dòng)駕駛系統(tǒng)也需要,,但是僅用于從攝像機(jī)傳入的視覺(jué)數(shù)據(jù),并從中提取出結(jié)構(gòu)特征,。它與車(chē)輛的實(shí)際轉(zhuǎn)向無(wú)關(guān),。

  后面的神經(jīng)網(wǎng)絡(luò)來(lái)確定攝像機(jī)圖像的哪些部分重要,然后將信號(hào)傳遞到網(wǎng)絡(luò)的NCP控制系統(tǒng),。

  

20201030071438141.png

  系統(tǒng)的控制部分將感知系統(tǒng)中的數(shù)據(jù)轉(zhuǎn)換為轉(zhuǎn)向命令,,僅包含19個(gè)神經(jīng)元。

  兩個(gè)子系統(tǒng)堆疊在一起并同時(shí)接受訓(xùn)練,,訓(xùn)練數(shù)據(jù)集是波士頓地區(qū)人類(lèi)駕駛汽車(chē)視頻,,包括圖像與汽車(chē)轉(zhuǎn)向操作的關(guān)聯(lián)數(shù)據(jù)。

  將它們一起輸入網(wǎng)絡(luò),,直到系統(tǒng)學(xué)會(huì)自動(dòng)將圖像與適當(dāng)?shù)霓D(zhuǎn)向系統(tǒng)連接起來(lái),,可以獨(dú)立處理新情況。

  除了結(jié)構(gòu)簡(jiǎn)單外,,用NCP設(shè)計(jì)的自動(dòng)駕駛系統(tǒng)相比傳統(tǒng)模型,,還有兩大優(yōu)勢(shì):可解釋性和魯棒性。

  系統(tǒng)的可解釋性能讓我們我們看到網(wǎng)絡(luò)將注意力集中在什么方面,。

  從視頻中可以看出,,神經(jīng)網(wǎng)絡(luò)專(zhuān)注于圖像的非常具體的部分,,比如路邊和地平線(xiàn)。研究人員表示,,這種行為是在A(yíng)I系統(tǒng)中是獨(dú)一無(wú)二的,。

20201030071439968.gif

  此外,可解釋性細(xì)化到了每個(gè)神經(jīng)元,。我們還能看到哪個(gè)神經(jīng)元(視頻中亮起部分)在駕駛決策中的作用,。我們可以了解單個(gè)神經(jīng)元的功能及其行為。

  為了測(cè)試對(duì)比與傳統(tǒng)模型和NCP模型的魯棒性,,研究人員還給輸入圖像加入了擾動(dòng),,并評(píng)估了智能體對(duì)噪聲的處理能力。結(jié)果NCP表現(xiàn)出了對(duì)輸入偽像的強(qiáng)大抵抗力,。

  除了可解釋性和魯棒性,,NCP模型還有其他優(yōu)勢(shì)。比如減少訓(xùn)練時(shí)間,,減少在相對(duì)簡(jiǎn)單的系統(tǒng)中實(shí)現(xiàn)AI的不確定性,。

  Ramin Hasani博士還表示,NCP不僅能應(yīng)用自動(dòng)駕駛中,,它能模仿學(xué)習(xí)意味著更廣泛的應(yīng)用,,比如倉(cāng)庫(kù)的自動(dòng)化機(jī)器人等等。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話(huà):010-82306118,;郵箱:[email protected]