研究人的步態(tài),,了解人體勻稱性,,了解腳的位置,,利用這些信息,,美國(guó)密歇根大學(xué)研究人員就能訓(xùn)練無(wú)人駕駛汽車,,讓它們識(shí)別并預(yù)測(cè)行人的移動(dòng),,精準(zhǔn)度比現(xiàn)有技術(shù)更高,。
研究人員用汽車攝像頭,、激光雷達(dá),、GPS收集信息,,捕捉人類移動(dòng)視頻,然后在3D計(jì)算機(jī)模型中重建,。有了這些資料,,研究人員開(kāi)發(fā)一個(gè)“受生物力學(xué)啟發(fā)的遞歸神經(jīng)網(wǎng)絡(luò)”,給人類動(dòng)作分類,。
有了神經(jīng)網(wǎng)絡(luò),,當(dāng)一個(gè)或者幾個(gè)行人離汽車還有一段距離(最遠(yuǎn)50碼),汽車就能預(yù)測(cè)他們的姿勢(shì)和未來(lái)位置,。這樣的距離已經(jīng)可以覆蓋十字路口了,。
密歇根大學(xué)機(jī)械工程助理教授Ram Vasudevan說(shuō):“在這一領(lǐng)域,此前一般只是關(guān)注靜態(tài)圖像,,不會(huì)關(guān)心人是如何在3D世界移動(dòng)的,。當(dāng)汽車投入使用,與現(xiàn)實(shí)世界交流時(shí),,我們必須對(duì)行人的前進(jìn)方向進(jìn)行預(yù)測(cè),,并與汽車的前進(jìn)方向保持一致?!?/p>
如果想讓汽車具備一定的預(yù)測(cè)能力,,要求網(wǎng)絡(luò)理解人類活動(dòng)的細(xì)節(jié):比如步態(tài)的節(jié)奏,、四肢對(duì)稱鏡像、行走時(shí)腳的位置會(huì)給穩(wěn)定帶來(lái)怎樣的影響,。
在無(wú)人駕駛研發(fā)中,,目前大多機(jī)器學(xué)習(xí)技術(shù)處理的是2D圖像,也就是靜態(tài)圖片,。向計(jì)算機(jī)展示大量與停車標(biāo)志有關(guān)的照片,,最終讓它識(shí)別現(xiàn)實(shí)世界的停車標(biāo)志,實(shí)時(shí)響應(yīng),。
不過(guò)密歇根大學(xué)用視頻訓(xùn)練神經(jīng)網(wǎng)絡(luò),,視頻只有幾秒長(zhǎng),系統(tǒng)深入理解前半段視頻,,然后做出預(yù)測(cè),,看看預(yù)測(cè)是否符合后半段視頻,精準(zhǔn)度如何,。
密歇根大學(xué)造船和海洋工程系副教授Matthew Johnson-Roberson說(shuō):“現(xiàn)在我們對(duì)系統(tǒng)進(jìn)行訓(xùn)練,,讓它識(shí)別動(dòng)作,做出預(yù)測(cè),,不是簡(jiǎn)單識(shí)別一樣?xùn)|西,,比如是不是停車標(biāo)志,而是預(yù)測(cè)下一步行人的身體會(huì)變成怎樣,,再接下來(lái)又怎樣,然后繼續(xù)預(yù)測(cè)下一步,?!?/p>
解釋神經(jīng)網(wǎng)絡(luò)的運(yùn)作原理時(shí),Vasudevan打了個(gè)比方:“如果行人正在玩手機(jī),,你應(yīng)該知道他的注意力不集中,,分散了。姿勢(shì),,正在觀看什么,,這些信息會(huì)告訴你他們的注意力等級(jí)如何,還能告訴你接下來(lái)他們能做什么,?!?/p>
事實(shí)證明,新系統(tǒng)可以增強(qiáng)無(wú)人駕駛汽車的識(shí)別預(yù)測(cè)能力,。
Johnson-Roberson說(shuō):“在我們的預(yù)測(cè)中,,如果是一秒之后的預(yù)測(cè),中位平均誤差大約是10厘米,,如果是6秒之后的預(yù)測(cè),,誤差不到80厘米,。用其它方法預(yù)測(cè),誤差中值最高可達(dá)7米,,所以用我們的系統(tǒng)預(yù)測(cè)行人位置,,精準(zhǔn)度高很多?!?/p>
在預(yù)測(cè)下一步行動(dòng)時(shí)會(huì)涉及到選項(xiàng),,為了控制選項(xiàng)數(shù)量,研究人員將人類身體的物理約束考慮進(jìn)去,,比如人是無(wú)法飛翔的,,最快的步伐速度也有是限制的。
為了創(chuàng)建數(shù)據(jù)集,,給神經(jīng)網(wǎng)絡(luò)用,,研究人員將一輛Level 4無(wú)人駕駛汽車放在幾個(gè)十字路口。汽車攝像頭和激光雷達(dá)瞄準(zhǔn)十字路口,,一次可以記錄多天的數(shù)據(jù),。
在實(shí)驗(yàn)室,研究人員已經(jīng)從傳統(tǒng)姿勢(shì)數(shù)據(jù)集收集信息,,用來(lái)增強(qiáng)現(xiàn)實(shí)世界收集的數(shù)據(jù),。最終他們開(kāi)發(fā)的系統(tǒng)可以讓無(wú)人駕駛汽車變得更強(qiáng)大。
密歇根大學(xué)研究工程師杜小?。╔iaoxiao Du)說(shuō):“對(duì)于多樣化應(yīng)用和跨學(xué)科合作,,我們保持開(kāi)放態(tài)度,我們希望能創(chuàng)造一個(gè)更安全,、更健康,、更高效的宜居環(huán)境,或者為此做出貢獻(xiàn),?!?/p>