布朗大學(xué)計(jì)算機(jī)科學(xué)助理教授斯特弗尼?特里克斯正在解決一個(gè)棘手的問(wèn)題:機(jī)器人的抓握能力,。她建立了一個(gè)機(jī)器學(xué)習(xí)模型,使機(jī)器人能夠自動(dòng)學(xué)習(xí)操縱對(duì)象,,并且能夠從中產(chǎn)生許多樣本數(shù)據(jù),,有了這些數(shù)據(jù),其他研究人員可以用它來(lái)訓(xùn)練機(jī)器人的抓握能力,。
一開(kāi)始,,特里克斯言語(yǔ)之間就充滿(mǎn)著活力與激情,她慢慢陳述著在抓捏物體上,,機(jī)器人所面臨的普遍問(wèn)題,。
“大多數(shù)的機(jī)器人在大部分時(shí)間能夠抓取物體,但是這也是有一定前提條件的,。如果你去到機(jī)器人實(shí)驗(yàn)室,,并把一個(gè)陌生的從沒(méi)看到過(guò)的物體放在機(jī)器人面前,該機(jī)器人基本上是無(wú)法抓起這個(gè)東西的,,因?yàn)樗摹季S’里沒(méi)有這個(gè)物體的信息,,也沒(méi)有針對(duì)該物體做過(guò)訓(xùn)練?!?/p>
這真的是一個(gè)實(shí)際問(wèn)題,,因?yàn)闄C(jī)器人要抓起這些物體,它們就必須明白具體的任務(wù),,以及從傳感器信息庫(kù)中知道關(guān)于該物體的相關(guān)信息,。例如它的形狀,它所在的位置等等,。而這些問(wèn)題也是機(jī)器人手臂必須被解答的問(wèn)題,,通常還包括,要想抓起這些物體,,那么機(jī)器人手臂應(yīng)該調(diào)整到什么位置才能夠準(zhǔn)確地抓起該物體呢,?
研究人員對(duì)機(jī)器人進(jìn)行編程之后,它可以拿起特定的物體,這其中都是有一部分規(guī)律可循的,,但是這些編程好的程序通常只能幫助機(jī)器人抓捏起一小部分的物體,。目前,要想使得機(jī)器人能夠自主地抓起某些不熟悉的物體或者移動(dòng)它們,,還是有很大難度的,,有類(lèi)似能力的機(jī)器人還在開(kāi)發(fā)當(dāng)中。
而特里克斯所構(gòu)建的機(jī)器學(xué)習(xí)模型可以讓她的實(shí)驗(yàn)室機(jī)器人在錯(cuò)誤中進(jìn)行學(xué)習(xí),,經(jīng)過(guò)反復(fù)試驗(yàn),直到它能成功地抓起物體,。在嘗試和錯(cuò)誤的交替過(guò)程中,,可以產(chǎn)生一系列的關(guān)于該物體的圖片信息庫(kù),以及夾持器與物體之間也可以在磨合中更加熨帖,。
機(jī)器人不斷練習(xí)所產(chǎn)生的附屬產(chǎn)品就是數(shù)據(jù)庫(kù),,它可以成為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù),用來(lái)訓(xùn)練其他機(jī)器人來(lái)抓捏同樣的物體,。但在特里克斯實(shí)驗(yàn)室中,,她的巴克斯特機(jī)器人卻不能夠產(chǎn)生足夠多的樣本數(shù)據(jù)。
為了解決這個(gè)問(wèn)題,,特里克斯推出了一個(gè)“百萬(wàn)挑戰(zhàn)計(jì)劃”,,她想要招募全世界的實(shí)驗(yàn)室,針對(duì)400臺(tái)巴克斯特機(jī)器人來(lái)進(jìn)行研究,,讓這些閑置的機(jī)器人可以根據(jù)她所研發(fā)的機(jī)器學(xué)習(xí)模型來(lái)運(yùn)行,,讓它們對(duì)上百萬(wàn)個(gè)物體進(jìn)行抓取實(shí)驗(yàn),最終得到一份詳細(xì)的數(shù)據(jù),。
為什么樣本訓(xùn)練數(shù)據(jù)很重要
近年來(lái),,機(jī)器學(xué)習(xí)的應(yīng)用技術(shù)如自動(dòng)駕駛汽車(chē)以及圖像識(shí)別的應(yīng)用技術(shù)都得到了迅猛的發(fā)展,都是因?yàn)樵谶@些領(lǐng)域有大量的樣本數(shù)據(jù)可以用來(lái)訓(xùn)練這些機(jī)器學(xué)習(xí)模型,。而機(jī)器人抓取能力的滯后,,最主要原因在于樣本數(shù)據(jù)的缺少,從而無(wú)法訓(xùn)練神經(jīng)網(wǎng)絡(luò),。
使用標(biāo)記的數(shù)據(jù)來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型最便于理解的例子就是圖像識(shí)別,。圖像識(shí)別的精度已經(jīng)提高了90%。如此進(jìn)步可以歸因于機(jī)器學(xué)習(xí)的應(yīng)用以及龐大的樣本數(shù)據(jù)庫(kù),。數(shù)以百萬(wàn)計(jì)的標(biāo)記圖片集已經(jīng)在學(xué)術(shù)研究中被廣泛使用了,,如谷歌,F(xiàn)acebook和其他在線圖像存儲(chǔ)器,。
神經(jīng)網(wǎng)絡(luò)是如何工作的
神經(jīng)網(wǎng)絡(luò)是一個(gè)由幾個(gè)簡(jiǎn)單高度互連的處理元件組成的計(jì)算機(jī)系統(tǒng),,可以通過(guò)對(duì)外部輸入的動(dòng)態(tài)回應(yīng)來(lái)處理信息。它主要是通過(guò)處理大量的被標(biāo)記的數(shù)據(jù),從而來(lái)獲得理解不同情形的能力,。
一張鳥(niǎo)的圖像中,,鳥(niǎo)是特定的鳥(niǎo),在一張汽車(chē)圖像中,,汽車(chē)也是特定的汽車(chē),。大量的圖像樣本可通過(guò)機(jī)器學(xué)習(xí)軟件來(lái)進(jìn)行處理,如Torch和Tensorflow,,然后讓它在神經(jīng)網(wǎng)絡(luò)上運(yùn)行,,就能夠?qū)ζ溥M(jìn)行訓(xùn)練來(lái)識(shí)別照片中的物體了。
在這種情況下,,輸入的信息主要就是大量的被標(biāo)記的圖像,,緊接著系統(tǒng)就能輸出關(guān)于該圖片的許多識(shí)別標(biāo)簽,例如所輸入的圖片到底有沒(méi)有汽車(chē),。而還有一個(gè)隱藏的部分就是整個(gè)處理過(guò)程,,通常包含神經(jīng)元,以及根據(jù)算法而來(lái)的機(jī)器學(xué)習(xí)軟件處理程序,,也可被稱(chēng)為該圖像的中間值,。
緊接著系統(tǒng)會(huì)對(duì)這些樣本數(shù)據(jù)進(jìn)行重新處理,從而可以測(cè)試出該模型在推測(cè)圖片標(biāo)簽上的準(zhǔn)確性,。然后再對(duì)結(jié)果進(jìn)行比對(duì),,如果有錯(cuò)誤就更正過(guò)來(lái),并將其反饋到神經(jīng)網(wǎng)絡(luò)中,,算法程序就可以根據(jù)所反饋的內(nèi)容做出相關(guān)判斷,。這樣的糾錯(cuò)過(guò)程會(huì)如此往復(fù)直到出現(xiàn)正確的預(yù)測(cè)。
自動(dòng)駕駛汽車(chē)也是以同樣的方式來(lái)學(xué)習(xí)駕駛的,。當(dāng)有人在駕駛某一輛特定的汽車(chē)時(shí),,可以將路面的情況,以及各個(gè)轉(zhuǎn)彎的角度用3D視頻的方式記錄下來(lái),,形成樣本數(shù)據(jù)庫(kù),。
該日志可以輸入到機(jī)器學(xué)習(xí)系統(tǒng)當(dāng)中,從而可以訓(xùn)練算法正確地將相關(guān)信息輸入到視頻中去,。這個(gè)過(guò)程會(huì)重復(fù)進(jìn)行,,直到調(diào)整到一個(gè)適用于車(chē)輛操作的駕駛模式。
用來(lái)訓(xùn)練圖像識(shí)別系統(tǒng)的樣本信息量是很巨大的,。而自動(dòng)駕駛汽車(chē)有大量的數(shù)據(jù)集,。谷歌研發(fā)的自動(dòng)駕駛汽車(chē)已經(jīng)行駛了一百萬(wàn)英里,特斯拉也行駛了近10億英里,,有了這些數(shù)據(jù),,可以提供更全的駕駛經(jīng)驗(yàn),。而訓(xùn)練機(jī)器人的抓握能力時(shí),卻沒(méi)有這些數(shù)據(jù)的支持,。
“百萬(wàn)挑戰(zhàn)計(jì)劃”
如果特里克斯的“百萬(wàn)挑戰(zhàn)計(jì)劃”可以成功,,將會(huì)獲得大量的數(shù)據(jù),終將有一天可以讓機(jī)器人有更準(zhǔn)確的抓握能力,。