提到機(jī)器人,,大家腦海中第一時(shí)間會浮現(xiàn)出怎樣的事物,?
大概率情況下,,要么是工業(yè)級/服務(wù)級機(jī)器人,,以機(jī)械臂,、簡單驅(qū)動型為主角,,不講究外形美觀,,動作也往往不怎么連貫,,常常被冠以“人工智障”的美稱,;
要么則是仿人機(jī)器人,,它們總是出沒在伯克利或波士頓動力等高大上的實(shí)驗(yàn)室里,能夠以七十二般武藝讓人類忍不住發(fā)出“滅絕警告”,,但必需的編程和持續(xù)作業(yè)能力,,以及技能的泛化程度,卻都達(dá)不到大規(guī)模應(yīng)用的可能,。
人與智能機(jī)器之間,,有沒有第三種可能呢?
其實(shí)早在1960年,,約瑟夫·利克萊德(J. C. R. Licklider)就曾提出了一個(gè)觀點(diǎn)——人機(jī)共生(Man-computer symbiosis),。
簡單來說,就是人類和電子設(shè)備以親密合作的方式生活在一起,甚至結(jié)成緊密的聯(lián)盟,。兩者的結(jié)合,,可以創(chuàng)造一種高產(chǎn)且生機(jī)勃勃的合作關(guān)系。
“人類機(jī)器命運(yùn)共同體”,,聽起來是不是很心動,?可惜的是,目前目前還很少見到人機(jī)共生體(man-computer symbioses)的出現(xiàn),。所以,,最近中國機(jī)器人產(chǎn)業(yè)中出現(xiàn)的“發(fā)球機(jī)器人”,就引起了我們的注意,。
原因無他,,這或許是人機(jī)共生“星星之火”燎原的起點(diǎn)。
點(diǎn)燃人機(jī)共生的星火:
發(fā)球機(jī)器人的初蹄
首先有必要解釋一下,,為什么說發(fā)球機(jī)器人,,體現(xiàn)出了“人機(jī)共生”的現(xiàn)實(shí)趨勢。
這款發(fā)球機(jī)器人,,起源于新松機(jī)器人與乒乓球?qū)W院一次偶然的談話,。
當(dāng)前的乒乓球運(yùn)動存在一些亟待解決的問題:
一是效率。助教為專業(yè)運(yùn)動員喂球時(shí),,往往在速度,、旋轉(zhuǎn)、落點(diǎn)控制,、頻率等方面,,難以達(dá)到高水平選手的訓(xùn)練需求;
二是統(tǒng)一,。一旦助教出現(xiàn)疲憊,、狀態(tài)不佳等情況,就會直接影響速度,、旋轉(zhuǎn)等參數(shù),,影響訓(xùn)練特定技戰(zhàn)術(shù)動作的一致性,運(yùn)動員很難形成最佳的肌肉記憶,;
三是反饋,。乒乓球是一項(xiàng)實(shí)時(shí)性非常高的運(yùn)動,往往一秒之間幾個(gè)來回,,過快的球速與落點(diǎn)的不確定性,也導(dǎo)致教練往往只能憑借經(jīng)驗(yàn)來反饋,,很難通過量化來優(yōu)化教學(xué),,一些特定動作也就無法有效分析和復(fù)現(xiàn)。
四是普及。乒乓球的另一個(gè)身份是“國球”,,中國有眾多的愛好者和青少年參與到這項(xiàng)運(yùn)動中來,,但不同地域、不同水平的教練卻參差不齊,,自然也就無法滿足更多人群享受乒乓球這項(xiàng)運(yùn)動的愿望,。
能不能通過智能技術(shù)的引入,來解決上述問題呢,?
深耕深度學(xué)習(xí)算法的龐伯特,,就以新松的機(jī)器人研發(fā)技術(shù)和中國乒乓球?qū)W院的海量專業(yè)數(shù)據(jù)和課程,研發(fā)出了可以自主決策的人工智能發(fā)球機(jī)器人,。
而讓龐伯特機(jī)器人得以勝任發(fā)球工作的幾大核心:
首先是感知,。通過高速雙目立體視覺系統(tǒng),機(jī)器人能夠捕捉高速運(yùn)動下的乒乓球位置,,并形成球的軌跡,,通過軌跡分析,在毫秒內(nèi)判斷球速以及球的旋轉(zhuǎn)方向,,讓乒乓球技術(shù)轉(zhuǎn)化為可視的數(shù)據(jù),,實(shí)時(shí)調(diào)整,精準(zhǔn)化訓(xùn)練,。
其次是決策:在軌跡分析的基礎(chǔ)上,,龐伯特同時(shí)對人體動作進(jìn)行捕捉,通過與預(yù)設(shè)的動作角度進(jìn)行比對,,分析運(yùn)動員動作是否到位,。結(jié)合軌跡和動作兩個(gè)因素,判斷運(yùn)動員的水平,,推薦課程,。對于個(gè)人愛好者來說,相當(dāng)于擁有了一個(gè)專業(yè)教練+陪練,。
再次是運(yùn)動,。龐伯特機(jī)器人具有類人化結(jié)構(gòu),不同于市面上以擠壓方式進(jìn)行發(fā)球的設(shè)備,,龐伯特能夠高度模擬類人化的發(fā)球方式,,模擬人類發(fā)球時(shí)對球方向和旋轉(zhuǎn),實(shí)現(xiàn)兩跳發(fā)球,。而利用不同的球拍膠面,,還能打出不一樣的球,這些都能更好地輔助人類運(yùn)動員進(jìn)行訓(xùn)練,。
顯然,,龐伯特機(jī)器人正在將技術(shù)思維(technical thinking)與人類智慧相結(jié)合,,為人機(jī)共生打開了新的窗口。
逃離恐怖谷:發(fā)球機(jī)器人昭示三重改變
從龐伯特機(jī)器人的實(shí)踐中不難看出,,如果在人和機(jī)器之間建立共生關(guān)系,,那么二者的合作互動顯然會大大改善很多現(xiàn)有問題。
由此也可以總結(jié)出,,共生型機(jī)器人與大眾常見的傳統(tǒng)機(jī)器人有何不同之處:
首先,,盡管所有人造系統(tǒng)都是為了幫助人類,但傳統(tǒng)的自動化機(jī)器人更多的是為了實(shí)現(xiàn)“人類增強(qiáng)”,,而共生型機(jī)器人則是為了“與人類更好地生活在一起”,。
還是以發(fā)球機(jī)器人為例,傳統(tǒng)的發(fā)球設(shè)備只是機(jī)械地?cái)U(kuò)展某項(xiàng)技能,,比如取代人的手臂來進(jìn)行發(fā)球,,往往需要人類助教來完成那些需要主動決策、調(diào)整,、制定標(biāo)準(zhǔn)等工作,,在效率和功能上并沒有帶來質(zhì)的改變。
而龐伯特機(jī)器人的特殊之處,,就在于通過深度學(xué)習(xí)算法的引入,,在智能程度上賦予了機(jī)器人新的高度。比如實(shí)時(shí)高通量的數(shù)據(jù)收集與處理,;高效精準(zhǔn)專業(yè)的預(yù)判決策,;個(gè)性定制化的訓(xùn)練反饋與指導(dǎo);乒乓球運(yùn)動的隨機(jī)性又要求算法具備一定的泛化能力和高魯棒性……這些都是龐伯特機(jī)器人能夠成為乒乓球運(yùn)動伙伴的關(guān)鍵,。
第二,,共生型機(jī)器人必須具備可“實(shí)時(shí)”(real time)進(jìn)行的思考過程。
傳統(tǒng)的機(jī)器人可以根據(jù)預(yù)先設(shè)定的程序處理數(shù)據(jù),。比如餐廳服務(wù)機(jī)器人,,輸入店內(nèi)地圖、設(shè)定好傳送菜程序之后只能按部就班地工作,,有的甚至連避讓行人都做不到,,因?yàn)樘崆霸O(shè)定會導(dǎo)致一旦出現(xiàn)不可預(yù)見的情況,整個(gè)過程就會停止,。
但球類運(yùn)動可不一樣,,乒乓球的高速運(yùn)動需要發(fā)球者做出毫秒級的判斷,像人一樣快速思考,、分析,、決策、反應(yīng),。對于人類來說都可能要靠直覺來完成的事情,,對機(jī)器與人之間的耦合要求要緊密的多,。
讓機(jī)器能夠做出決策和控制復(fù)雜的情況,,而不依賴于預(yù)先確定的程序,,就是龐伯特機(jī)器人向我們展示的現(xiàn)實(shí)圖景。
最后,,共生型機(jī)器人有機(jī)會重構(gòu)機(jī)器人行業(yè)的商業(yè)方法論,。
長期以來,傳統(tǒng)機(jī)器人市場的商業(yè)邏輯,,要么是“人工+智能”,,用真人來操控機(jī)器人模型,以達(dá)到模擬強(qiáng)人工智能的效果,;要么是長期砸錢在天頂技術(shù)上,,比如波士頓動力的機(jī)器人雖然炫酷,卻因商業(yè)化困難而賣身給軟銀,。
但龐伯特機(jī)器人所代表的共生型機(jī)器人卻開啟了另一種模式,,通過“真AI算法”+聚焦實(shí)用場景來切入市場。
我們注意到,,除了發(fā)球機(jī)器人之外,,龐伯特還打造了對打機(jī)器人。
將深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)相結(jié)合,,讓對打機(jī)器人和發(fā)球機(jī)器人能夠通過大量復(fù)雜環(huán)境的交互,,運(yùn)用各自的人工智能算法平臺,不斷得到反饋,,互相學(xué)習(xí)到新的技能與策略,,機(jī)器人之間的對戰(zhàn)也能不斷提升算法模型的復(fù)雜度與智能度。
同時(shí),,一旦高性能算法模塊被拼圖一樣使用,,就能夠以低成本、小型化,、高效率的方式快速打開市場,,未來不止于乒乓球這一項(xiàng)運(yùn)動,更多場景都可以通過軌跡分析,、動作分析,、終端顯示等集成模塊帶來改變。
從這個(gè)角度看,,龐伯特機(jī)器人正在重新確立人與機(jī)器,、甚至是機(jī)器與機(jī)器的關(guān)系,即一種共生伙伴關(guān)系(symbiotic partnership),。在這一美好的畫面中,,機(jī)器會為人類提供見解和決策,,而人類則能更有效地進(jìn)行智力活動與創(chuàng)造。
打開產(chǎn)業(yè)智能的價(jià)值圖景:
挖掘人機(jī)共生的富礦
正如國際人工智能聯(lián)合大會前主席Francesca Rossi所說,,人機(jī)共生是未來人類使用AI的最好方式,。
那么,作為人類和機(jī)器的預(yù)期前景,,其中是否也埋藏著商業(yè)價(jià)值的富礦呢,?
答案是肯定的。
以龐伯特機(jī)器人為例,,未來就有可能締造出不少新的產(chǎn)業(yè)機(jī)遇,。
比如說,通過與海量運(yùn)動員對戰(zhàn),,發(fā)球機(jī)器人可以積累專業(yè)領(lǐng)域的數(shù)據(jù),,不斷優(yōu)化算法,快速提升自身的擊打能力和策略,,衍生出個(gè)性化的對戰(zhàn)方式,,來幫助運(yùn)動員更好地進(jìn)行訓(xùn)練。并將其輸出為可量化,、可視化的訓(xùn)練標(biāo)準(zhǔn),,讓乒乓球的專業(yè)教育門檻下沉到普通人生活當(dāng)中。
再比如,,分析決策算法的持續(xù)迭代,,有望推廣到新的運(yùn)動和行業(yè)中去,以基礎(chǔ)化的能力支撐起千行萬業(yè)的智能化需求,,成為“新基建”中不可或缺的一員,。舉個(gè)例子,當(dāng)機(jī)器人與城市智慧健康系統(tǒng)結(jié)合,,是否能夠作為市民健康的關(guān)鍵終端,,來提供行而有效、可連可控的運(yùn)動網(wǎng)絡(luò)呢,?
從這個(gè)角度延展開來,,龐伯特機(jī)器人不僅能夠輸出算法模塊,還能夠向其他行業(yè)輸出軟硬件合一的整體智能解決方案,。通過算法,、硬件、人的交互,,完成一次人機(jī)共謀的大變革,。
站在萬物智能、人機(jī)共生的起點(diǎn),,不難預(yù)見人類和機(jī)器之間密切耦合的未來,。與智能生命伙伴共舞,,是人類必然的未來。而目睹了龐伯特機(jī)器人的我們,,也正在經(jīng)歷種植AI的進(jìn)行時(shí),。
過去的數(shù)年間,讓深度學(xué)習(xí)擺脫需要大量輸入和人工的有監(jiān)督學(xué)習(xí),,一直是人類研究者努力的方向,,為此推動了許多新的技術(shù)進(jìn)展,,比如:
借助meta learning元學(xué)習(xí)算法,,機(jī)器獲得了“泛化”,能夠舉一反三,,學(xué)習(xí)協(xié)同性地處理多種任務(wù),;
借助Reinforcement Learning強(qiáng)化學(xué)習(xí),機(jī)器懂得了“決策”,,通過不斷地自我學(xué)習(xí)與回饋來抵達(dá)高級智能,。
而這些能“擬人”的機(jī)器學(xué)習(xí)方法,也讓AI獲得了前所未有的能力,,打敗柯潔李世石的DeepMind阿爾法狗,、在DOTA2中團(tuán)滅人類電競選手的OpenAI Five、自動駕駛,,乃至通用人工智能AGI,,都是通過讓機(jī)器模仿人類對世界的認(rèn)知方式,以不斷探索,、試錯(cuò),、改進(jìn)的方式,與環(huán)境進(jìn)行實(shí)時(shí)交互,,進(jìn)而提高自己的能力,。
天地有正氣,雜然賦流形,。今天,,龐伯特也試圖讓機(jī)器人“自行進(jìn)化”,啟動了一場發(fā)球機(jī)器人教對打機(jī)器人打乒乓的“先鋒實(shí)驗(yàn)”,。
通過兩臺機(jī)器人之間的相互“較量”,,讓機(jī)器人身處在一個(gè)不可預(yù)期的環(huán)境中,依靠人工智能算法平臺主動生成一些標(biāo)記和標(biāo)簽來做決策判斷,,獨(dú)立解決多個(gè)非線性的邏輯問題,,通過“行動-評價(jià)”的強(qiáng)化學(xué)習(xí)機(jī)制來改進(jìn)自身,適應(yīng)新的環(huán)境,,從而發(fā)展機(jī)器人間的校驗(yàn)標(biāo)準(zhǔn),。這會為成為機(jī)器人社會意識的起點(diǎn)嗎,?