《星際穿越》在中國大陸首映的當(dāng)天,,光年無 限創(chuàng)始人兼CEO 俞志晨攜自己的團(tuán)隊一同觀看了這部電影,。在《星際穿越》中,有諸多對“蟲洞”的描述,蟲洞是宇宙中的隧道,它能扭曲空間,讓原本相隔億 萬公里的地方近在咫尺,。熱愛物理學(xué)的俞志晨將公司第一款產(chǎn)品命名為“蟲洞語音助手”,這款產(chǎn)品支持自然語言理解的人機(jī)對話,、智能問答應(yīng)用,,可內(nèi)置于智能手 機(jī)、智能硬件等平臺.
俞志晨告訴記者,,他們在2010年就取了蟲洞語音助手這個名字,,當(dāng)時業(yè)內(nèi)知道蟲洞這個詞的人寥寥無幾。近年來,,隨著科幻電影以及電視劇的普及,,讓人們了 解了蟲洞、黑洞,、五維空間在內(nèi)的多種物理名詞,,引發(fā)了國內(nèi)的科幻熱。從某種意義上說,,科幻熱的興起反映了國人對于技術(shù)變革的期待,。國內(nèi)的大部分互聯(lián)網(wǎng)公司 只是在商業(yè)模式上取得了新的突破,而技術(shù)變革帶來的震動將會是商業(yè)變革所無法比擬的,。
俞志晨和他的團(tuán)隊正處于一場巨大技術(shù)變革的中心,。2014年,全球十大科技核心熱點是智能機(jī)器,,而智能機(jī)器終極的版本就是智能機(jī)器人,。
就像30年前比爾蓋茨預(yù)言,每家每戶都會擁有PC一樣,,智能機(jī)器人也將在十年之內(nèi)走進(jìn)每一個家庭,。與此同時,對于智能機(jī)器人核心——“大腦”的爭奪也進(jìn)入了白熱化階段,。特別是產(chǎn)品出現(xiàn)的前夕,,標(biāo)準(zhǔn)的爭奪更為激烈。在這場戰(zhàn)役中,,我們欣喜的看到以小i機(jī)器人為代表的國內(nèi)公司與谷歌、蘋果、雅虎這些國際互聯(lián)網(wǎng)大佬站到了同一起跑線上,。
虛擬機(jī)器人的啟蒙運(yùn)動
其實,,上世紀(jì)90年代,國外很多實驗室里面就已經(jīng)出現(xiàn)可以跟人互動聊天的機(jī)器人,。2011年底,,隨著蘋果手機(jī)上Siri語音機(jī)器人的發(fā)布,聊天機(jī)器人概 念真正爆發(fā),,瞬間激活了全球智能機(jī)器人產(chǎn)業(yè),。自此,智能機(jī)器人進(jìn)入快速發(fā)展階段,,谷歌相繼收購了十家機(jī)器人公司,,覆蓋運(yùn)動、家庭服務(wù),、虛擬大腦等眾多領(lǐng) 域,,同時蘋果、微軟也都在全世界范圍內(nèi)大力發(fā)展相關(guān)業(yè)務(wù),。
機(jī)器人大致可分為兩大類,,第一類是工業(yè)機(jī)器人,像機(jī)械手,、機(jī)械臂這樣的形態(tài)在 加工工廠里很普遍,,上汽集團(tuán)里很多汽車制造都是由機(jī)器人完成的。未來,,全球人工成本將會不斷上漲,,通過機(jī)器人去替代人工從而降低成本。工廠中的產(chǎn)品大多為 流水化作業(yè),,機(jī)器人操作起來難度并不大,。另一類是服務(wù)類機(jī)器人,又叫家用機(jī)器人,。家用機(jī)器人又分為兩類,,一類為實體機(jī)器人,一類為虛擬機(jī)器人,。
現(xiàn)階段,,我們還把虛擬機(jī)器人和實體機(jī)器人割裂開,但未來二者一定會合二為一,。虛擬機(jī)器人可以看做是實體機(jī)器人的前奏,,而虛擬機(jī)器人最終會移植到實體機(jī)器人之中,或者是其他智能硬件,。
雖然大眾還沒有享受實體機(jī)器人的帶來的好處,,但是虛擬機(jī)器人已經(jīng)無處不在,。手機(jī)用戶給運(yùn)營商發(fā)送查詢短信就能得到相應(yīng)的自動回復(fù),通過銀行的微信服務(wù)號及時查詢信用卡額度,、積分,,這些便利服務(wù)的背后就是虛擬機(jī)器人,更確切的說是小i機(jī)器人,。
國內(nèi)很多企業(yè)都有自己的呼叫中心,,這些呼叫中心普遍面臨人工成本居高不下、用戶問題重復(fù)率高的問題,。以招商銀行為例,,平均每天有60萬通交互,如果用人工來處理,,最少需要兩三千人,,有了i小機(jī)器人后,現(xiàn)在只用了12個人,,95%的問題都是由機(jī)器人回答,。
企業(yè)營銷和服務(wù)的需求越來越強(qiáng)烈,今年11月,,光年無限推出“圖靈機(jī)器人”,,將自己的后臺開放給開發(fā)者,可以很好地與微博,、微信,、App、智能硬件相結(jié)合結(jié)合,。
上海智臻網(wǎng)絡(luò)公司董事長袁輝告訴記者,,“在虛擬機(jī)器人這個領(lǐng)域,就像教育小孩子一樣,,需要不斷去學(xué)習(xí),,機(jī)器人也是。從小孩誕生,,一年級,、二年級,積累不同行業(yè)的知識庫才能成長的,。”虛擬機(jī)器人的研發(fā)需要極大的耐心和恒心,,需要持久的關(guān)注和投入。
從軟到硬的發(fā)展路徑
隨著大數(shù)據(jù),、云計算,、4G、智能硬件等相關(guān)技術(shù)的不斷成熟,,袁輝認(rèn)為是時候重新啟動他的夢想了,。袁輝告訴記者,,“我們的名字就是小i機(jī)器人,公司創(chuàng)立之 初就是想做實體機(jī)器人,,只不過是當(dāng)時的硬件不具備條件而已,。我當(dāng)年創(chuàng)立的夢想和今天沒有區(qū)別,,就是讓機(jī)器人改變?nèi)说纳?,每個人都擁有自己機(jī)器人。”
近兩三年來,,智能硬件風(fēng)靡全球,,能夠支撐實體機(jī)器人的條件越來越成熟。“以前,,機(jī)器人的身體不夠強(qiáng)壯,,現(xiàn)在足夠強(qiáng)壯了,這樣我們就可以把大腦移植過來,。以前大腦都是在互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)中使用,,現(xiàn)在可以用實體機(jī)器人作為載體。”袁輝在2011年就萌生了這樣的想法,。
當(dāng)然,,從軟到硬的發(fā)展路徑并不僅僅局限于智能實體機(jī)器人,智能電視,、智能汽車,、智能家居也是虛擬機(jī)器人大展宏圖的機(jī)會。袁輝向記者介紹道,,LG,、聯(lián)想等 智能電視中,都搭載了小i機(jī)器人的系統(tǒng),,用戶完全可以跟遙控器進(jìn)行語音對話,,發(fā)出類似“我想看鋼鐵俠!”式的指令,智能電視便能提供相應(yīng)的服務(wù),。
與小i機(jī)器人不同,,蟲洞語音助手最初的定位就是把手機(jī)變成智能化機(jī)器人。俞志晨認(rèn)為,,手機(jī)除了跟機(jī)器人形狀不一樣,,本質(zhì)并無太大區(qū)別。未來,,各種硬件不過就是功能硬件而已,。
人工智能有三層次,分別是感知層,、認(rèn)知層,、控制操作層,。感知層類似人的眼睛、耳朵,、皮膚等,,不斷去感知信息,并將其轉(zhuǎn)換成機(jī)器可以理解的語言,。隨后,,將 感知到的信息反饋到認(rèn)知層,認(rèn)知層就像人的大腦一樣,,做出相應(yīng)的判斷,。最后,由控制操作層完成操作,,例如講話或者拿東西等,。
未來,硬件終端只需要存在感知層和控制操作層,,認(rèn)知層將會移步云端,。也就是說,智能機(jī)器人的硬件只做兩件事兒,,一個是感知外部信息,,另一個是完成這件事情,比如發(fā)出聲音或者移動幾步,。這時候,,手機(jī)、智能硬件,、智能玩具只需要聯(lián)網(wǎng)即可,。
多點開花的時代
當(dāng)硬件的成本越來越低,鏈條越來越成熟,,產(chǎn)業(yè)化程度越來越高,,未來機(jī)器人的硬件生產(chǎn)一定不是門檻。門檻體更多體現(xiàn)在軟件服務(wù),,“如果說一個20歲的小伙 子長得很帥,,但你問他幾個問題他回答的像個智障。你還會喜歡他嗎?即便你硬件做的特別好,,軟件很差,,還是失敗的。”袁輝如是說,。
IBM的Watson,、谷歌大腦Nao、小i機(jī)器人,、圖靈機(jī)器人都在人工智能的認(rèn)知層上做文章,。語音只是認(rèn)知層的一部分,,俞志晨將它比做耳朵,
“它只是一個引擎,,把這種信號轉(zhuǎn)化成機(jī)器可以理解的語言,。但是他真正去認(rèn)知、思考,、決策,,跟語音沒太大關(guān)系。”
很多時候,,語音并不不是一個好的交互方式,。在嘈雜的環(huán)境下,無論用戶怎樣喊叫都無濟(jì)于事,,這個時候用戶能夠擺擺手或是搖搖頭,智能機(jī)器人就可以領(lǐng)會用戶傳達(dá)了“不”的意思,。
未來,,像圖像、語音,、體感交互等技術(shù)將會在認(rèn)知層,、控制操作層上融合,用戶和智能機(jī)器人之間將會有多種交互方式,。
LeapMotion CEO Michael Buckwald告訴記者,,“對于機(jī)器人來說我們要良好控制好機(jī)器人,全世界都是把這種控制作為一個研 究,,我們?nèi)绾螠?zhǔn)確控制機(jī)器人來抓東西,,甚至如何控制機(jī)器人在太空修理機(jī)器。”LeapMotion工作原理很簡單,,即通過兩個攝像頭捕捉手跟手指的動作,。 手掌上面總共有14節(jié)指骨,5節(jié)掌骨總共27個骨頭,,演算28個追蹤點,,追蹤更精細(xì),可以辨別左手跟右手,。在新的算法了,,還能夠區(qū)別抓取跟捏取,開發(fā)者更 容易去發(fā)展他們所要,、想要的功能,。
今年8月,在LeapMotion入華的發(fā)布會上,,兩位來自北京市第35中學(xué)的高中生向大家展示了,, 如何借助LeapMotion,,優(yōu)雅操作地機(jī)器人。在演示過程中,,通過電腦程序和機(jī)器人連接,,就可以用手來控制復(fù)雜的機(jī)器臂。比如說讓機(jī)器人遞一杯水,,人 們在現(xiàn)實中的第一反應(yīng)是伸手去抓,,隨即機(jī)器臂就會去抓,而不是不是去刻意控制拿水,、遞水的每個角度,。
語音識別、圖像識別,、體感交互都是人工智能一部分,,現(xiàn)在還沒有一家公司能把每一領(lǐng)域都做好。人工智能發(fā)展的第一步是各點開花,,第二步是融合,,第三步才是智能化。顯然,,現(xiàn)在還處于各點開花的階段,,未來幾年會慢慢融合。
融合帶來的好處將是成本的降低,。智能機(jī)器人定價居高不下,,一款看似很普通的機(jī)器人動輒10萬塊,購買者往往都是極客,,普通消費(fèi)者并不會購買,。俞志晨告訴 記者,“硬件機(jī)器人很貴就是因為他們在同時做感知,、認(rèn)知,、控制操作這三件事。如果是分離的話,,認(rèn)知層去云端,,硬件成本會降低,如果真的跟手機(jī)一樣便宜,,智 能機(jī)器人才會走進(jìn)每個家庭,,這個事兒才合理。”
在很多科幻電影中,,機(jī)器人能夠為主人做所有的事情,,現(xiàn)實生活中顯然是不現(xiàn)實的,或者說實 現(xiàn)的路徑比較長。未來,,智能機(jī)器人的服務(wù)會走向場景化,,把每個場景都做到極致,再談融合,。在眾多場景中,,用戶黏性最高的有三類,分別是4—10歲的小 孩,,50歲以上的老人,,車載用戶。其中,,智能玩具,、老年人陪護(hù)機(jī)器人都已經(jīng)在國外一一實現(xiàn)。
2006年,,袁輝去講機(jī)器人,,臺下大家就說 你講的太好了,能不能把機(jī)器人牽出來我看看,。當(dāng)時大家都停留在工業(yè),、物理這個認(rèn)識層面,對虛擬大腦就沒有認(rèn)識,。熬過了十幾年,外部環(huán)境終于具備了,,小i機(jī) 器人還活著,,并擁有了先發(fā)的優(yōu)勢,這是讓袁輝最慶幸的事,。他向記者許諾,,不久后就能在市面上買到和還海外公司合作的實體機(jī)器人,并且是普通消費(fèi)者能夠承擔(dān) 的費(fèi)用,。