阿里的人工智能“航空母艦”終于下水,。
造一艘真正的航母有多難呢,?
全世界擁有航母的國家只有10個,擁有完整航母制造技術(shù)的國家只有中國與美國,。
相當于將一個機場,、3000人的小城鎮(zhèn),、軍火庫、核反應(yīng)堆集結(jié)到一艘船上,,能打,,能扛,跑得快,,不易壞,。
1993年,俄羅斯總理訪問黑海造船廠,,詢問完成“瓦良格”號需要什么條件,。
廠長馬卡羅夫回答:蘇聯(lián)、黨中央,、國家計劃委員會,、軍事工業(yè)委員會和九個國防工業(yè)部、600個相關(guān)專業(yè),、8000家配套廠家,。
“總之需要一個偉大的國家才能完成,。”
造一艘人工智能的航空母艦更難,。
對應(yīng)用場景,、對算力、對數(shù)據(jù)和算法的強依賴,,讓人工智能產(chǎn)業(yè)也必須以航母的形態(tài)進行競爭,,這是超級大公司之間,超級大國之間的競爭,。
最后一塊零件
伴隨含光800芯片的出世,,阿里巴巴人工智能航空母艦最后一塊零件入列,不僅首次亮相,,更是火力全開,。
9月25日,云棲大會主論壇,,做工作報告的阿里云總裁張建鋒,,說著說著掏出了一塊芯片,這是阿里第一顆自研芯片“含光800”,。
張建鋒
張建鋒(行癲)說,,“它比目前業(yè)內(nèi)最好的AI芯片性能高4倍,包括前幾天兄弟公司發(fā)布的芯片”,。他沒指明“前幾天發(fā)布芯片的兄弟公司”是誰,,不過,場下會心一笑,。
行癲得意是自然,。平頭哥發(fā)布自研AI芯片,意味著阿里打通了人工智能全鏈路,。
航母動力不足,,無法為戰(zhàn)斗機起降提供足夠的甲板風。自研芯片,,等于攻克航母動力技術(shù),。
在主論壇外的人工智能芯片專場,身形瘦削的焦陽坐在第一排中央,,他是平頭哥研究員,、含光800芯片負責人,作為東道主的他與相繼到場的分享嘉賓握手寒暄,。他們大多是芯片界的老人了。
現(xiàn)場連站的空間都沒有,。一個晚到的觀眾從一側(cè)門口擠進去,,不過,,似乎無論他站在哪個位置,都會擋住后方觀眾視野,,最終,,他從這一側(cè)門口,騰挪到長條形會議室另一側(cè)門口,。
含光800用7個月完成了前端設(shè)計,,之后僅3個月就成功流片?;貞浧鹦酒O(shè)計研發(fā)的過程,,焦陽說了5次“Crazy”。
去年才成立平頭哥的阿里,,一定程度上落后于友商,。為了消除業(yè)界顧慮,阿里一定要在一兩個點上做到No.1,,不做Me too或者New Follower,,才能在下一波浪潮中崛起。
問題來了,,要做什么芯片,?
谷歌、Facebook,、蘋果等互聯(lián)網(wǎng)公司紛紛自研芯片,,并非偶然。人工智能對算力需求已經(jīng)超過了摩爾定律,?;ヂ?lián)網(wǎng)公司要走到下一個階段,必須要有自己的硬件技術(shù),,才能把自己的算法跟硬件做垂直的軟硬一體化設(shè)計,,達到極致的性能。
“含光800芯片預(yù)計2019年年底可以完成主要業(yè)務(wù)方適配,、驗證的過程,。”焦陽對鋅財經(jīng)說,,雖然取得了一些成績,,但要達到英偉達的水平還有一段很長的路要走。
隨著含光800的發(fā)布,,平頭哥端云一體全棧芯片產(chǎn)品家族雛形已現(xiàn),,打通了芯片設(shè)計鏈路的全覆蓋,涵蓋終端處理器IP玄鐵系列,,一站式芯片設(shè)計平臺無劍SoC,,以及云端AI芯片含光800,。
“先在云端做大芯片、技術(shù)上占領(lǐng)制高點,,如果在云上做成了之后,,客戶對于公司在PC、手機等端上也會充滿信心,?!苯龟栍媱澚巳挥谛亍?/p>
昨天上午,,在云棲大會“飛天智能”論壇上,,阿里云第一次亮出了全體AI核心負責人陣容。
“最大人工智能公司”,“阿里AI全景圖”,“阿里AI平臺重磅發(fā)布”......輿論一片狂歡,。
相比鋪天蓋地的解讀,,阿里人自己卻稍顯遲鈍。
AI集體亮相
這張圖最右邊的鄢志杰告訴鋅財經(jīng),,自己也是今天看到外面?zhèn)鱽淼膱D,,才真正意識到“我們已經(jīng)集齊了‘龍珠’”。
偶然與必然
內(nèi)部的遲鈍是正常反應(yīng),。畢竟,,與造實體航母不同的是,阿里人工智能最初并沒有清晰的設(shè)計圖,。
就連行癲,,也只能概括為“需求牽引、技術(shù)驅(qū)動”,。
但要說阿里航母成于偶然,,又必然不正確。
五年以前,,馬云在iDST內(nèi)部提出,,他們是坐在金山上啃饅頭,金山就是阿里巴巴擁有的豐富數(shù)據(jù),?!叭绻麛?shù)據(jù)的價值不能被挖掘出來,那不過就是普通的土壤”,。
如果要給阿里人工智能確定個起點,,這句話再合適不過了,坐擁金山是家底,,挖掘價值是驅(qū)動力,。
阿里龐大體系內(nèi)生需求,驅(qū)動了人工智能技術(shù)的應(yīng)用。比如,,鄢志杰最早做的“淘寶客服質(zhì)檢”,,司羅最早做的“聚劃算智能推薦算法”。
眾多巨頭,,唯獨內(nèi)部需求催生了阿里AI航母,這里一定有其他特別的因素,。
鄢志杰
2017年12月,,當時被稱為“黑科技”的阿里云語音售票機在上海地鐵落地。簡單來說,,售票機的視覺模組能看到到你靠近,,嘴唇開合,識別到你在講話,,機器便將麥克風陣列聚焦到目標說話人,,很大程度上隔絕了旁邊的噪聲。
這種多模態(tài)組合已經(jīng)存在多年,,為何由阿里語音實驗室再次提起并應(yīng)用,?
“因為我們語音與視覺的小伙伴坐在同一間辦公室”,鄢志杰告訴鋅財經(jīng),,這項運行了快兩年的黑科技,,實際來自于內(nèi)部“無用的研究”。
“我們想看看語音加上視覺有什么奇妙的效應(yīng),,于是用上阿里內(nèi)部人臉識別,、定位、測距等“開箱即用”的能力,,展示給隔壁的視覺實驗室同學(xué)看,,那哥們看了以后覺得很有意思,于是,,我們提出‘希望可以識別到嘴唇開合”,,他用他的專業(yè)吭哧吭哧馬上做出來了?!?/p>
后來,,團隊把機器與地鐵關(guān)聯(lián),搖身一變,,成一個在噪聲環(huán)境下,,可以賣票的機子。
“大家分別有了百分之七八十的東西,,然后一起完成剩下一二十,,這是蠻關(guān)鍵的。如果大家都是0%的話,,估計也沒法合作起來,?!?/p>
世界杯期間,阿里直播團隊能在比賽結(jié)束后幾分鐘內(nèi)做出集錦視頻,,得益于語音團隊開發(fā)的特殊語音識別能力,,視覺團隊只需要找到哨聲、歡呼聲的節(jié)點,,并切片,。
又比如,7月底才面世的玄鐵,,已經(jīng)和內(nèi)部不同部門合作發(fā)布了語音芯片等專用芯片,。
這一切起源于“我們在一間辦公室”。
在阿里這個龐大的培養(yǎng)基里,,這種偶然又必然的化合反應(yīng),,時刻都在發(fā)生。
8月30日晚,,某款換臉軟件瞬間刷屏朋友圈,。上線幾個小時之內(nèi),流量如山洪暴發(fā),,服務(wù)器瀕臨峰值極限,。
事實上,在這款A(yù)PP上線前,,阿里云就已經(jīng)收到了需求,,被定了一批服務(wù)器。沒想到上線前幾個小時,,流量就已超過了預(yù)期峰值,,越來越多的人上傳照片,排隊時間越來越長,。
龍欣
阿里云異構(gòu)計算產(chǎn)品研發(fā)負責人龍欣帶領(lǐng)的十幾個工程師趕到客戶在北京的辦公室,,直到凌晨2點,穩(wěn)定性和峰值基本滿足了客戶要求,。龍欣當時很篤定,,覺得問題已經(jīng)解決。
6點40分,,僅過了4個半小時,,龍欣又被電話叫醒,“新的峰值現(xiàn)在的資源沒法扛了,,必須要做混合的資源支持和調(diào)度”,。他們又回到了辦公室。
用戶抱怨,媒體施壓……龍欣的團隊更慌,。
客戶使用的主力GPU是阿里云主售實例gn6v (使用Tesla V100 GPU),,阿里云工程師在彈性擴容多地域gn6v實例的同時,還需要快速擴容輕量級的推理GPU實例gn6i(NVIDIA Tesla T4)以幫助客戶進一步降低成本,。這帶來的最大挑戰(zhàn)是要保證客戶適配阿里云兩款主售產(chǎn)品不會出現(xiàn)兼容性挑戰(zhàn),,不會產(chǎn)生服務(wù)不穩(wěn)定。
頂著巨大的壓力,,在很短時間內(nèi)龍欣團隊最后確定了技術(shù)方案,。
9點多,阿里云方案設(shè)計并完成驗證,。
龍欣自信地告訴鋅財經(jīng),阿里云是業(yè)界第一個把人工智能算法和GPU的算力大規(guī)模應(yīng)用到to C的現(xiàn)象級APP上的云服務(wù)商,。
這是厚積薄發(fā)的結(jié)果,。在熟悉客戶業(yè)務(wù)環(huán)境和軟件的基礎(chǔ)上,阿里云從最基本的異構(gòu)計算IaaS層服務(wù)的穩(wěn)定和彈性,,到開源框架的支持,,再到深入客戶業(yè)務(wù)環(huán)節(jié)工程化的支持,在這三個不同的環(huán)節(jié)做點對點的定向服務(wù),,進行優(yōu)化和細致,,才能支持這款現(xiàn)象級軟件刷爆網(wǎng)絡(luò)。
出走象牙塔
1918年,,第一艘航母“百眼巨人 號誕生之初,,就被評價為“世界海上力量發(fā)生了從制海到制空、制海相結(jié)合的一次革命性變化 ”,。
曾經(jīng)信仰“Talk is cheap, show me the code”的阿里科學(xué)家們,,在攻下算法山頭后,把目光聚焦到新世界:AI實戰(zhàn),。
這意味著他們要離開實驗室的象牙塔,,到生產(chǎn)環(huán)境中接受考驗。海況復(fù)雜,,甚至有些境遇讓人啼笑皆非,。
在阿里新六脈神劍中,使命是“讓天下沒有難做的生意”,,價值觀是“客戶第一”,。理解這兩個簡單的陳述句,對這幫智商超過130的AI科學(xué)家們而言,,其實并不容易,。
負責語言技術(shù)的司羅在加入阿里前是普渡大學(xué)計算機系的終身教授,他告訴鋅財經(jīng):“在學(xué)校,能帶十幾個研究生,,有四臺服務(wù)器,,這已經(jīng)算是非常好的配置了,但在阿里,,內(nèi)部有五千臺服務(wù)器,,甚至有幾百張GPU的網(wǎng)卡?!?/p>
司羅
可調(diào)配的資源越多,,面對的環(huán)境也更復(fù)雜。在實驗室里,,用來檢驗?zāi)P唾|(zhì)量的數(shù)據(jù)都是干凈的結(jié)構(gòu)化數(shù)據(jù),,而在許多阿里的場景中,面對的則是“方言,、省略,、簡要、重復(fù)”等各種日??谡Z化數(shù)據(jù),。
有一回,一個項目負責人說了句:“我們領(lǐng)導(dǎo)是一句笑話,,但我們要認真對待”,。這是司羅工作的日常:“人都能理解這句話的語義,可是機器不能”,。
“以前在學(xué)校里,,工作的成績和成就感是論文、標準數(shù)據(jù)集上的提升,,但是在阿里,,成就干是看到你的算法能力在實際場景中得到了巨大的提升?!?/p>
數(shù)據(jù)的復(fù)雜只是業(yè)務(wù)上的挑戰(zhàn),,更多時候的是觀念轉(zhuǎn)變的挑戰(zhàn)。
“來到阿里之后,,我們這些搞技術(shù)的‘被迫’嗅到了前線的味道:算法只是冰山一角,,如果要在產(chǎn)業(yè)中產(chǎn)生價值,還有很多功課要做”,,鄢志杰把進入阿里前的環(huán)境比作象牙塔,,那時候只需要衡量論文、算法的先進性,。
“你們搞科學(xué)技術(shù)的,,跟‘讓天下沒有難做的生意’有什么關(guān)系”,,這個問題在鄢志杰加入阿里后時常被問起。
而他現(xiàn)在悟到了“人工智能,,最終還是要為客戶產(chǎn)生價值,,他在生意里取得成功,讓他的生意好做,,因為給他創(chuàng)造價值,,他愿意分一點錢給我們?!?/p>
批量贈送屠龍刀
給鄢志杰啟發(fā)的是,,有一家深圳的叫“硅基智能”的公司,他們悄無聲息地用阿里云語音識別能力,,加上移動的來電轉(zhuǎn)移,,開發(fā)了一款接聽電話人工智能助手“硅秘”。
這讓鄢志杰十分驚喜,,“完全不知道有這么一款產(chǎn)品在研發(fā),,客戶開發(fā)完上線了才知道”。
這是讓他有了“真的有點像云計算”那種感覺,。
“我們只要把這些能力放到云上去,很多magical(神奇的)事情會自然的發(fā)生,。這種結(jié)合中,,我們只需要做好自己那部分事情就好了,這些民間的高手,,他懂行業(yè),,自然會有很多的想法出來?!?/p>
大多數(shù)時候,,鄢志杰團隊的成果以插件式的很小的模組,嵌入客戶的產(chǎn)品中,,希望用2B的方式,,降低整個行業(yè)的門檻。
“我們把原來少數(shù)人才擁有的屠龍刀,,放給了很多人,,讓他們用這把刀到自己的行業(yè)去拼殺。這幫人現(xiàn)在剛剛沖出去,,我希望他們能夠快點成功,。”
AI航母也一樣,,從它誕生開始,,就扛起了為客戶服務(wù)的重任,,這個誕生于阿里巴巴的龐然大物,正在攪動中國產(chǎn)業(yè)的數(shù)字化,,成為數(shù)字經(jīng)濟的一把屠龍刀,。
“客戶在前陣殺敵,我們在營區(qū)打磨屠龍刀”,,這是阿里云的常態(tài),。
阿里云高性能計算負責人何萬青常常接到客戶的“抱怨”:別的團隊都是七八個人來我公司,你們每次就那么兩個人,。
何萬青
說到這句話時,,何萬青笑了,是欣慰的笑,。
云棲社區(qū)有一個故事,,2008年,何萬青當時還在某家硬件廠商,,因為給Ali Search進行性能優(yōu)化,,為阿里省下來買200臺服務(wù)器的需求,這對設(shè)備廠商而言可不是好事,。
“硬件公司想辦法讓客戶買更好的,、更貴的,而在阿里云,,這種成就感在于把超算變成云產(chǎn)品,,這個產(chǎn)品是所有人可以受益的”。上汽集團乘用車采用SCC集群進行混合仿真,,整體提升25%效率,;安世亞太基于SCC集群為客戶提供HPC解決方案,總體成本下降20%以上,;大連化物所國家重點實驗室使用E-HPC集群做分子動力學(xué)仿真計算,,相對上一代GPU集群效率提升200% 。
更多時候,,阿里的AI航母行駛在肉眼看不到的地方“磨刀”,。
駛?cè)肷钏畢^(qū)
能落地的人工智能,才是好的人工智能,,才是有價值的人工智能,。
在落地這件事情上,阿里試水的航母已經(jīng)進入未知的海域,。
客戶認為“我們說的語言,,阿里云的人聽不懂”。
外包團隊抱怨“客戶提的需求太奇怪了”,。
互聯(lián)網(wǎng)與工業(yè)天然存在語言隔閡,,在很長一段時間里,,負責落地正泰新能源項目的達摩院視覺計算算法專家魏溪含兩頭為難,心里委屈,。
2017年10月,,當阿里的商務(wù)快要放棄與正泰新能源的合作時,兩方突然碰撞出火花:用視覺識別給太陽能電池片瑕疵做檢測,。
魏溪含與她的團隊為這一瞬間的“荷爾蒙”,,懵懂地趟入深水區(qū)。畢竟,,這玩意沒人做過,,客戶只在德國見過相關(guān)檢測設(shè)備,但效果不佳,,還得輔助人工,。
2018年初,魏溪含和同事交付了項目結(jié)果,,便安心回家過年,。
事情沒那么簡單。
魏溪含和同事交付的方案中,,瑕疵是用方框框起來的,。但客戶不僅想知道瑕疵在哪,還想知道它長什么樣,。這意味著,,他們要把瑕疵的輪廓分類描繪出來。
正泰新能源1和正泰新能源2
30多種瑕疵,,兩萬多張圖片,。
于是發(fā)生了開頭那一幕,,客戶認為“我們說的語言,,阿里云的人聽不懂”,標注數(shù)據(jù)外包團隊抱怨“客戶提的需求太奇怪了”,。
魏溪含也不理解,,但還是得做。
于是她帶著領(lǐng)外包團隊,,下工廠,,學(xué)瑕疵,標輪廓,。
這太難了,,標注項目結(jié)束的時候,30多人的標注團隊,,人走了近一半,,還有生病倒下的,。
另一方面,魏溪含與算法的同事不斷打磨算法模型,,優(yōu)化算法速度,,她自嘲“我們是在煉丹”。
算法模型上線后,,精度達到97%,,這比人工檢測的上限還高。但是,,一下產(chǎn)線測試,,精度腰斬到50%。
魏溪含心里咯噔了一下,,“當時真是抱著必死的決心”,。
實際工況遠比測試環(huán)境復(fù)雜,攝像,、燈光,、產(chǎn)業(yè)更換、原材料等都是干擾因素,。
“大不了這個項目就做砸了,,但是我想知道在哪做砸的?!?/p>
故事的結(jié)尾是,,項目達成,精度長期穩(wěn)定在97%以上,,質(zhì)檢速度比人快5倍,,提升一倍到兩倍,實現(xiàn)全量檢測(原來只能抽檢10%),,電池片出廠的良品率從95%到99%,。
9月25日,阿里發(fā)布了工業(yè)質(zhì)檢云平臺,,第三方廠商可以收集,、標注數(shù)據(jù),訓(xùn)練模型,,部署服務(wù),,快速實現(xiàn)不同行業(yè)的質(zhì)量檢測。
從項目到平臺,,這是阿里云落地的一貫打法,。
曾震宇說,過去五年,,AI支撐起阿里巴巴,,今后五年AI將支撐起各行各業(yè),,城市大腦、工業(yè)大腦這是阿里在產(chǎn)業(yè)AI里面的實踐,。
在阿里云和蕭山國際機場的合作中,,城市大腦能夠把一架航班從降落、滑行,、??坷葮蚋鱾€保障節(jié)點,再到退出,、離開的整個過程,,做精確還原。這樣可以提高機場的工作效率和安全性,,提高航班準點率,,為乘客節(jié)約時間。
工業(yè)大腦能夠幫助工業(yè)企業(yè)把工業(yè)的全生產(chǎn)鏈條數(shù)據(jù)打通,,構(gòu)建工業(yè)的數(shù)據(jù)中臺,,并通過AI幫企業(yè)實現(xiàn)從單點智能到局部智能再到全局智能的提升。
以垃圾焚燒為例,,工業(yè)大腦能夠把熟練工人的經(jīng)驗和數(shù)據(jù)相結(jié)合,,構(gòu)建模型,以AI輔助人工的方式去操作鍋爐,,使鍋爐的燃燒穩(wěn)定性可以提高23%,。另外,以往工人平均每4個小時要操作30次,,在工業(yè)大腦的輔助下,,現(xiàn)在只需要操作6次,大幅度降低了工人的勞動強度,。
產(chǎn)業(yè)AI正在幫助各行各業(yè)進行智能化的轉(zhuǎn)型,,是數(shù)字經(jīng)濟的新動能。數(shù)字經(jīng)濟是阿里AI航母行駛的前方,,是真正的無人區(qū),。
作為龐大經(jīng)濟體中的技術(shù)中臺,,阿里AI航母在阿里巴巴的業(yè)務(wù)里經(jīng)受了很多鍛煉,,完成了下水前的演練。
張建鋒說,,“比如人工智能,。如果沒有產(chǎn)業(yè)實踐,沒有業(yè)務(wù)嘗試,,要去做一個高質(zhì)量的云,,變成數(shù)字經(jīng)濟體的基礎(chǔ),,是不太可能的?!?/p>
這相當于再造一個人類大腦,,它不僅能計算與感知,還要能認知甚至創(chuàng)造,。從人工智能的三個層次:算力,、算法、數(shù)據(jù),,無論從哪方面單點突破,,都不可能點亮人工智能產(chǎn)業(yè)海域的全貌,因為我們始終在岸邊作戰(zhàn),。
阿里在做的事情,,是將算力、算法,、數(shù)據(jù)集結(jié)成航空母艦,,將我們在人工智能產(chǎn)業(yè)海域的活動能力從近海推向中海。
縱觀當前的全球科技大廠,,同時擁有算力,、算法、數(shù)據(jù)能力的企業(yè)寥寥無幾,。有算法的,,缺少數(shù)據(jù);有數(shù)據(jù)的,,還在研制芯片,。
即便下一巨頭,緊跟著阿里之后點亮了三大技能,,他們將面臨沒有實戰(zhàn)經(jīng)驗,,缺少造系統(tǒng)能力的困境。
套用馬卡羅夫廠長的一句話,,“總之,,需要一個偉大的企業(yè)才能完成”。