《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 對話云知聲副總裁李霄寒:從單模態(tài)到多模態(tài),以算法起家的AI芯片公司后勁十足

對話云知聲副總裁李霄寒:從單模態(tài)到多模態(tài),,以算法起家的AI芯片公司后勁十足

2019-01-24

目前,,物聯(lián)網(wǎng)人工智能(AI)都是發(fā)展大勢。而 AI 芯片正處于從通用型向?qū)S眯桶l(fā)展和轉(zhuǎn)化的過程當(dāng)中,,特別是在物聯(lián)網(wǎng)邊緣側(cè),通用型 AI 芯片的計(jì)算效率較低,,繼而帶來了成本和功耗的失配,。此外,AI 芯片要面對很多不同場景,,很難有一款通用型產(chǎn)品能滿足不同客戶的需求,。


目前來看,有越來越多的專用型 AI 芯片或模組的案例涌現(xiàn)出來,,如智能家居,、機(jī)器人、智能音箱等,,都對專用型 AI 芯片提出了越來越多的需求,。


因此,當(dāng)今做 AI 芯片是符合市場發(fā)展需求的,在這方面,,越來越多的公司更加務(wù)實(shí),,將其作為長期的發(fā)展戰(zhàn)略,而不是抱著投機(jī)的心態(tài)去做 AI 芯片,。云知聲就是這樣一家本土企業(yè),。2018 年 5 月,該公司正式發(fā)布首款物聯(lián)網(wǎng)專用 AI 芯片之后,,不足半年的時(shí)間,,今年 1 月其再次對外宣布多模態(tài) AI 芯片的研發(fā)計(jì)劃。

微信圖片_20190124201144.jpg


物聯(lián)網(wǎng)芯片設(shè)計(jì)難在哪兒,?


隨著應(yīng)用的發(fā)展,,物聯(lián)網(wǎng)的場景化特點(diǎn)會(huì)愈加突出,此時(shí),,只提供單一芯片已經(jīng)很難滿足客戶需求,,必須要將芯片、應(yīng)用,,以及服務(wù)等有機(jī)地融合在一起,,從而提供一整套的解決方案,才能滿足實(shí)際的應(yīng)用需求,。


與此同時(shí),,在 IC 設(shè)計(jì)層面,與傳統(tǒng)模式和流程相比,,會(huì)更加復(fù)雜,,對此,云知聲聯(lián)合創(chuàng)始人/ IoT 事業(yè)部副總裁李霄寒博士表示:“在最初的設(shè)計(jì)階段,,就要考慮應(yīng)用算法,,以及到底需要多大的算力,如何使軟件能更好地運(yùn)行等因素,。這樣,,就需要 IC 設(shè)計(jì)團(tuán)隊(duì)與算法提供者有更緊密的合作。此時(shí),,軟件和硬件的耦合會(huì)非常緊密,,這會(huì)影響到開發(fā)流程。傳統(tǒng)的 IC 設(shè)計(jì)主要是根據(jù)應(yīng)用來設(shè)計(jì)相關(guān)參數(shù),,而未來物聯(lián)網(wǎng)應(yīng)用當(dāng)中的芯片,,特別是 AI 芯片,在設(shè)計(jì)階段,,就要根據(jù)實(shí)際的應(yīng)用場景,,設(shè)計(jì)出相應(yīng)的功能,然后再去合理調(diào)配軟件和硬件資源,這對設(shè)計(jì)者的綜合水平和能力提出了更高的要求,?!?/p>


在物聯(lián)網(wǎng)的邊緣側(cè),對 AI 芯片的性能,、功耗和成本提出了更好的平衡要求,。對此,李霄寒表示,,性能仍然是要優(yōu)先考量的,,也是最重要的,在此前提下,,再去追求功耗與成本的平衡,,而在邊緣側(cè),成本比功耗更加重要一些,。


那么,,對于邊緣側(cè) AI 芯片設(shè)計(jì)者來說,如何能實(shí)現(xiàn)以上這些因素的平衡呢,?李霄寒認(rèn)為:首先,,設(shè)計(jì)者的算法積累很重要,因?yàn)楹玫乃惴茏層布l(fā)揮最大的效能,;其次,,IC 設(shè)計(jì)能力自然也很重要,特別是要能與業(yè)界實(shí)現(xiàn)良好的配合,,以挖掘出更多的 IC 設(shè)計(jì)潛力,;還有一點(diǎn),也是經(jīng)常被忽略的,,那就是對場景的了解,,即經(jīng)歷過整個(gè)流程,并有產(chǎn)品的量產(chǎn),,才能對很多實(shí)際的考量因素有清晰的認(rèn)知,,也就是 KnowHow,其會(huì)指導(dǎo)你的芯片設(shè)計(jì)流程,。這一點(diǎn)非常重要,。


芯片發(fā)展路線


據(jù)悉,,云知聲于 2015 年開始量產(chǎn) IVM 模組,,其采用了市場上的通用型芯片。由于當(dāng)時(shí)市場上還沒有通用型的 AI 芯片,,所以多是以多核的 CPU 來實(shí)現(xiàn) AI 加速器的功能,。也就是在 2015 年,該公司決定自行做 AI 芯片,并開始了相關(guān)的規(guī)劃和研發(fā)工作,。


經(jīng)過兩年多的研發(fā),,2018 年5 月,云知聲發(fā)布了其 UniOne 第一代產(chǎn)品——雨燕,,這是一款單模態(tài)的語音專用的 AI 芯片,。據(jù)悉,該公司不僅提供雨燕芯片,,還提供相應(yīng)的開源解決方案,,包含芯片、引擎,、應(yīng)用,,甚至還有云端服務(wù),以及手機(jī) APP 代碼,。據(jù)李霄寒介紹,,這樣做,有利于客戶快速部署其產(chǎn)品,,省去了找第三方開發(fā)各種應(yīng)用的時(shí)間和成本,。


據(jù)悉,目前已經(jīng)有近 10 家客戶導(dǎo)入了雨燕芯片,,而且在今年上半年,,很快就能在市場上看到相應(yīng)的量產(chǎn)產(chǎn)品。

微信圖片_20190124201213.jpg


當(dāng)今的 AI 芯片領(lǐng)域,,存在著多種架構(gòu),,每家都有不同的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)產(chǎn)品,那么,,云知聲的 AI 芯片是采用怎樣的架構(gòu)和IP呢,?據(jù)悉,第一代雨燕芯片采用的是該公司自行研發(fā)的 DeepNet 1.0,,而其正在研發(fā)的新一代多模態(tài) AI 芯片則采用了升級版本—— DeepNet 2.0,。


向多模態(tài)演進(jìn)


在物聯(lián)網(wǎng)應(yīng)用初期,很多 AI 芯片都是以單模態(tài)功能切入市場的,,最為普遍的就是語音應(yīng)用,。但是,未來的應(yīng)用會(huì)是多模態(tài)融合的,,機(jī)器人就是一個(gè)典型的多模態(tài)應(yīng)用實(shí)例,,還有如車載芯片,因此,,多模態(tài)是市場發(fā)展的必然趨勢,。云知聲在原有單模態(tài)語音 AI 芯片的基礎(chǔ)上,,正在研發(fā)多模態(tài)芯片,主要針對語音和圖像的處理需求,,其相應(yīng)的產(chǎn)品就是基于 DeepNet 2.0的,。

微信圖片_20190124201231.jpg


據(jù)悉,云知聲以 DeepNet 2.0 IP 為核心的 AI 架構(gòu),,算力可以達(dá)到 4T,。DeepNet 2.0 是多模態(tài)神經(jīng)網(wǎng)絡(luò)處理器 IP,其主要特點(diǎn)是可以支持多種推理網(wǎng)絡(luò)兼容,,如 LSTM,、CNN、RNN 以及 TDNN 等,;支持可重構(gòu)計(jì)算,;還支持 Winograd 處理,將乘法計(jì)算量降至原先的一半以下,,大幅提升了計(jì)算效率,。李霄寒表示,DeepNet 2.0 是相對通用的 IP 核,,既可以滿足音頻應(yīng)用需求,,也可以實(shí)現(xiàn)對圖像的處理。


另外,,DeepNet 2.0 還支持多 NPU 的組網(wǎng),,組成模塊化的網(wǎng)絡(luò),來支持算力的需求,。


對于架構(gòu),,李霄寒表示,雖然每家的架構(gòu)都有各自的特點(diǎn)和實(shí)現(xiàn)方法,,但其上面的軟件會(huì)逐步達(dá)成統(tǒng)一,,也就是說,支持機(jī)器學(xué)習(xí)的算法會(huì)逐漸形成統(tǒng)一的框架,。未來,,有可能形成在不同 AI 芯片硬件上面,可以運(yùn)行所有神經(jīng)網(wǎng)絡(luò)的模型,,這在不久的將來是完全有可能出現(xiàn)的,。


一直以來,一提起云知聲,,業(yè)內(nèi)人士第一反應(yīng)就是:這是一家做語音方案的公司,,對此,李霄寒表示:“大家給云知聲貼的這個(gè)標(biāo)簽是片面的,,并沒有反應(yīng)出我們公司全部能力,。實(shí)際上,云知聲在圖像處理方面也有多年的技術(shù)積累,。我們在這塊很早就開始布局了,,并在 2018 年開始發(fā)力,將相應(yīng)的算法融入到了實(shí)際的產(chǎn)品當(dāng)中,?!?/p>


據(jù)悉,為了在智能語音,、圖像處理等多模態(tài)技術(shù)方面實(shí)現(xiàn)快速突破,,云知聲很早便在內(nèi)部搭建了號稱云知聲版“TensorFlow + GKE (Google Kubernetes Engine) ”的 Atlas 機(jī)器學(xué)習(xí)計(jì)算平臺(tái),基于該平臺(tái)可以實(shí)現(xiàn)各種算法的快速迭代,,而且可以靈活調(diào)整算法和算力,,極大地提升了研發(fā)效率。

微信圖片_20190124201304.jpg


在核心競爭力方面,,云知聲采用的都是自家多年積累的 IP,。對此,李霄寒表示:“我們在研發(fā),、推廣芯片產(chǎn)品的同時(shí),,逐步建立、鍛煉出了一支強(qiáng)有力的隊(duì)伍,。我們在做語音專用的 DeepNet 1.0 的時(shí)候,,市場上還沒有相關(guān)的產(chǎn)品,只有自己研發(fā),。而且,,在推向時(shí)候以后,反響不錯(cuò),,我們才實(shí)實(shí)在在地意識(shí)到這是一款很不錯(cuò)的產(chǎn)品,,非常適合我們的算法和場景。因此,,在此基礎(chǔ)上,,我們發(fā)展出了 DeepNet 2.0,與 DeepNet 1.0 相比,,DeepNet 2.0 在功能上有了極大的增強(qiáng),,特別是算力方面,達(dá)到了 4T,,另外,,DeepNet 2.0 可以支持多種 NPU,這也就意味著可以支持多模態(tài),?!?/p>

微信圖片_20190124201320.jpg


就在今年 1 月初,,云知聲正式對外宣布,其正在研發(fā)數(shù)款多模態(tài) AI 芯片,,分別是面向物聯(lián)網(wǎng)的雨燕-Lite,,這是第一代雨燕的升級版本;面向智慧城市的海豚(Dolphin),;面向智慧出行的車規(guī)級芯片雪豹(Leopard),。


發(fā)展三階段


對于云知聲的發(fā)展歷程,李霄寒做出了這樣的總結(jié):公司于 2012 年成立,,至今已有 6 年多的時(shí)間,,該公司將其發(fā)展歷史分成了 3 個(gè)階段。


李霄寒表示:“公司成立之初的兩年,,是技術(shù)優(yōu)勢構(gòu)建階段,。在該階段,云知聲主要提供軟件算法,、引擎,,服務(wù)等;從 2015 年開始,,我們進(jìn)入到了產(chǎn)品優(yōu)勢構(gòu)建階段,,也就是大家所熟知的“云端芯”的產(chǎn)品體系。從那時(shí)起,,云知聲就不是只提供算法這么簡單了,,而是開始提供應(yīng)用產(chǎn)品了,起初以軟件為主,,而且是整合了各種軟件服務(wù)的產(chǎn)品,。而智能醫(yī)療是我們的主戰(zhàn)場,可以提供一整套的軟硬件方案,。在 2015 年之前,,云知聲是不具備硬件設(shè)計(jì)能力的,為了補(bǔ)齊短板,,我們在深圳成立了一家分公司,,專門進(jìn)行硬件設(shè)計(jì)和研發(fā);做出產(chǎn)品以后,,我們進(jìn)入了規(guī)模優(yōu)勢構(gòu)建階段,,基于我們的芯片,實(shí)現(xiàn)大規(guī)模的量產(chǎn),,而且在相應(yīng)的應(yīng)用領(lǐng)域,,排名行業(yè)第一。我們一直在觀察市場和時(shí)代需求,,以建設(shè)我們相應(yīng)的能力,,進(jìn)而幫助客戶解決問題,。這也是我們于 2015 決定做芯片的主要原因,市場需求在那里,,我們就去做,。而且當(dāng)時(shí)市場上還沒有專用的 AI 芯片,為了滿足客戶對軟硬件的整體需求,,我們必須自己研發(fā) AI 芯片?!?/p>


加快腳步 只爭朝夕


未來,,不同的應(yīng)用場景和領(lǐng)域會(huì)對 AI 芯片有不同的規(guī)范和標(biāo)準(zhǔn)要求,包括功耗,、接口等方面,,都會(huì)形成相應(yīng)的標(biāo)準(zhǔn)?!拔磥?,AI 算法很可能都會(huì)有相應(yīng)的標(biāo)準(zhǔn)出臺(tái)”,李霄寒表示:“硬件和軟件之間的算法接口,,很可能在不久的將來制定標(biāo)準(zhǔn),,這樣,就可以實(shí)現(xiàn)在同一AI 芯片上運(yùn)行不同廠家的算法,,這種可能性是完全存在的,。而對于我們公司來說,要爭取走得足夠快,,爭取成為標(biāo)準(zhǔn)的實(shí)際制定者,。實(shí)際上,我們在家電領(lǐng)域已經(jīng)實(shí)現(xiàn)過類似的目標(biāo),,云知聲是第一家在白色家電領(lǐng)域?qū)崿F(xiàn)專用語音芯片落地的供應(yīng)商,,相應(yīng)的測試標(biāo)準(zhǔn)實(shí)際上是由我們制定的。我們做出測試規(guī)范之后,,客戶就用該標(biāo)準(zhǔn)去要求所有的供應(yīng)商,。未來我們依然會(huì)按照這樣的模式發(fā)展,爭取成為更多行業(yè)標(biāo)準(zhǔn)的實(shí)際制定者,?!?/p>


對于端和邊緣側(cè) AI 芯片市場,李霄寒認(rèn)為,,邊緣側(cè)的 AI 芯片市場足夠大,,而且仍然處于發(fā)展初期,遠(yuǎn)沒有到大家在一個(gè)紅海里拼殺的程度,。關(guān)鍵還是要做好供給側(cè)的事情,,市場的需求很大,,也有很多廠商在跟進(jìn),但在現(xiàn)階段,,大家的產(chǎn)品做的還都不夠好,,雖然云知聲走在了市場的前列,但依然有很大的提升空間,。


“對于云知聲來說,,要只爭朝夕呀!”李霄寒說,。



人物簡介

微信圖片_20190124201339.jpg

李霄寒博士于 1994 年考入中國科學(xué)技術(shù)大學(xué)少年班,, 2003 年獲得中科大信號與信息系統(tǒng)博士學(xué)位。他曾先后服務(wù)于聯(lián)想,、摩托羅拉中國,、 Nuance 中國、盛大語音創(chuàng)新院等國內(nèi)外知名公司,,先后擔(dān)任技術(shù)經(jīng)理,、主任工程師以及研發(fā)總監(jiān)職位。

 

他在 2001 年獲得“微軟學(xué)者”稱號,,在 2005 年參與世界第一款嵌入式非特定人中文語音識(shí)別軟件研發(fā)并將其廣泛用于摩托羅拉系列產(chǎn)品中,;隨后在 2006 年參與世界第一款嵌入式說話人識(shí)別軟件的研發(fā)。李霄寒博士在 2002 年代表微軟,,在 2010 年代表盛大參加“ NIST 國際說話人識(shí)別評測”大賽,,共獲得七個(gè)單項(xiàng)第一、兩次總分第一名的優(yōu)異成績,。

 

目前他作為云知聲聯(lián)合創(chuàng)始人及 IoT 事業(yè)部副總裁,,分管產(chǎn)品研發(fā)。李霄寒博士負(fù)責(zé)帶隊(duì)研發(fā)的業(yè)界第一款物聯(lián)網(wǎng) AI 芯片在 2018 年上半年成功流片,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。