《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > AI語音芯片火熱的背后邏輯是什么

AI語音芯片火熱的背后邏輯是什么

2018-07-21
關(guān)鍵詞: 造芯 AI 智能音箱 亞馬遜

如果要概括近兩年的AI創(chuàng)企現(xiàn)狀,融資和造芯是繞不開的話題,。而芯片這個詞,,極有可能會入選2018年年度關(guān)鍵詞。

從去年開始起來的熱度,,在中興事件的催化下,,快速發(fā)生更強烈的化學(xué)反應(yīng)。這其中,,最耐人尋味的便是AI語音芯片的快速崛起:

1532046699290045015.jpg

5月到7月,,短短兩個月的時間,從公開報道的資料可以看到有超過5家公司對外宣布做了AI語音芯片:

那么,,為什么大家會不約而同的在當下這個時間節(jié)點發(fā)布AI語音芯片,,這背后的邏輯到底是什么呢?

導(dǎo)火索:智能音箱市場的小爆發(fā)

1532046699457074912.jpg

今年的618促銷活動,,天貓精靈玩了一把價格營銷戰(zhàn),,只需要99元就能購買一臺智能音箱。很快,,在7月5日,,天貓精靈就宣布一年時間內(nèi),他們的全渠道銷量累計超過500萬臺,。

這種巨頭壓低價格走量的行為,,很快引起了連鎖反應(yīng),關(guān)于智能音箱風(fēng)口的討論甚囂塵上,,由亞馬遜帶起的這陣風(fēng)終于刮到了國內(nèi),。

根據(jù)Strategy Analytics 最新發(fā)布的研究報告顯示,2018年第一季度,,全球智能音箱的總銷量達到920萬,,同比增長278%。

“當設(shè)備的量剛起來的時候,,大家突然意識到芯片是很重要的一個環(huán)節(jié),,將它的必要性放到一個更高的位置。”作為最早開始布局AI語音芯片的云知聲,,其創(chuàng)始人黃偉談到最近的芯片熱如是說道,。

這一輪智能音箱市場的爆發(fā),讓不少人看到潛在的AI語音芯片市場機會,。

據(jù)今年3月外媒Information的報道,,亞馬遜正在設(shè)計定制用于支持智能音箱Echo的AI芯片,當時消息稱亞馬遜已經(jīng)擁有449名有芯片專業(yè)知識,、技能的員工,。

無獨有偶,剛剛被阿里收購的中天微,,也在7月初表示要發(fā)布智能語音芯片,。

巨頭潛在的動作是最重要的市場風(fēng)向標之一,這個導(dǎo)火索也順其自然地燃到了AI語音芯片上,,探尋其背后的邏輯,,也在于AI語音芯片較之于傳統(tǒng)通用芯片的優(yōu)勢。

其實最早的通用芯片在語音方面發(fā)揮的功效并不大,,通常情況下就是將多媒體數(shù)字編碼器+數(shù)字信號模塊處理相結(jié)合,。

在2014年年底的時候,亞馬遜的Echo問世,,有些半導(dǎo)體廠商瞄準了這塊市場,,開始推出語音芯片,其中最典型的莫過于聯(lián)發(fā)科,。據(jù)了解,,當時有人推測2016年智能音箱市場將近80%的芯片都是MTK提供的,而這又得益于他們和亞馬遜Echo的深度合作,。

當智能硬件對語音交互的要求越來越高的時候,,很多東西需要在端上實現(xiàn),比如喚醒,、數(shù)據(jù)信號處理,。同時考慮安全、網(wǎng)絡(luò)情況等因素,,AI語音芯片出現(xiàn)是必然結(jié)果,。

相比較語音芯片,AI語音芯片集成度高,、功耗低,、成本低,能夠?qū)崿F(xiàn)算法和終端的完美結(jié)合,。

Rokid聯(lián)合創(chuàng)始人王舜德在回答當初為什么會做AI語音芯片的時候,,就提到“因為我們知道做產(chǎn)品的痛苦,了解芯片的價錢會帶動整個產(chǎn)品,而當時的芯片非常耗電,,集成度低,。經(jīng)歷過這些痛點,我們就想優(yōu)化芯片的設(shè)計,,用上我們前端的算法,。”

算法—芯片—硬件:商業(yè)化落地的必然

仔細梳理一下現(xiàn)在幾大主流AI創(chuàng)企做AI語音芯片的思路,,大多數(shù)還是選擇和有經(jīng)驗的芯片公司深度合作,。

比如出門問問和Rokid就宣布自己的芯片是基于杭州國芯科技芯片深度定制,其中Rokid的KAMINO18基于40nm工藝的國芯GX8010制造,,GX8010是國芯去年發(fā)布的主打AI交互的NPU芯片,,該芯片專為物聯(lián)網(wǎng)應(yīng)用設(shè)計,具備低功耗,、可離線、可移動的優(yōu)勢,。思必馳在宣布打造芯片的時候,,也提到他們會和某芯片巨頭在AI芯片方面達成合作,成立合資公司,。

芯片公司提供低功耗,、集成度低的設(shè)計架構(gòu),AI語音技術(shù)公司則會在麥克風(fēng)陣列信號處理,、語音交互SDK以及語音降噪,、喚醒、識別理解上做功夫,,將自有的AI語音交互技術(shù)集成到其中,。

為什么算法技術(shù)落地,要從芯片以后后續(xù)的硬件開始,,個中緣由離不開我國的軟硬件環(huán)境,。

華為的輪值CEO徐直軍在2018年軟博會上曾提到:“國內(nèi)客戶尤其不接受軟件收費,導(dǎo)致國內(nèi)軟件產(chǎn)品型企業(yè)無法形成商業(yè)模式,?!?/p>

大家接受的軟件銷售模式就是類似于硬件的模式,國內(nèi)就認為硬件很值錢,,軟件不值錢,,認為它的成本低。

所以在國內(nèi)如果要實現(xiàn)業(yè)務(wù)和商業(yè)快速增長,,規(guī)?;谋l(fā),只做算法、軟件是非常困難的,。最新的技術(shù),、方案,包括產(chǎn)品通過硬件載體的方式更有可能實現(xiàn)規(guī)?;脑鲩L和復(fù)制,。

所以,AI公司的算法集成到芯片公司的語音芯片中,,可以說是一個省力又討好的合作,,而AI語音芯片伴隨著各種智能硬件熱度上升也是水到渠成的事情。

另外,,刨除這些技術(shù)因素,,講好芯片的故事,也有助于AI企業(yè)獲得融資,,有更多的資本施展自己的實力,。尤其是當下的時間節(jié)點:做芯片既是技術(shù)實力的表現(xiàn),也是民族情懷的象征體,。

在這樣一個天時地利人和的背景下,,AI語音芯片走向崛起爆發(fā)期,實屬意料之中,。

當然,,也不排除還有一些跟風(fēng)者想在浮躁的市場里作個“網(wǎng)紅”,蹭一波AI語音芯片的熱度,,不過做芯片不是做肥皂,,規(guī)模化的產(chǎn)業(yè)考驗的不僅僅是技術(shù)實力,,還有商業(yè)落地能力以及風(fēng)險承擔能力,。

虛火還是實熱?

智能音箱的蝴蝶效應(yīng)以及芯片熱度等表征原因之外,,從需求和產(chǎn)業(yè)去洞悉這次AI語音芯片熱的話,,還得從更廣闊的應(yīng)用場景以及商業(yè)落地說起。

清華大學(xué)微電子所所長魏少軍在接受媒體采訪時曾表示,,AI的殺手級應(yīng)用還沒出現(xiàn),,不管是智能音箱還是其他產(chǎn)品,都還沒有成為一個剛需,。因此,,只有使語音真正成為人機交互的主流,才能推動AI語音芯片的爆發(fā),。

所以盡管AI芯片熱度高,,但隨之而來的理性聲音會問到語音技術(shù)的真實需求市場到底在哪里,?

以智能音箱為例,在沒有形成家居物聯(lián)網(wǎng)前,,很多人認為其更像是一個擺設(shè)性的雞肋硬件,。在當下技術(shù)還未達到理想情況下,可以說消費端市場對于語音交互和識別等的剛需仍然有待挖掘,。

為此我們整理了幾大AI語音技術(shù)公司的產(chǎn)品和方案:\

1532046699648076674.jpg

回頭看國外的科技巨頭,,也是遵循著相似的路徑在發(fā)展,他們通過投資或者收購的手段,,做硬件,,開放應(yīng)用平臺。

1532046699760092657.jpg

從上述表格中可以看出,,目前,,無論是像思必馳、云知聲,、出門問問,、Rokid這樣的AI創(chuàng)企,還是谷歌,、亞馬遜,、蘋果這樣的巨頭,他們在應(yīng)用場景的落地上有諸多交叉,,大多偏向以物聯(lián)網(wǎng)為中心,圍繞智能家居,、車載,、機器人展開布局。而智能家庭,、物聯(lián)網(wǎng)的主戰(zhàn)場之外,,像智慧醫(yī)療、也是這些AI企業(yè)正在拓展的新邊疆,。

同時,,根據(jù)易觀的報告來看,智能語音市場整體處于高速發(fā)展期,,基于語音交互的智能車載,,智能家居,智能可穿戴等垂直領(lǐng)域都將日趨成熟,。

在這些場景中,,人工智能語音技術(shù)雖然算不上非常核心和必不可少的技術(shù),但是沿襲消費升級和技術(shù)迭代的發(fā)展軌跡,,AI語音芯片背后所承載的語音識別,、交互技術(shù)絕對是大勢所趨,。

基于這樣的發(fā)展路徑規(guī)劃以及龐大的消費市場的預(yù)測,AI語音芯片的火熱也是理所當然,。

就像一個人的身體是由多個器官組成的,,在很多智能應(yīng)用場景,AI語音芯片扮演的角色更多的是算法技術(shù)的顯性體現(xiàn),,芯片作為“硬件”去配合自家的軟件解決方案,,最終去完成生態(tài)的閉環(huán)。

披荊斬棘的關(guān)鍵:技術(shù)+數(shù)據(jù)

做AI語音芯片是個投入巨大的工程,,Rokid聯(lián)合創(chuàng)始人王舜德表示,,“芯片最重要的一個點就是量,芯片關(guān)鍵的利潤就是上五百萬以上,?!?/p>

那么企業(yè)如果想要擁有自造血能力,目前面對的最大瓶頸又是什么,?”

王舜德提出了兩點:數(shù)據(jù)和交互,。其中,交互指的是“現(xiàn)在語音技術(shù)連一般小白用戶的行業(yè)理想都沒達到 ”,,這也意味著語音技術(shù)還處在非常早期的階段,。

1532046699908076729.png

而以數(shù)據(jù)為例,AI公司的競爭力表現(xiàn)之一就是數(shù)據(jù),,如何在行業(yè)內(nèi)實現(xiàn)深度回流,,是AI語音技術(shù)公司需要解決的問題。因為只有實現(xiàn)深度數(shù)據(jù)回流之后,,在行業(yè)內(nèi)做算法才會更加精準,,產(chǎn)品競爭力更強。

但是整個人工智能里除了核心算法和算力外,,場景和數(shù)據(jù)也非常重要:技術(shù),、方案、產(chǎn)品在核心應(yīng)用場景上要能夠推廣出去,,最終給公司帶來切切實實營收,。

確實,除一體化的解決方案之外,,與場景的深度融合才是未來真正的考驗,。安創(chuàng)空間聯(lián)合創(chuàng)始人楊宇欣表示,“AI公司如果只做芯片,,沒有算法和場景的話立馬就會遇到生態(tài)系統(tǒng)的問題?,F(xiàn)在有了算法和芯片,關(guān)鍵的問題是如何深入場景打造優(yōu)秀的語音交互體驗,?!?/p>

技術(shù)之外,,思必馳的高始興也強調(diào)了產(chǎn)業(yè)落地的重要性,“技術(shù)和產(chǎn)業(yè)要形成一個循環(huán),,而且要把握好窗口期,,機會過了就沒有了?!?/p>

在AI賦能傳統(tǒng)行業(yè)的窗口期,,一旦一家足夠強大的AI公司切入到某個行業(yè),它就能依靠數(shù)據(jù)和積累的行業(yè)經(jīng)驗,,建立起自己的壁壘,。

這也是互聯(lián)網(wǎng)大數(shù)據(jù)時代下,AI企業(yè)的競爭力所在:技術(shù)+數(shù)據(jù),。

走出舒適區(qū),,面對真實的市場

“開始很多團隊希望做自己最擅長的事情,最擅長的能做的比較好,,團隊也比較舒服,,你從算法往芯片或者硬件走,你就得突破自己,,走出自己的舒適區(qū),,這個可能是需要對自我的一個挑戰(zhàn)的?!?/p>

比如AI芯片僅僅強化深度學(xué)習(xí)能力是不夠的,,傳感器接入,信號處理,,檢測識別,,以及軟件層面的決策和反饋等,各個環(huán)節(jié)需要的算法和計算特性也是不一樣的,。

從算法到芯片、硬件,,對于很多初創(chuàng)企業(yè)來說,,可以算得上是一個大的跨越,這也是為什么一部分AI公司會選擇和芯片公司深度合作,。因為要逃離舒適區(qū),,就得投入更多的精力,趟過更多的坑,。

再就是市場的現(xiàn)狀,,不可否認天貓精靈賣得很好,但是背后是阿里龐大的資金在做支撐,,但無疑這種狀態(tài)不會持久,,當這個生態(tài)去掉大頭后,,很多硬件的成本都得面對真實成本,回到一個正常的階段,。

所以在AI語音芯片落地上,,大家更多的還會將眼光瞄準整個物聯(lián)網(wǎng)領(lǐng)域,云知聲黃偉在采訪中就提到,,“今天看起來智能音箱起來的量比較多,,其實它是巨頭在拼命的補貼,但那不是真正的市場行為,?!?/p>

他提到云知聲做的其他智能語音場景雖不像智能音箱那樣,但縱向?qū)Ρ鹊囊廊挥写蠓鹊脑鲩L,。

確實,,如果把智能音箱百萬、千萬的量級放在智能語音市場,,只是滄海一粟,。在思必馳的高始興來看,智能音箱的量還不能算“爆品”,,“我們中國乃至全球的人口,,每個人每個家庭里都有幾個智能硬件,在加上一些行業(yè)應(yīng)用場景,,最終物聯(lián)網(wǎng)智能硬件的終端會遠遠超過智能手機,。”

結(jié)語:

在和多位AI語音技術(shù)初創(chuàng)公司采訪的時候,,大家不約而同會提到,,自己并不是PPT造芯,有的表態(tài)已經(jīng)和合作企業(yè)達成流片,;有的表態(tài)芯片已經(jīng)開始規(guī)?;瘧?yīng)用……在這條賽道上,業(yè)內(nèi)人達成了共識:市場剛剛開始,,遠遠沒到競爭的時候,,其實需要越來越多的公司一塊把市場做大,到那個時候再去細分賽道,。

AI語音芯片的熱戰(zhàn)才剛剛開始,,對于這些AI語音技術(shù)公司來說,道阻且長,,行則將至,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]