《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > 業(yè)界動(dòng)態(tài) > ADI:智能語(yǔ)音大有前途,,深度學(xué)習(xí)/機(jī)器學(xué)習(xí)需先行

ADI:智能語(yǔ)音大有前途,,深度學(xué)習(xí)/機(jī)器學(xué)習(xí)需先行

2017-09-06
關(guān)鍵詞: ADI 智能語(yǔ)音

“語(yǔ)音作為交流的方式,,如今首先被應(yīng)用于各種消費(fèi)設(shè)備上作為發(fā)現(xiàn)信息,、分享交流的方式、控制環(huán)境的手段,。在不久的將來(lái),,人機(jī)對(duì)話(huà)必將會(huì)應(yīng)用于各領(lǐng)域,,它將成為智能系統(tǒng)的‘耳朵’去聽(tīng)人說(shuō)了什么,,提供‘大腦’去想人需要或想干什么,,提供‘嘴巴’去回應(yīng)人的需求或操作其他系統(tǒng),。我們現(xiàn)有的客戶(hù)已遍布智能家居、安全城市,、安全家居,、安防、文化娛樂(lè)等領(lǐng)域,?!?a class="innerlink" href="http://forexkbc.com/tags/ADI" title="ADI" target="_blank">ADI消費(fèi)產(chǎn)品事業(yè)部市場(chǎng)經(jīng)理Lie Dou如是說(shuō)。

59aeb150e0117.png

ADI消費(fèi)產(chǎn)品事業(yè)部市場(chǎng)經(jīng)理Lie Dou

智能語(yǔ)音四面開(kāi)花,,仍需技術(shù)先行

當(dāng)下,,智能音箱火熱;未來(lái),,我們將坐在沙發(fā)上用聲音遙控電視,、空調(diào)、燈具等,。智能語(yǔ)音在各個(gè)領(lǐng)域的滲透與背后的技術(shù)密切相關(guān),。

ADI消費(fèi)產(chǎn)品事業(yè)部語(yǔ)音用戶(hù)界面主管Brian Donnelly表示:“智能語(yǔ)音有兩種方案,,一種是智能語(yǔ)音算法在系統(tǒng)處理器里面編譯執(zhí)行,;另一種是智能語(yǔ)音算法在專(zhuān)門(mén)研制的DSP里編譯執(zhí)行?;谥悄苷Z(yǔ)音DSP的方案具有待機(jī)功耗低,,搭配AP不受限制、選擇性廣,, 可有效分擔(dān)處理器運(yùn)算量等優(yōu)點(diǎn),。ADI的基于智能語(yǔ)音DSP的 “Sublime Voice“遠(yuǎn)場(chǎng)智能語(yǔ)音識(shí)別解決方案已經(jīng)量產(chǎn)。由于在硬件中嵌入了機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法,,因此可以高效而準(zhǔn)確地捕獲語(yǔ)音命令,。該解決方案已被國(guó)內(nèi)外的客戶(hù)設(shè)計(jì)和應(yīng)用于機(jī)頂盒、條形音箱和電視,、智能機(jī)器人,,智能音箱、住家和辦公樓自動(dòng)控制,、家用白電等產(chǎn)品中,。

59aeb09865e3c (1).JPG

ADI消費(fèi)產(chǎn)品事業(yè)部語(yǔ)音用戶(hù)界面主管Brian Donnelly

語(yǔ)音市場(chǎng)火熱的當(dāng)下,值得思考的是,,語(yǔ)音交互與識(shí)別在落地的過(guò)程中暴露出一些局限性,。局限背后有哪些原因呢?又要如何改進(jìn)呢,?

Brian Donnelly提及智能語(yǔ)音的兩個(gè)衡量維度是有效率與準(zhǔn)確率,,有效性是指正確捕捉到“喚醒詞”,,準(zhǔn)確性是指正確理解和識(shí)別語(yǔ)音和命令的意思。而且背后的最大的挑戰(zhàn)來(lái)源于在遠(yuǎn)場(chǎng)(5-10米)與背景噪音強(qiáng)的應(yīng)用場(chǎng)景,,當(dāng)然,,還存功耗的問(wèn)題。這需要高品質(zhì)和有效的算法包括對(duì)信號(hào)聲源的捕捉(DOA)和對(duì)環(huán)境噪音的去除,。ADI在已有產(chǎn)品與下一代產(chǎn)品中都利用機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法加強(qiáng)對(duì)語(yǔ)音識(shí)別算法的加速,。所以ADI 的Sublime Voice方案可以使用較少DSP資源進(jìn)行復(fù)雜的計(jì)算。某些場(chǎng)景下,,計(jì)算效率可高達(dá)90%,。ADI可在降低系統(tǒng)的功耗的情況下,提高了語(yǔ)音交互識(shí)別反應(yīng)速度,,提高系統(tǒng)計(jì)算大樣本的能力,,提高了語(yǔ)音識(shí)別的準(zhǔn)確率。

ADI的Sublime Voice 參考設(shè)計(jì)方案基于4個(gè)拾音采樣麥克風(fēng)可有效地捕捉來(lái)自360度方向上的語(yǔ)音指令,。它在技術(shù)指標(biāo)上完全達(dá)到了7個(gè)麥克風(fēng)產(chǎn)品的水平的同時(shí)又使得產(chǎn)品的設(shè)計(jì)容易達(dá)到小型化和拾音麥克風(fēng)布局的多樣化,。

Lie Dou向與非網(wǎng)記者表達(dá)了智能語(yǔ)音技術(shù)的愿景:我們堅(jiān)信,智能語(yǔ)音在未來(lái)將大展宏圖,。它是最自然的人類(lèi)彼此進(jìn)行交流互動(dòng)的方式,,也應(yīng)為我們和我們周?chē)碾娮釉O(shè)備系統(tǒng)交流最自然的方式。我們努力的目標(biāo)是以更低的功耗實(shí)現(xiàn)更強(qiáng),、更優(yōu)化的硬件計(jì)算能力,,以配合智能化的軟件做更多和更大樣本的計(jì)算。這樣可以使智能語(yǔ)音被更快,、更廣的推廣到遠(yuǎn)場(chǎng)低信噪比的應(yīng)用場(chǎng)景中去,。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話(huà):010-82306118;郵箱:[email protected],。