繼北京站之后,,4 月 18 日,,云知聲開放日(Open Day)第 2 場來到深圳,。本次云知聲開放日聚焦 AI 技術(shù),、應(yīng)用和產(chǎn)業(yè),,云知聲董事長/CTO 梁家恩博士與多位云知聲技術(shù)專家向深圳的合作伙伴、行業(yè)人士全面的秀出了全棧 AI 硬核技術(shù),,并與騰訊杰出科學(xué)家/騰訊 AI Lab 副主任俞棟,、攜住科技聯(lián)合創(chuàng)始人葉明、同行者科技聯(lián)合創(chuàng)始人葉維,、金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博,、三諾聲智聯(lián)副總經(jīng)理喬嶠等多位嘉賓,,剖析了 AI 技術(shù)在酒店、車載,、教育等領(lǐng)域的應(yīng)用及落地,。
全棧:技術(shù)能力全棧,產(chǎn)業(yè)服務(wù)全棧
梁家恩博士作為人工智能行業(yè)的資深從業(yè)者,,在現(xiàn)場與我們復(fù)盤了發(fā)展歷程,,他表示,在 AI 大潮退去之后,,技術(shù)的產(chǎn)業(yè)化能力成為了決勝的關(guān)鍵,。技術(shù)如果不能解決產(chǎn)業(yè)問題,那么技術(shù)將化為企業(yè)“炫技”的產(chǎn)物,?;诖耍杭叶鞑┦繉⒃浦暤?AI 哲學(xué)概括為“全?!焙汀坝埠恕?。
云知聲董事長/CTO 梁家恩博士
“全棧”包含了全棧 AI 技術(shù)能力和全棧 AI 落地能力兩個維度,。經(jīng)過多年的發(fā)展,,目前,云知聲的 AI 能力已經(jīng)超了單一的語音技術(shù),,覆蓋了 Atlas 機器學(xué)習(xí)超算平臺,信號,、語音,、圖像、文本的感知和表達能力,,知識,、理解、分析,、決策等認(rèn)知技術(shù),,并朝著多模態(tài)人工智能系統(tǒng)方向發(fā)展。同時,,云知聲通過將能力封裝在自研 AI 芯片之上,,打磨了“云端芯”一體化產(chǎn)品體系,推動 AI 技術(shù)在家居,、車載,、兒童、教育,、醫(yī)療,、金融、零售等多個領(lǐng)域?qū)崿F(xiàn)落地,實現(xiàn)了從 AI 技術(shù)到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán),。
硬核:確實,、有效地解決產(chǎn)業(yè)規(guī)模化痛點
“硬核”,,指技術(shù)方案能夠確實,、有效地解決產(chǎn)業(yè)規(guī)模化痛點,,為終端用戶提供相對成熟的用戶體驗,。
以當(dāng)時最熱門的智能語音為例,經(jīng)歷了兩年的市場教育,,現(xiàn)如今,,語音交互技術(shù)被廣泛應(yīng)用到各大場景中,成為了 AI 技術(shù)落地最典型的應(yīng)用案例,。然而,,在實際使用中,AI 需要面對的情況比實驗室中要復(fù)雜得多,,一旦產(chǎn)品軟硬件的某一環(huán)處理不好,,便容易出現(xiàn)“聽不到、聽不懂,、答非所問”等問題,。針對這類行業(yè)痛點,在本次云知聲開放日深圳站現(xiàn)場,,云知聲的技術(shù)團隊從語音交互技術(shù)的拾音,、識別和交互等維度,深度剖析了技術(shù)難點和解決方案,。
在 AIoT 場景下,,設(shè)備首先要解決的便是遠場拾音問題。云知聲 AI Labs 技術(shù)專家關(guān)海欣表示,,解決遠程語音識別的關(guān)鍵在前端信號處理階段,,解決回聲、混響和噪音 3 大核心問題,,以確保設(shè)備可以準(zhǔn)確識別到用戶指令,。目前,云知聲在回聲消除,、混響抑制,、噪聲處理等方向均已有成熟的技術(shù)方案,相關(guān)技術(shù)指標(biāo)均達行業(yè)一流水準(zhǔn),。另外,,未來遠程語音識別還將呈現(xiàn) DSP+DL 結(jié)合,、分布式拾音兩大趨勢,對此,,云知聲也已經(jīng)展開了相應(yīng)的技術(shù)部署,。
云知聲 AI Labs 技術(shù)專家關(guān)海欣
在語音識別階段,則需要在聲學(xué)和語言層面,,賦予機器感知并語音指令的能力,。云知聲 AI Labs 技術(shù)專家李軼杰表示,聲學(xué)方面,,云知聲基于大數(shù)據(jù),、前沿聲學(xué)建模、自適應(yīng)學(xué)習(xí)搭建了聲學(xué)模型,;在語言層面,,云知聲創(chuàng)建了一個數(shù)據(jù)規(guī)模大、融合能力強,、靈活和個性化的語言模型,,以上模型在還將基于超算平臺不斷優(yōu)化迭代。此外,,云知聲還將其語音識別能力延展到語音評測,、聲紋識別、情緒識別等多個方向,。
云知聲 AI Labs 技術(shù)專家李軼杰
在對話階段,,圍繞更加自然的人機交互,云知聲打造了流式交互,、語用計算與知性會話 3 大硬核能力,。云知聲 AI Labs 技術(shù)專家單波介紹到,流式交互最大的特點是在多輪對話免喚醒,,大大的提升了人機對話過程中的流暢程度;語用計算則是將人機對話內(nèi)容放置到對應(yīng)的語境中,,讓設(shè)備準(zhǔn)確的理解人的意圖,;最后,知性會話則是通過將知識圖譜應(yīng)用到人機對話過程中,,讓設(shè)備準(zhǔn)確的響應(yīng)用戶的問題,。
云知聲 AI Labs 技術(shù)專家單波
基于上述技術(shù),2013 年,,云知聲面向合作伙伴開放對話技能開放平臺(語義云),,幫助合作伙伴打造更加自然的人機交互體驗,同時在實踐中不斷提升語義解析能力,。目前這一平臺已經(jīng)支持 200 多個的對話內(nèi)容,,覆蓋通訊,、休閑娛樂、醫(yī)療健康,、交通出行,、設(shè)備控制等多個場景,語義解析準(zhǔn)確率高達 93%,。
值得一提的是,,語音感知與表達、語言與知識計算只是云知聲硬核 AI 技術(shù)的冰山一角,,目前,,云知聲硬核技術(shù)還包含了 AIoT 芯片、超算平臺與圖像,、翻譯拓展等,。
落地:覆蓋酒店、汽車,、兒童,、音箱等場景
在大數(shù)據(jù)、深度學(xué)習(xí),、超算平臺的加持下,,人工智能底層技術(shù)將沖破閥值,帶來成熟的體驗,,在技術(shù)和需求的雙重推動下,,人工智能將邁入發(fā)展的黃金階段,并掀起新一輪的 AIoT 產(chǎn)業(yè)變革,。在下午的「智能+」分論壇中,,云知聲副總裁康恒、云知聲 AIOS 架構(gòu)師郭洪光,、與攜住科技,、同行者科技、金鷹卡通,、三諾聲智聯(lián)等多位合作伙伴,,結(jié)合實際案例,深入探討了 AI 技術(shù)的在酒店,、汽車,、兒童和音箱等場景中的應(yīng)用。
云知聲副總裁康恒表示,,在整個產(chǎn)業(yè)鏈中,,AI 技術(shù)是個“基礎(chǔ)設(shè)施”,且這一基礎(chǔ)設(shè)置不可能在不加以定制的情況下適用全部場景,。AI 在落地過程中,,需要充分考慮使用場景和落地行業(yè),。基于對場景和產(chǎn)業(yè)的深度思考,,2014 年,,云知聲便開始結(jié)合產(chǎn)業(yè)鏈,將云知聲的 AI 技術(shù)賦能到個行業(yè)中去,。
云知聲副總裁康恒
面向行業(yè),,云知聲推出了一站式人工智能平臺 UniOS。云知聲 AIOS 架構(gòu)師郭洪光表示,,與同類產(chǎn)品相比,,UniOS 具備開放、垂直兩大特性,,其中,,開放指的是云知聲面向行業(yè)和合作伙伴開放技能平臺和設(shè)備平臺,并在此基礎(chǔ)上兼容第三方 AIOS,;垂直則代表 UniOS 會針對特定的行業(yè)需求輸出解決方案,,以此來幫助產(chǎn)業(yè)轉(zhuǎn)型。
云知聲 AIOS 架構(gòu)師郭洪光
攜住科技聯(lián)合創(chuàng)始人葉明跟我們介紹了 AI 技術(shù)在酒店場景中的應(yīng)用案例,。葉明表示,,針對酒店場景,攜住科技基于 AIoT 技術(shù),,通過多種設(shè)備聯(lián)動,、場景定制,為酒店客戶帶來全新智能互聯(lián)的場景體驗,;另一方面,,通過信息整合和大數(shù)據(jù)分析,AI 還將提高酒店管理效率,。
攜住科技聯(lián)合創(chuàng)始人葉明
同行者科技聯(lián)合創(chuàng)始人葉維分享了 AI 語音技術(shù)如何助力汽車產(chǎn)業(yè)升級,。葉維表示,在車載場景下,,語音即為服務(wù)——語音是用戶與設(shè)備,、與互聯(lián)網(wǎng)連接的主要手段,承載了車聯(lián)網(wǎng)資源整合與用戶觸達的功能,。因此,,車載場景下的 AI 必須聚合豐富的內(nèi)容和服務(wù),,并根據(jù)場景進行智能匹配,,打造千人千面的智能化體驗。
同行者科技聯(lián)合創(chuàng)始人葉維
金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博分享了金鷹卡通對兒童產(chǎn)品智能化的思考,。戴文博指出,,兒童和家長對智能產(chǎn)品的需求與普通場景十分不同,,基于此,金鷹卡通圍繞兒童場景的特征,,將 AI 技術(shù)與“麥咭”的形象做了深度整合,,打造麥咭智能親子智能產(chǎn)品生態(tài)。
金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博
三諾聲智聯(lián)副總經(jīng)理喬嶠從產(chǎn)品角度出發(fā),,與我們分享了人工智能產(chǎn)品設(shè)計思考,。喬嶠指出,人工智能時代的設(shè)計方向是感知設(shè)計,,產(chǎn)品只有將形狀,、外觀、聽覺,、觸感等諸多因素綜合成一個完整的信息,,充分調(diào)動人類的本能,才有可能設(shè)計出更普遍更通用的產(chǎn)品,。
三諾聲智聯(lián)副總經(jīng)理喬嶠
以帶屏音箱為例,,屏幕為人機交互補充重要的視覺信息,更加接近用戶本能,,“未來 5 年,,單帶屏的智能音箱就會達到 3 億多臺,超過 PC 的規(guī)模,?!?/p>
關(guān)于云知聲 Open Day
OpenDay 是云知聲一年一度的對外進行技術(shù)分享與交流的活動,是云知聲面向人工智能硬核科技,,與合作伙伴,、相關(guān)學(xué)術(shù)和產(chǎn)業(yè)研究機構(gòu)等共話人工智能前沿技術(shù)與產(chǎn)業(yè)應(yīng)用并探討合作的平臺。2019 首屆云知聲 OpenDay 設(shè)北京,、深圳,、上海、廈門四站,。繼北京,、深圳站之后,上海站活動將于5月上旬正式開啟,。
關(guān)于云知聲
云知聲成立于 2012 年,,是一家專注于物聯(lián)網(wǎng)人工智能,擁有自主知識產(chǎn)權(quán)的智能語音人工智能企業(yè),。是中國人工智能行業(yè)成長最快,、商業(yè)化落地最好人工智能企業(yè)之一。云知聲業(yè)務(wù)主要覆蓋智慧生活和智慧服務(wù)兩大場景,,在包括家居,、車載,、醫(yī)療、教育,、政府,、機器人等領(lǐng)域擁有廣泛布局??蛻艉w格力,、美的、長虹,、海爾,、華帝、北京協(xié)和醫(yī)院,、吉利,、平安集團、京東,、360等,。
2018 年 5 月份,云知聲正式推出第一代 UniOne 物聯(lián)網(wǎng) AI 芯片及其解決方案——雨燕(Swift),。該芯片由云知聲自主設(shè)計研發(fā),,采用云知聲自主 AI 指令集,性能較通用方案提升超過 50 倍,?;谠撔酒臉?biāo)準(zhǔn)化解決方案,可幫助傳統(tǒng)硬件產(chǎn)品在更短的時間周期內(nèi),,以更少的成本快速實現(xiàn) AI 化,,實現(xiàn)人機交互智能。