人工智能這一概念,,早在1956年達(dá)特茅斯會(huì)議上便已首次提出,。經(jīng)歷60余年,從感知智能走向認(rèn)知智能,,人工智能迅猛發(fā)展,賦能千行百業(yè),。 11月18日,, 2022科大訊飛全球1024開發(fā)者節(jié)盛大開幕,引領(lǐng)人工智能生態(tài)向新而行,。大會(huì)現(xiàn)場(chǎng),,科大訊飛消費(fèi)者事業(yè)群總裁于繼棟發(fā)表《人機(jī)協(xié)同 數(shù)字新生》主題演講,分享訊飛開發(fā)者生態(tài)進(jìn)展,,展望人機(jī)協(xié)同新未來(lái),。
科大訊飛消費(fèi)者事業(yè)群總裁 于繼棟
韌性增長(zhǎng) 訊飛生態(tài)蓬勃發(fā)展
面對(duì)紛繁復(fù)雜的全球經(jīng)濟(jì)環(huán)境,各行各業(yè)充斥著不確定性,,如何應(yīng)對(duì)這一變局,,尋求下一步發(fā)展的動(dòng)力來(lái)源? 人工智能產(chǎn)業(yè)的蓬勃生命力,、訊飛開放平臺(tái)的穩(wěn)健增長(zhǎng),,讓我們看見人工智能的巨大潛能,相信中國(guó)科技廣闊的未來(lái),。 自2017年以來(lái),,訊飛開放平臺(tái)開發(fā)者數(shù)與AI服務(wù)年度調(diào)用總量,呈現(xiàn)持續(xù)穩(wěn)步上升趨勢(shì),。2022年,,開發(fā)者數(shù)達(dá)到370萬(wàn),AI服務(wù)在線調(diào)用年增長(zhǎng)率達(dá)到36%,。
快速增長(zhǎng)的背后,,是AI已經(jīng)高度融入人們的日常生活和工作,于繼棟在現(xiàn)場(chǎng)分享到,。 在社交場(chǎng)景,,近一年輸入法語(yǔ)音調(diào)用量同比增長(zhǎng)45%,已超過(guò)平臺(tái)AI調(diào)用增速,。其中,,Z世代群體對(duì)語(yǔ)音輸入更為偏愛,女性使用語(yǔ)音的比例是男性的1.4倍,。語(yǔ)音輸入已成為日常交流中人機(jī)交互的重要方式,。
在家庭場(chǎng)景,電視助手語(yǔ)音調(diào)用量過(guò)去3年間,,增長(zhǎng)了515%,。在用戶分析中看到,全年齡段用戶都已形成語(yǔ)音交互的習(xí)慣,,其中低于14歲的少年兒童群體和高于60歲的中老年群體比成年用戶更偏愛語(yǔ)音交互,。
在出行場(chǎng)景,,車載語(yǔ)音調(diào)用量獲得到了翻番的增長(zhǎng)。在過(guò)去一年全國(guó)出口的200萬(wàn)輛汽車中,,預(yù)制訊飛多語(yǔ)種語(yǔ)音交互系統(tǒng)的車輛已超71%,。合作車企在科大訊飛的助力下,已將13個(gè)語(yǔ)種推廣到全球20個(gè)國(guó)家,。
在學(xué)習(xí)場(chǎng)景,,過(guò)去一年教育相關(guān)的AI調(diào)用呈現(xiàn)出902%的增長(zhǎng)。在雙減政策的推動(dòng)下,,AI幫助學(xué)生減負(fù),。訊飛及生態(tài)伙伴推出學(xué)習(xí)機(jī)、翻譯筆,、口算寶,、早教機(jī)等一系列智能硬件有效陪伴了少年兒童的學(xué)習(xí)成長(zhǎng)。
在辦公場(chǎng)景,,AI辦公硬件服務(wù)調(diào)用持續(xù)快速增長(zhǎng),。以辦公本、會(huì)議耳機(jī),、翻譯機(jī)為代表的辦公硬件,,為用戶省時(shí)增效。在錄音筆的應(yīng)用中,,平均每天為每個(gè)用戶節(jié)省1.32小時(shí),。AI在辦公領(lǐng)域的廣泛應(yīng)用,已為工作效率的提升發(fā)揮巨大作用,。
在閱讀場(chǎng)景,,一些大型新聞?lì)悺㈤喿x類APP的應(yīng)用,,讓語(yǔ)音合成服務(wù)的調(diào)用量有了明顯增長(zhǎng),。在AI的加持下,用聲音陪伴的閱讀體驗(yàn),,正在改變用戶的閱讀習(xí)慣,提升閱讀粘性,。
眾多AI服務(wù)調(diào)用量的增長(zhǎng),,讓我們看到AI應(yīng)用的價(jià)值在不斷深入?;诖?,訊飛將更多的AI能力開放給開發(fā)者,讓AI持續(xù)傳遞,。
全新訊飛開放平臺(tái)
全方面賦能人機(jī)協(xié)同場(chǎng)景
隨著社交,、家庭、出行、學(xué)習(xí),、辦公,、閱讀等越來(lái)越多AI場(chǎng)景的廣泛應(yīng)用,人工智能在人機(jī)交互階段已經(jīng)走進(jìn)千行百業(yè),,并持續(xù)發(fā)光發(fā)熱,。當(dāng)下,人工智能與生活結(jié)合更好的時(shí)代就是人機(jī)協(xié)同的時(shí)代,。 如何進(jìn)入人機(jī)協(xié)同時(shí)代,?于繼棟分享了對(duì)物理世界、數(shù)字世界,、元宇宙三大場(chǎng)景人機(jī)協(xié)同應(yīng)用的思考,。在物理世界,實(shí)體機(jī)器人可以拓展人的能力邊界,;在數(shù)字世界,,數(shù)字工作助手,將助力工作提效,;在元宇宙,,虛擬人成為人的交互載體。
實(shí)體機(jī)器人從室內(nèi)到戶外,,幫助人們從事工業(yè)焊接,、果實(shí)采摘、高空作業(yè)等高精度,、高強(qiáng)度,、高風(fēng)險(xiǎn)的工作。虛擬數(shù)字人打破實(shí)體的限制,,在媒體,、金融、辦公等領(lǐng)域廣泛應(yīng)用,,打造數(shù)字生產(chǎn)力,。 為滿足人機(jī)交互的時(shí)代需求,訊飛開放平臺(tái)進(jìn)行了全新升級(jí),。在感知智能,、認(rèn)知智能、運(yùn)動(dòng)智能強(qiáng)大的技術(shù)底座之上,,圍繞能力云,、交互云、模型云,、資產(chǎn)平臺(tái),、超自動(dòng)化,、機(jī)器人超腦,以API,、低代碼,、軟硬件一體和解決方案的方式,面向?qū)嶓w機(jī)器人和數(shù)字機(jī)器人建設(shè)N種場(chǎng)景化機(jī)器人,。
全新的訊飛開放平臺(tái),,通過(guò)原有組件升級(jí)、新組件發(fā)布,,為開發(fā)者提供更優(yōu)秀的服務(wù)能力,,更廣闊的應(yīng)用場(chǎng)景。
能力云AIHUB,,是在2018年發(fā)布的基礎(chǔ)上進(jìn)行升級(jí)和擴(kuò)展,,已開放513項(xiàng)AI能力并不斷引入生態(tài)合作伙伴最優(yōu)秀的能力,打造AI能力圖譜,。面向網(wǎng)絡(luò)不穩(wěn)定,、信息安全敏感的環(huán)境,全新升級(jí)了全系離線版本,,加深行業(yè)應(yīng)用,。值得一提的是,在大會(huì)現(xiàn)場(chǎng)剛剛發(fā)布的SMART-TTS多風(fēng)格多情感語(yǔ)音合成技術(shù),,已在訊飛開放平臺(tái),、訊飛有聲APP同步上新,讓開發(fā)者可以更早的體驗(yàn)到擁有10種場(chǎng)景,、11種情感的語(yǔ)音合成,。
交互云AIUI+,通過(guò)遠(yuǎn)近場(chǎng)多模語(yǔ)音增強(qiáng),,突破同向人聲干擾難題,,解決人機(jī)交互最后一公里問(wèn)題。通過(guò)多模態(tài)技術(shù),,對(duì)人臉,、唇形進(jìn)行跟蹤定位,實(shí)現(xiàn)主動(dòng)交互,、說(shuō)話人保持,、噪聲抑制。在同向人聲干擾下,,語(yǔ)音識(shí)別準(zhǔn)確率已由60.2%提升到86.8%。
模型云AILAB,,面向細(xì)分模型定制場(chǎng)景,,提供小樣本訓(xùn)練平臺(tái),,主要解決三類問(wèn)題。面向格式多樣場(chǎng)景,,支持任意自定義格式單據(jù)識(shí)別,;針對(duì)數(shù)據(jù)稀缺場(chǎng)景,實(shí)現(xiàn)5張圖片訓(xùn)練出OCR定制模型,、半小時(shí)音頻生成商用發(fā)言人,;遇到價(jià)格敏感場(chǎng)景,“0”成本提供多樣喚醒詞,。
資產(chǎn)平臺(tái)AIRES,,聯(lián)合生態(tài),共建數(shù)字資產(chǎn),,讓機(jī)器人交互形象生動(dòng)有內(nèi)容,。目前平臺(tái)已提供210個(gè)多語(yǔ)種技能、342個(gè)虛擬人形象,、6000萬(wàn)首正版音樂(lè),、1200萬(wàn)小時(shí)有聲內(nèi)容,并開放數(shù)字藏品平臺(tái)——星晝,,為開發(fā)者提供豐富的內(nèi)容資源,。
超自動(dòng)化AIRPA,用數(shù)字機(jī)器人激活人效潛能,,助力企業(yè)數(shù)字化轉(zhuǎn)型,。由AI+RPA構(gòu)建的數(shù)字機(jī)器人是訊飛面向企業(yè)場(chǎng)景打造的協(xié)作新模式,提供了數(shù)字機(jī)器人統(tǒng)一工作臺(tái),、柔性人機(jī)協(xié)同,、智能化員工助手等應(yīng)用。
除以上組件升級(jí)煥新以外,,訊飛還發(fā)布了機(jī)器人超腦平臺(tái)AIBOT,,讓機(jī)器人在交互大腦的基礎(chǔ)上,快速構(gòu)建運(yùn)動(dòng)能力,。
機(jī)器人超腦平臺(tái)發(fā)布
讓AI的賦能無(wú)處不在
“降低開發(fā)者使用門檻,,快速實(shí)現(xiàn)超腦能力與實(shí)體機(jī)器人的結(jié)合,為實(shí)體機(jī)器人真正的智能化帶來(lái)直接動(dòng)力與貢獻(xiàn),!”于繼棟在發(fā)布機(jī)器人超腦平臺(tái)AIBOT時(shí)如是說(shuō),。
融入多模交互、深度理解,、運(yùn)動(dòng)控制,、硬件模組等核心能力的機(jī)器人超腦平臺(tái),為實(shí)體機(jī)器人提供高性能的算力支撐,、高效率的地圖導(dǎo)航以及高精度的定位功能,,打造軟硬一體的智能化機(jī)器人,。 而這一項(xiàng)技術(shù)已經(jīng)有了實(shí)際的應(yīng)用案例。能說(shuō)會(huì)跑的狗來(lái)自宇數(shù)科技的四足機(jī)器狗在訊飛機(jī)器人超腦平臺(tái)的加持下,,已實(shí)現(xiàn)自適應(yīng)的地形能力,、全局定位搜索能力、地圖快速構(gòu)建能力,、更精細(xì)的運(yùn)動(dòng)控制能力,。在這四大能力全面提升后,機(jī)器狗能跑會(huì)跳,,能看會(huì)說(shuō),,可應(yīng)用于戶外巡邏、工業(yè)巡檢等多元化場(chǎng)景,。
超強(qiáng)助手機(jī)械臂基于訊飛機(jī)器人超腦平臺(tái),,珞石科技為柔性機(jī)械臂增加了語(yǔ)音交互、深度視覺以及運(yùn)動(dòng)控制能力,,再加上算法的改造,,讓機(jī)械臂操作更智能、工業(yè)質(zhì)檢更高效,、定位更實(shí)時(shí),,可以有效的適應(yīng)各種應(yīng)用。在工業(yè)質(zhì)檢,、商業(yè)服務(wù),、遠(yuǎn)程超聲、柔性生產(chǎn)等場(chǎng)景,,柔性機(jī)械臂都可實(shí)現(xiàn)與人類更高效的工作配合,。
開發(fā)者燈塔計(jì)劃
讓每個(gè)創(chuàng)新者享受AI樂(lè)趣
獨(dú)木不成林 生態(tài)才永恒。依托越來(lái)越多優(yōu)秀的人工智能應(yīng)用的開放,,訊飛開放平臺(tái)期待讓每個(gè)創(chuàng)新者享受AI的樂(lè)趣,。 日常生活和企業(yè)工作中,很難要求每個(gè)人都懂程序開發(fā),。通過(guò)RPA,、低代碼等技術(shù)構(gòu)建工作場(chǎng)景下的新型智能應(yīng)用,訊飛開放平臺(tái)為懂業(yè)務(wù),、想創(chuàng)新的伙伴提供服務(wù),,將更多智能化的體驗(yàn)帶進(jìn)千家萬(wàn)戶。會(huì)上,,于繼棟發(fā)布了“開發(fā)者燈塔計(jì)劃”,,秉持“共生、共創(chuàng)、共享,、多樣繁榮”的理念,,打造更豐富,、便捷的AI服務(wù),,讓AI科學(xué)家、設(shè)計(jì)師,、企業(yè)管理人員與內(nèi)容生產(chǎn)者等,,都能享受AI的樂(lè)趣與價(jià)值,共創(chuàng)繁榮的AI新生態(tài),。
“希望與各位開發(fā)者攜手共創(chuàng),,邁入人機(jī)協(xié)同新時(shí)代”,在大會(huì)最后,,于繼棟發(fā)出倡議,。訊飛開放平臺(tái)將繼續(xù)秉持共建人工智能產(chǎn)業(yè)的初心,用生態(tài)定義未來(lái),,共筑數(shù)字經(jīng)濟(jì)新發(fā)展,。
更多信息可以來(lái)這里獲取==>>電子技術(shù)應(yīng)用-AET<<