人腦信號(hào)生成文本新實(shí)驗(yàn)，準(zhǔn)確率高達(dá)97%-AET-電子技術(shù)應(yīng)用

人腦信號(hào)生成文本新實(shí)驗(yàn)，準(zhǔn)確率高達(dá)97%

日期： 2020-04-25

來(lái)源：與非網(wǎng)

關(guān)鍵詞： AI 人腦信號(hào) 人工智能

與非網(wǎng) 4 與 24 日訊，近日，一個(gè)由加州大學(xué)舊金山分校的研究團(tuán)隊(duì)打造的新型人工智能系統(tǒng)可根據(jù)人腦信號(hào)來(lái)生成文本，準(zhǔn)確率最高可達(dá) 97%。目前該研究的結(jié)果已經(jīng)發(fā)表在《自然神經(jīng)科學(xué)》雜志上。

近幾年，亞馬遜和谷歌等科技公司打造的虛擬助手已經(jīng)比較成熟，語(yǔ)音識(shí)別能力比起幾年前進(jìn)步驚人，人們?cè)诼_(kāi)始領(lǐng)會(huì)它們的威力。

然而，最近一項(xiàng)更令人驚嘆、更匪夷所思的里程碑式技術(shù)創(chuàng)新可能即將實(shí)現(xiàn)。它的出現(xiàn)讓語(yǔ)音識(shí)別技術(shù)完全相形見(jiàn)絀，這是一個(gè)十分強(qiáng)大的人工智能(AI)系統(tǒng)，可以根據(jù)人們的大腦活動(dòng)直接生成完整的文本，整個(gè)過(guò)程完全不需要聽(tīng)到任何一個(gè)單詞。這不完全是科幻小說(shuō)中的概念。近幾十年來(lái)，從動(dòng)物模型到人類(lèi)參與者，腦機(jī)接口技術(shù)的發(fā)展可謂突飛猛進(jìn)。事實(shí)上，這類(lèi)技術(shù)已經(jīng)在嘗試將這種概念從幻想變成現(xiàn)實(shí)。

加拿大研究團(tuán)隊(duì)就曾對(duì)此評(píng)論過(guò)，以目前來(lái)看，通過(guò)該技術(shù)將人腦信號(hào)轉(zhuǎn)換成的文本結(jié)果還不很準(zhǔn)確。為此，他們團(tuán)隊(duì)還使用了一種全新的方法來(lái)解碼腦皮質(zhì)電圖：通過(guò)植入大腦的電極，來(lái)獲取皮質(zhì)活動(dòng)中所產(chǎn)生的電脈沖記錄。

具體而言，該實(shí)驗(yàn)團(tuán)隊(duì)在四名癲癇患者身上使用了這種植入物，以便監(jiān)測(cè)他們的身體狀況引起的癲癇發(fā)作情況。研究團(tuán)隊(duì)還進(jìn)行了一項(xiàng)附帶實(shí)驗(yàn)：讓參與者大聲、反復(fù)地朗讀一些預(yù)先準(zhǔn)備的句子，同時(shí)通過(guò)電極來(lái)記錄他們?cè)诖似陂g的大腦活動(dòng)。然后，這些數(shù)據(jù)被輸入到一個(gè)神經(jīng)網(wǎng)絡(luò)，該網(wǎng)絡(luò)根據(jù)實(shí)驗(yàn)的音頻記錄，分析出與特定語(yǔ)音特征(如元音、輔音或口型)相對(duì)應(yīng)的大腦活動(dòng)模式。最后，另一個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)這些大腦表現(xiàn)進(jìn)行解碼——參與者反復(fù)朗讀 30 到 50 個(gè)句子時(shí)產(chǎn)生的大腦活動(dòng)數(shù)據(jù)——并據(jù)此來(lái)嘗試預(yù)測(cè)人們所說(shuō)的話(huà)，預(yù)測(cè)根據(jù)他們朗讀單詞時(shí)所產(chǎn)生的皮層信號(hào)來(lái)進(jìn)行。

在實(shí)驗(yàn)條件順利的情況下，該系統(tǒng)在將其中一名參與者的大腦信號(hào)轉(zhuǎn)化成文本時(shí)，詞錯(cuò)率(WER)只有 3%——至少在這些嚴(yán)格限定的實(shí)驗(yàn)條件下，這個(gè)詞錯(cuò)率也許已經(jīng)接近于迄今為止人工智能讀取人的想法的最佳表現(xiàn)。

而在最不理想的情況中，神經(jīng)網(wǎng)絡(luò)的錯(cuò)誤完全莫名其妙，不管是在語(yǔ)音上還是在語(yǔ)義上，都與實(shí)際的句子完全搭不著邊：“她穿著溫暖的羊毛工裝褲”被預(yù)測(cè)為“綠洲是海市蜃樓”。

對(duì)此，該實(shí)驗(yàn)團(tuán)隊(duì)稱(chēng)，盡管這些顯而易見(jiàn)的錯(cuò)誤有些詭異，但總的來(lái)說(shuō)，該系統(tǒng)也許還是刷新了基于 AI 的大腦活動(dòng)解碼的最佳表現(xiàn)，畢竟它表現(xiàn)最好時(shí)的詞錯(cuò)率只有 5%，能夠與專(zhuān)業(yè)的人工語(yǔ)音轉(zhuǎn)錄相提并論。

不過(guò)，要應(yīng)付日常發(fā)言的專(zhuān)業(yè)轉(zhuǎn)錄員必須得有數(shù)以萬(wàn)計(jì)的詞匯量。相比之下，這個(gè)系統(tǒng)只能從有限的短句中學(xué)習(xí)到大約 250 個(gè)單詞的皮層特征，所以拿二者相比較并不公平。

雖然還有許多障礙需要克服，但該研究團(tuán)隊(duì)認(rèn)為，該系統(tǒng)有朝一日可能會(huì)讓那些失去說(shuō)話(huà)能力的人能夠重新“開(kāi)口”說(shuō)話(huà)。如果這樣的事情成為可能，會(huì)有望產(chǎn)生巨大的影響——為一些人提供一種與周?chē)澜缃涣鞯姆绞健宜鶐?lái)的影響可能會(huì)遠(yuǎn)遠(yuǎn)超出人們目前的想象。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà)：010-82306118；郵箱：[email protected]。

人腦信號(hào)生成文本新實(shí)驗(yàn)，準(zhǔn)確率高達(dá)97%

日期： 2020-04-25

來(lái)源：與非網(wǎng)

相關(guān)內(nèi)容