人工智能竟如此強(qiáng)大？谷歌推出的Translatotron不光能翻譯，連聲音都可模仿？-AET-電子技術(shù)應(yīng)用

人工智能竟如此強(qiáng)大？谷歌推出的Translatotron不光能翻譯，連聲音都可模仿？

日期： 2019-05-21

關(guān)鍵詞： Translatotron 人工智能谷歌

　　日常溝通與文字最大的不同點(diǎn)在于我們擁有的語(yǔ)調(diào)與節(jié)奏，而谷歌最新的人工智能翻譯原型不僅能翻譯書面上的意思，連聲音的音調(diào)與節(jié)奏也能一并拿下。

　　這個(gè)系統(tǒng)被稱為Translatotron，谷歌的研究人員在最近的一篇博客中詳細(xì)介紹了它的工作原理。他們并沒有表示Translatotron很快就會(huì)進(jìn)入商業(yè)領(lǐng)域，但這很可能會(huì)實(shí)現(xiàn)。正如谷歌的翻譯主管今年早些時(shí)候向The Verge解釋的那樣，該公司目前的目標(biāo)是為其翻譯工具添加更多的細(xì)微差別，創(chuàng)造更逼真的語(yǔ)音。

　　雖然捕捉人類聲音的變化對(duì)外行人來(lái)說(shuō)是最令人印象深刻的，但Translatotron對(duì)人工智能工程師的吸引力在于，它可以直接將語(yǔ)音從音頻輸入轉(zhuǎn)換為音頻輸出，而無(wú)需將其轉(zhuǎn)換為通常的中間文本。

　　這種人工智能模型被稱為端到端系統(tǒng)，因?yàn)檩o助任務(wù)或操作沒有停止。谷歌說(shuō)，讓端到端的翻譯更快地產(chǎn)生結(jié)果，同時(shí)避免了在多個(gè)翻譯步驟中引入錯(cuò)誤的風(fēng)險(xiǎn)。

　　更有趣的是，模型處理的數(shù)據(jù)不是原始音頻。相反，它使用光譜圖數(shù)據(jù)，或聲音的可視化詳情。從本質(zhì)上說(shuō)，這意味著我們相當(dāng)于在用圖片的形式把一種語(yǔ)言翻譯成另一種語(yǔ)言，這令人難以置信。

　　盡管谷歌經(jīng)常推出新語(yǔ)言和翻譯工具，但它們的表現(xiàn)往往不如預(yù)期那樣，包括現(xiàn)在這個(gè)人工智能模型，其適應(yīng)性和準(zhǔn)確性仍有待考究，但人工智能一直在前進(jìn)，未來(lái)也將會(huì)越來(lái)越好。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

人工智能竟如此強(qiáng)大？谷歌推出的Translatotron不光能翻譯，連聲音都可模仿？

日期： 2019-05-21

相關(guān)內(nèi)容