摘? 要: 介紹了一種基于專用語(yǔ)音識(shí)別芯片TSG410的彩電智能聲控選臺(tái)系統(tǒng),,可以在不對(duì)彩電做任何改動(dòng)的基礎(chǔ)上,實(shí)現(xiàn)語(yǔ)音遙控電視機(jī),。
關(guān)鍵詞: 語(yǔ)音識(shí)別? 彩電遙控? 智能聲控選臺(tái)
?
隨著電視頻道數(shù)目的日益增多,,傳統(tǒng)的電視遙控方法弊端越來(lái)越明顯,。它需要觀眾記憶大量電視臺(tái)對(duì)應(yīng)頻道,,這是件很令人頭疼的事情,。我們利用專用語(yǔ)音識(shí)別芯片TSG410設(shè)計(jì)了一個(gè)彩電智能聲控選臺(tái)系統(tǒng),可以較好地解決記憶頻道這個(gè)難題,。尤其對(duì)殘疾朋友來(lái)講,,更具有特殊的意義。
該系統(tǒng)不對(duì)彩電做任何改動(dòng),。在保留原有遙控功能的基礎(chǔ)上,實(shí)現(xiàn)語(yǔ)音控制選臺(tái),,主要功能有:
·開(kāi)關(guān)電視:電視接通電源處于待命狀態(tài),,操作者發(fā)出“開(kāi)機(jī)”命令,則打開(kāi)電視機(jī);操作者發(fā)出“關(guān)機(jī)”命令,,則關(guān)掉電視機(jī);
·選臺(tái)功能:操作者想看XX電視臺(tái)的節(jié)目,,只要發(fā)出“XX臺(tái)”的命令,,電視機(jī)自動(dòng)跳轉(zhuǎn)到該臺(tái)。
·識(shí)別主人功能:為防止誤操作,,該系統(tǒng)只對(duì)事先錄入命令樣本的操作者語(yǔ)音敏感,,其他人發(fā)出的命令包括電視伴音均無(wú)效。
·其它功能:具有電視音量,、畫面亮度調(diào)節(jié)等適合語(yǔ)音控制的功能,。
1 系統(tǒng)設(shè)計(jì)方案
我們最初考慮了兩種設(shè)計(jì)方案(見(jiàn)圖1和圖2),它們各有優(yōu)缺點(diǎn),。第一種電路不足之處是:電路稍復(fù)雜一點(diǎn),,而且要對(duì)電視機(jī)的選臺(tái)控制電路做必要的改動(dòng)(當(dāng)然這對(duì)電視機(jī)生產(chǎn)廠家是不成問(wèn)題的);其優(yōu)點(diǎn)是:只需一個(gè)無(wú)線話筒便可聲控選臺(tái),且不必對(duì)準(zhǔn)電視機(jī),,甚至在另一個(gè)房間也可實(shí)現(xiàn)遙控,。第二種電路的優(yōu)點(diǎn)是:不必對(duì)電視機(jī)的選臺(tái)控制電路做任何的改動(dòng);缺點(diǎn)是:所有電路只能靠電池供電,芯片選擇要考慮耗電和工作電壓?jiǎn)栴},。由于采用紅外遙控發(fā)射來(lái)控制電視,,該系統(tǒng)須對(duì)準(zhǔn)電視機(jī)才能正常工作。綜合考慮各方面因素,,我們認(rèn)為第二種設(shè)計(jì)方案較切實(shí)可行,。
?
?
2 各個(gè)功能模塊簡(jiǎn)介
2.1 語(yǔ)音命令提取單元
語(yǔ)音命令提取該單元(如圖2)在電視話音和其它噪音背景下,完成提取出操作者語(yǔ)音命令功能,,其示意圖如圖3所示,。
MIC選用駐極體送話器,它具有結(jié)構(gòu)簡(jiǎn)單,、重量輕,、體積小、頻率響應(yīng)寬,、保真度好等優(yōu)點(diǎn),,但靈敏度較低,必須再加放大器才行,。由于輸出阻抗可高達(dá)108Ω數(shù)量級(jí),,所以必須進(jìn)行阻抗變換后才能與放大器配合使用。放大器采用差分放大電路,,一個(gè)駐極體送話器面對(duì)送話者,,其輸出接放大器正向輸入端;另一個(gè)駐極體送話器背對(duì)送話者,其輸出接放大器負(fù)向輸入端,。由于兩個(gè)送話器相對(duì)于電視機(jī)和其它噪聲源的位置基本一樣遠(yuǎn),,可以近似認(rèn)為通過(guò)二者輸入的干擾是一樣的。但考慮到送話器具有方向性,,前者送入的操作者語(yǔ)音命令遠(yuǎn)遠(yuǎn)大于后者,,適當(dāng)選擇各電阻值可以抵消掉各種干擾,。放大器采用運(yùn)放(OP Amps)MAX495(單電源供電+2.7V~+6V)。
2.2 語(yǔ)音識(shí)別單元
語(yǔ)音識(shí)別單元主要由TSG410和非易失性SRAM組成,,大體構(gòu)成如下圖4所示,。
?
語(yǔ)音識(shí)別功能由專用語(yǔ)音芯片TSG410完成,TSG410是一種新穎功能齊全的語(yǔ)音識(shí)別集成電路,。它采用CMOS大規(guī)模集成電路制作工藝制造,,內(nèi)含除SRAM以外語(yǔ)音識(shí)別所需的全部電路,如CPU,、A/D轉(zhuǎn)換器,、ROM、語(yǔ)音放大器,、壓縮器,、濾波器、振蕩器及接口電路等,。TSG410具有雙列直插和貼片兩種封裝方式,,可工作在CPU控制和人工控制兩種模式下。語(yǔ)音識(shí)別的響應(yīng)時(shí)間典型值為300ms,,最長(zhǎng)不超過(guò)600ms,。
識(shí)別容量大,最多可識(shí)別40個(gè)字段,,且分段方式靈活,。為了CPU管理方便,將40個(gè)字段分成四組,,編號(hào)為1~4,,每組10個(gè)字段。這樣,,第一個(gè)字段編號(hào)為10,,第二個(gè)為11,第三個(gè)為12…依次類推,,第40個(gè)字段編號(hào)為49,。在操作顯示時(shí),十位數(shù)顯示組號(hào),,個(gè)位數(shù)顯示序號(hào),。因此,建立語(yǔ)音樣本時(shí),,應(yīng)注意顯示數(shù)字和電視機(jī)選擇頻率之間的換算關(guān)系,,以免語(yǔ)音命令和控制結(jié)果對(duì)應(yīng)不起來(lái)。各段功能分配如表1所示,。
?
TSG410的每個(gè)字段時(shí)間長(zhǎng)度可以在0.9s和1.92s之間選擇,。按正常人的講話速度,每秒吐字2~4個(gè),,如選擇0.9s,,則每個(gè)命令字段以1~3個(gè)字為宜,選擇1.92s則最大容量為8個(gè)漢字,,但可識(shí)別的字段數(shù)減少為20個(gè),。我們選擇前一種分段方式,語(yǔ)音命令以3個(gè)字以下為宜,。因此,,電視選臺(tái)命令采用“地方”命名原則,如:山東,、上海等,,中央臺(tái)可直接叫“一臺(tái)”、“二臺(tái)”,,依次類推,。語(yǔ)音命令差別越大越不容易出現(xiàn)錯(cuò)誤識(shí)別。系統(tǒng)要正常工作,,必須首先建立語(yǔ)音樣本,,為防止語(yǔ)音樣本因?yàn)榈綦妬G失,SRAM選用內(nèi)帶掉電保護(hù)電池的非易失性SRAM,,即NVSRAM(non-volatile SRAM),,如HK1125,掉電后其數(shù)據(jù)可保存10年以上,,用法同普通RAM,。
一般情況下,留有30個(gè)預(yù)選頻道是足夠用的,。實(shí)際上,,既可以采用多片TSG410進(jìn)行頻道數(shù)和允許操作者人數(shù)擴(kuò)展方式滿足各種需要,也可以采用讓TSG410工作在CPU控制方式的辦法,。此時(shí)識(shí)別容量不受40字段限制,,但需增加單片機(jī)(如8031)作控制用。
2.3 控制面板
為了能輸入字段號(hào),,以便建立語(yǔ)音樣本,,TSG410配置了外接鍵盤掃描電路。行,、列信號(hào)的輸入,、輸出口由芯片的S1~S3、K1~K3擔(dān)當(dāng)。這樣一個(gè)三列,、四行的鍵盤共有12個(gè)按鍵,,其中十個(gè)定義為:0~9數(shù)字鍵,一個(gè)定義為:語(yǔ)音樣本建立鍵(TRN),,一個(gè)定義為:語(yǔ)音樣本清除鍵(CLR),。由于控制面板只在建立語(yǔ)音樣本時(shí)使用,為防止誤操作,,應(yīng)將12個(gè)按鍵用塑料外殼封起來(lái),。
2.4 操作指示電路
采用兩片數(shù)碼管和譯碼驅(qū)動(dòng)電路CC4558組成操作指示電路。在本系統(tǒng)中,,操作指示電路的作用是:建立語(yǔ)音命令樣本時(shí),,用于顯示存入的字段號(hào);語(yǔ)音命令識(shí)別時(shí)用于顯示識(shí)別結(jié)果及芯片識(shí)別結(jié)果的處理報(bào)告。
2.5 邏輯控制電路
整個(gè)邏輯控制電路如圖5所示,。TSG410通過(guò)D0~D7輸出識(shí)別結(jié)果,,必須進(jìn)行必要的譯碼后,才能用來(lái)控制后面的紅外發(fā)射裝置,。在電視機(jī)的遙控系統(tǒng)中,,遙控發(fā)射器通過(guò)按鍵,以紅外線方式發(fā)出各種不同的脈沖編碼信息,。尤其需要注意其發(fā)射編碼必須與原來(lái)一致,,以便兼容。采用電子開(kāi)關(guān)電路模擬手工按鍵時(shí),,必須考慮開(kāi)關(guān)接通時(shí)間和兩個(gè)按鍵之間的時(shí)間間隔問(wèn)題,,以防止信號(hào)丟失和“串鍵”、“并鍵”現(xiàn)象的發(fā)生,。通常情況下,,全部鍵位掃描一次的時(shí)間小于10~20ms,而人手觸及按鍵的時(shí)間最短也在100ms以上,,因此在任一按鍵被按下后,,會(huì)有多次掃描信號(hào)通過(guò),不存在信號(hào)丟失問(wèn)題,。所謂“串鍵”是指在一個(gè)鍵按下之后,,又接著按下另一鍵;而“并鍵”則是同時(shí)按下兩鍵。這兩種錯(cuò)誤操作發(fā)生的根本原因是:每個(gè)按鍵的遙控指令編碼需要一定時(shí)間才能發(fā)射完畢(一般在100ms左右),,所以應(yīng)設(shè)法消除,。這是我們?cè)O(shè)計(jì)邏輯控制電路時(shí)的一個(gè)難點(diǎn),采用脈沖展寬(>40ms)和脈沖延遲電路(>120ms)解決,。
?
2.6 遙控發(fā)射電路
紅外遙控發(fā)射器主要由三大部分組成:一是鍵盤矩陣,,二是發(fā)射專用集成電路,,三是放大驅(qū)動(dòng)和紅外線發(fā)射部分。該電路與電視機(jī)的特定型號(hào)有關(guān),,可以根據(jù)電視機(jī)品牌選用適當(dāng)?shù)膶S眉t外發(fā)射電路,。
需要說(shuō)明的是:由于不同品牌電視機(jī)的紅外發(fā)射、接收電路各不相同,,因此它只對(duì)兼容電視有效,。
?
參考文獻(xiàn)
1 孫景琪.遙控彩色電視機(jī)集成電路及應(yīng)用.北京:人民郵電出版社,,1994
2 TSG公司.TSG410芯片數(shù)據(jù)資料
3 MAXIM公司.1996 NEW RELEASES DATA BOOK