現階段,,許多機動車輛都安裝了車載終端,。它主要用于車載導航、車輛調度,、車載監(jiān)控等,。而許多終端設備是依靠手工操作顯示終端來完成的,,如駕駛員查看車輛調度中心或朋友發(fā)來的重要短消息。查看導航終端的地圖等,。這樣就導致司機開車時不能專心,,其直接后果可能導致嚴重的交通事故。
語音交流是人類最自然的交流方式,,如果車載終端的很多操作可由實時的語音來代替的話,,將有利于減少交通事故的發(fā)生率。例如,,GSM Modem收到短消息,,司機不用手動查看。語音合成系統(tǒng)可以自動播報出來;可以實時地提示司機行駛的方向與路名;可以實時地將交通狀況播報出來,。讓駕駛員了解當前交通狀況,,通過了解道路交通擁堵的實時信息,,從而避開擁堵路段,更快到達目的地等,。語音合功能成的車載終端可提高車載終端的智能性,、車輛駕駛的安全性和舒適性,使用戶使用起來更加方便,,更具有人性化,。
2 語音合成及GSM M0dem
2.1 語音合成技術
語音合成技術是利用計算機、智能系統(tǒng)等設備,,按預定的程序和指令,,人為產生音素、音節(jié),、詞和句子的技術,。
目前,語音合成技術已發(fā)展到能實時地將任意文本轉換成連續(xù)可懂的自然語句輸出,相應技術通常稱為文語合成或文語轉換(Text To Speech,簡稱TTS),,涉及到聲學,、語言學、語音數字信號處理技術,、多媒體技術等多個學科,。文語合成的原理:根據韻律建模的結果,從原始語音庫中取出相應的語音基元,利用特定的語音合成技術對語音基元進行韻律特性的調整和修改,最終合成出符合實際的語音,。
2.2 語音合成模塊
本設計采用安徽中科大訊飛信息科技有限公司研發(fā)的一款高端中文語音合成模塊XF-S4240,。該模塊可通過UART、SPI和12C三種接口接收待合成的文本,,直接合成為語音輸出(Line out),。
該模塊采用。InterSound4.0 KT系統(tǒng)作為模塊內核,,一個是輕量級中文連續(xù)語音合成系統(tǒng),。
XF-S4240模塊的特點如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文單詞時按字母方式發(fā)音;支持四種內碼格式:GB2312(簡體中文編碼),、GBK(國家標準擴展編碼),、Unicode(字符編碼)、Big5(繁體中文編碼);具有雙發(fā)音人:男聲,、女聲;具有智能的文本分析處理算法,,可正確識別和處理數值、號碼,、時間日期及一些常用的度量衡符號,,具備較強多音字處理和中文姓氏處理能力;支持軟件調節(jié)語速、語調,、音量等,。 2.3 GSM Modem,。GSM Modem是繼GSM手機后又一種非常重要的GSM移動通信系統(tǒng)的終端設備。GSM Modem作為一種主要的GSM網絡接入設備,,它是傳統(tǒng)調制解調器與GSM無線移動通信系統(tǒng)相結合的一種數據終端設備,,因此也叫無線調制解調器。它的出現打開了GSM網絡數據通信及其應用的大門,。本設計采用西門子公司生產的第三代GSM雙頻ModemTC35i,該模塊可廣泛應用于POS終端,、手持式設備、移動電腦,、無線電話,、交通控制和導航系統(tǒng)、快速管理安全系統(tǒng),、遠程監(jiān)視、遠程抄表,、自動售賣機等系統(tǒng),。
3 車載終端的硬件設計
系統(tǒng)硬件是以廣州周立功單片機發(fā)展有限公司的ARM7系列Smart ARM2200嵌入式平臺為基礎。平臺主控制器采用飛利浦公司生產的16/32位ARM7TDMI-S微控制器IPC2210,,它具有豐富的外部接口,,例如工業(yè)標準的UART、高速的I2C接口(400 kb/s),、SPI接口,、A/D轉換接口等,可以方便地與其他外設互連,。
系統(tǒng)底層軟件采用μCliunx內核,,該內核是針對微控制領域而設計的Linux系統(tǒng),適合無內存管理單元(MMU)的微控制器,。
XF-S4240模塊可通過UART,、SPI和I2C接口實現與其他終端設備的通訊。本系統(tǒng)設計利用SmartARM2200嵌入式平臺的I2C接口與XF-S4240的12C接口進行通訊,。XF-S4240設置為從設備,,默認地址為0x80,Smart ARM2200設置為主設備,。GSM Modem則通過標準UART口與SmartARM2200嵌入式系統(tǒng)的通用串口2連接,。
4 軟件設計
4.1 語音模塊合成的通訊協(xié)議
無論XF-S4240采用UART、SPI還是I2C與其他智能系統(tǒng)連接,語音合成模塊的上層通訊協(xié)議是相同的,,下面將介紹語音合成的控制命令,。
發(fā)送給XF-S4240的所有命令與數據均采用"幀"的方式進行數據封裝后傳輸。
其中,,幀頭長度為一個字節(jié),,定義為16進制"0xFD";數據區(qū)長度占兩個字節(jié),,高字節(jié)在前,低字節(jié)在后,。數據區(qū)長度不定,,但須小于1 024個字節(jié)。數據區(qū)包含命令字,、命令參數和合成的語音信息,。
此幀的含義:0xFD表示幀頭,0x00 0x0A表示數據區(qū)長度為10個字節(jié)。0x01表示語音合成命令,,0x00表示文本格式為GB2312,,剩余的16進制編碼為中山大學的GB2312編碼[3]。
4.2 TC35i GSM Modem的通訊協(xié)議
TC35i GSM Modem與其他終端采用通用串行接口進行通訊,,通訊協(xié)議采用AT指令集,。本設計主要讀取GSM Modem的短消息。而與短消息收發(fā)有關的規(guī)范主要包括GSM 03.38,,GSM 03.40和GSM07.05,。前兩者重點描述的是SMS技術實現(編碼方式),后者規(guī)定了SMS的DTE-DCE接口標準(AT命令集)。AT指令是以AT為開頭,,如AT+CMGL=0(GSM 07.05版本)表示讀取最新收到的短消息,,AT+CMGC表示發(fā)出一條短消息等。
短消息共有3種接收與發(fā)送模式:Block Mode(塊模式),,Text Mode(文本模式)和PDU Mode(PDU模式),。PDU模式最常用,支持所有手機,,可以使用任何字符集,。下面給出一個PDU模式下的ASCII串,其短消息中心號碼(SMSC)是+8613800200500,,發(fā)送者號碼是13826468897.消息內容是"中山大學",,則通過讀取它的"PDU串"是:"08 9l 68 3l 0820 00 05 F0 04 0D 91 68 31 28 46 86 98 F7 00 0860 30 02 11 82 21 80 08 D0 D6 BD C9 F3 B4 A7D1"。通過以上這個PDU串得知.要得到需要的用戶信息就必須對"PDU串"進行解碼,。下面給出"PDU串"解碼的數據結構,。
4.3 應用程序的設計與流程
嵌入式平臺SmartARM220的應用程序是運行于μCliunx內核之上,應用程序不能直接對硬件操作,。為了實現硬件與外部設備通訊,,必須調用相應的設備驅動程序。本文主要涉及UART驅動,、I2C驅動,,嵌入式驅動程序的設計方法在這里省略。
5 結束語
基于語音合成技術和語音模塊XF-S4240的車載終端可廣泛應用于導航系統(tǒng)、車載調度,、車載監(jiān)控等,。由于該技術的通用性,它還可應用于其他需要語音合成技術的場合,,如排隊叫號系統(tǒng),,公交報站器等。目前語音識別技術雖已取得很大的成績,,但效果不如語音合成技術,,相信不久人們就可利用更加先進的語音技術自然地與機器進行交流!