當(dāng)手機(jī)不斷地整合包括照相,、游戲、數(shù)據(jù),、視頻等各種功能于一身時,,它已搖身變成一個多媒體應(yīng)用的播放平臺,可說是朝細(xì)致而微的隨身型迷你計(jì)算機(jī)發(fā)展,。在定位上,,這樣的手機(jī)有別于既有的純粹語音的手機(jī)(Voice phone)或具備某些功能的手機(jī)(Feature phone),而當(dāng)屬于智能型手機(jī)(Smart phone),。
智能型手機(jī)除了具有較強(qiáng)的數(shù)據(jù)編輯管理能力,,更能提供音、視頻,、游戲等多媒體應(yīng)用服務(wù),,也能同時處理多項(xiàng)工作。更進(jìn)一步來看,,它的功能面涵蓋了通信,、信息與多媒體功能,即:
1. 通信功能:語音,、訊息(messaging),、認(rèn)證(Authentication)、計(jì)費(fèi)(Billing)等等通信處理功能;
2. 信息功能:Email,、行事歷,、信息管理、Sync,、安全性等信息處理功能;
3. 多媒體功能:視頻,、照相、游戲,、TV,、串流、音樂,、DRM等多媒體應(yīng)用功能;
除了信息功能外,,在通信與多媒體的應(yīng)用上,音頻是必要的處理任務(wù),。在過去,,手機(jī)只需要處理單純的語音通話信號,但今日的智能型手機(jī)中得處理的音頻任務(wù)繁重,,除了多音調(diào)振鈴,、MP3音樂外,,可能還要有FM廣播及游戲音效,而且不能只是單聲道的效果,,現(xiàn)在要求的是立體聲的臨場感體驗(yàn),。
過去,,數(shù)字音頻的世界是截然兩分的:一邊是Hi-Fi的世界,,另一邊則是語音的世界。一般而言,,Hi-Fi是指16bit立體聲質(zhì)量,、以44.1kHz取樣的音頻,也就是CD音樂的規(guī)格;電話語音則是8bit和8kHz的單聲道(mono),、低質(zhì)量音頻,。不過,進(jìn)入智能型手機(jī)的時代,,兩個音頻世界開始撞擊在一起了,,如何將音頻子系統(tǒng)完善地與應(yīng)用及通信處理平臺整合在一起,就成了便攜式設(shè)備工程師開發(fā)新產(chǎn)品時的關(guān)鍵性挑戰(zhàn),。
音頻編碼格式與接口
在進(jìn)入系統(tǒng)架構(gòu)的探討前,,先來看看音頻編碼的現(xiàn)狀。目前音頻編碼的格式繁多,,針對聲音的編碼就有PCM,、ADPCM、DM,、PWM,、WMA、OGG,、 AMR,、ACC、MP3Pro以及MP3等;針對人類語音有LPC,、CELP與ACELP等;其它還有MPEG-2,、MPEG-4、H.264,、VC-1 等視聽節(jié)目的編碼格式,。
以下介紹三種常用的音頻格式:
AMR格式
AMR為自適應(yīng)多碼率語音傳輸編譯碼器(Adpative Multi-Rate Speech Codec),最初版是歐洲電信標(biāo)準(zhǔn)化協(xié)會(ETSI)為GMS系統(tǒng)所制定的語音編譯碼標(biāo)準(zhǔn),,而因頻寬又分為兩種—AMR-NB(AMR Narrowband)和AMR-WB(AMR Wideband),。以市場最大品牌Nokia來說,其多數(shù)手機(jī)都支持上述兩種格式的音頻文件,。
MP3格式
MP3是MPEG AudioLayer3的縮寫,,這是一種音頻壓縮技術(shù),,其編碼具有10:1-12:1的高壓縮率,可以保持低頻部分不失真,,但犧牲了音頻中12KHz -16KHz的高頻部份來降低文件大小,,其“.mp3”格式文件一般只有“.wav”的10%。另外,,MP3受到歡迎的一大原因,,是它并非受到版權(quán)保護(hù)的技術(shù),所以任何人都可以使用,。
MP3格式壓縮音樂的取樣頻率有很多種,,可以用64kbps或更低的編碼來節(jié)省空間,亦可以用到 320kbps達(dá)到極高的壓縮音質(zhì),。MP3在編碼速率上,,又分為"CBR"(固定編碼),與及“VBR”(可變碼率)技術(shù),,有些手機(jī)無法播放下載來的音樂,,正是因?yàn)闆]有支持“VBR”格式的MP3音樂。
AAC格式
AAC即高級音頻編碼(Advanced Audio Coding),,它采用的運(yùn)算方式是與MP3不同,,AAC可以同時支持多達(dá)48個音軌、15個低頻音軌,、更多種取樣率和傳輸率,、具有多種言語的兼容能力,以及更高的解碼效率,??偨Y(jié)來說,AAC可以在比MP3格式再縮小30%的條件下提供更好的音質(zhì),,而且聲音保真度好,,更接近原音,所以被手機(jī)界視為是最佳的音頻編碼格式,。AAC是一個大家族,,他們是共分為9種規(guī)格,以適應(yīng)不同場合的需要:
(1) MPEG-2AAC LC 低復(fù)雜度規(guī)格 (Low Complexity)
(2) MPEG-2 AAC Main 主規(guī)格
(3) MPEG-2 AAC SSR 可變?nèi)勇室?guī)格 (Scaleable Sample Rate)
(4) MPEG-4 AAC LC低復(fù)雜度規(guī)格(LowComplexity),,現(xiàn)在的手機(jī)比較常見的MP4檔中的音頻部份就包括了該規(guī)格音頻文件
(5) MPEG-4AAC Main 主規(guī)格
(6) MPEG-4 AAC SSR 可變?nèi)勇室?guī)格 (Scaleable Sample Rate)
(7) MPEG-4 AAC LTP長時期預(yù)測規(guī)格(Long Term Prediction)
(8) MPEG-4 AAC LD低延遲規(guī)格(Low Delay)
(9) MPEG-4 AAC HE高效率規(guī)格(High Efficiency
上述的規(guī)格中,,主規(guī)格(Main)包含了增益控制以外的全部功能,其音質(zhì)是最好,,而低復(fù)雜度規(guī)格(LC)則是比較簡單,,沒有了增益控制,但提高了編碼效率,,至于SSR與LC規(guī)格大致相同,,但是多了增益的控制功能,,另外,LTP/LD/HE都是用在低碼率下的編碼,,其中HE采用NeroACC編碼器支持,,是近來常用的一種編碼率方式。不過一般來說,,Main規(guī)格和LC規(guī)格的音質(zhì)相差不大,,因此考慮手機(jī)目前的內(nèi)存仍有限的情況下,目前使用最多的AAC規(guī)格是 LC規(guī)格,。
音頻接口
音頻接口是智能型手機(jī)設(shè)計(jì)者需考慮的重要議題,。數(shù)字語音一般采用PCM(Pulse Code Modulation)接口,,而Hi-Fi立體聲則采用串行I2S(Inter-IC Sound)接口或AC97接口,。I2S是飛利浦公司為數(shù)字音頻設(shè)備之間的音頻數(shù)據(jù)傳輸而制定的一種總線標(biāo)準(zhǔn),是目前消費(fèi)性音頻產(chǎn)品中常用的接口;AC?7則是英特爾公司用于提升個人計(jì)算機(jī)音效,、降低噪音的規(guī)格,,由于在1997年制訂,因此稱為AC97,。
因此,,為特定應(yīng)用而量身定制一套整合性的解決方案是較理想的作法。在SoC的技術(shù)趨勢下,,已有一些廠商將立體聲數(shù)字模擬轉(zhuǎn)換器(DAC)或編譯碼器(CODEC)整合到特定功能的IC當(dāng)中,。不過,有些功能適合整合在一起,,有些則可能得到反效果,。
舉例來說,當(dāng)廠商將電源管理和音頻處理功能整合在一起時,,通常得在音質(zhì)的部分做妥協(xié),,因?yàn)殡娫捶€(wěn)壓器(regulator) 所產(chǎn)生的噪音會干擾到附近的音頻路徑;若將音頻功能整合到數(shù)字IC中也有困難,因?yàn)閷τ贖i-Fi的組件來說,,需要用到0.35mm的工藝來讓混合訊號處理得到最佳化效能,,但目前數(shù)字邏輯方面的應(yīng)用已朝0.18mm以下的更高工藝發(fā)展。以上述兩種整合性的芯片策略來說,,要讓兩種不同的電路同時存在于一個芯片當(dāng)中,,其最終的芯片尺寸可能也會大到難以接受。
此外,,揚(yáng)聲器功率放大機(jī)(louDSPeaker amplifier)特別難被整合,。它所產(chǎn)生的熱是一個問題,需要做散熱處理,,因此往往需要另一顆獨(dú)立的揚(yáng)聲器驅(qū)動IC,。還有一個整合上的常見問題,,也就是為了讓IC盡量做到最小化,可能會產(chǎn)生模擬輸入或輸出接腳數(shù)目不足的問題,。
專屬的音頻IC可避免這些問題,,而音頻整合有好幾種方法可以達(dá)成。共享ADC和DAC能減少硬件成本,,但卻不能同時播放或錄制兩種音頻流格式,。為個別功能安排專用的轉(zhuǎn)換器(converter)可以解決這個問題,不過,,此一作法會增加芯片成本,。折中的作法是只共享ADC的部分,但有獨(dú)立的DAC,,這樣做的話,,當(dāng)電話通信在進(jìn)行時,也同時可以播放其它音頻(如播放另一通電話的鈴聲,,或播放音樂),,但在通信時不能同時進(jìn)行錄音。ADC的耗電可以通過關(guān)掉一種功能,,而以較低取樣速率的方式來加以控制,。因此,為特定應(yīng)用而量身定制一套整合性的解決方案是較理想的作法,。在SoC的技術(shù)趨勢下,,已有一些廠商將立體聲數(shù)字模擬轉(zhuǎn)換器(DAC)或編譯碼器(CODEC)整合到特定功能的IC當(dāng)中。不過,,有些功能適合整合在一起,,有些則可能得到反效果。
舉例來說,,當(dāng)廠商將電源管理和音頻處理功能整合在一起時,,通常得在音質(zhì)的部分做妥協(xié),因?yàn)殡娫捶€(wěn)壓器(regulator) 所產(chǎn)生的噪音會干擾到附近的音頻路徑;若將音頻功能整合到數(shù)字IC中也有困難,,因?yàn)閷τ贖i-Fi的組件來說,,需要用到0.35mm的工藝來讓混合訊號處理得到最佳化效能,但目前數(shù)字邏輯方面的應(yīng)用已朝0.18mm以下的更高工藝發(fā)展,。以上述兩種整合性的芯片策略來說,,要讓兩種不同的電路同時存在于一個芯片當(dāng)中,其最終的芯片尺寸可能也會大到難以接受,。
此外,,揚(yáng)聲器功率放大機(jī)(loudspeaker amplifier)特別難被整合。它所產(chǎn)生的熱是一個問題,,需要做散熱處理,,因此往往需要另一顆獨(dú)立的揚(yáng)聲器驅(qū)動IC,。還有一個整合上的常見問題,也就是為了讓IC盡量做到最小化,,可能會產(chǎn)生模擬輸入或輸出接腳數(shù)目不足的問題,。[next]
專屬的音頻IC可避免這些問題,而音頻整合有好幾種方法可以達(dá)成,。共享ADC和DAC能減少硬件成本,,但卻不能同時播放或錄制兩種音頻流格式。為個別功能安排專用的轉(zhuǎn)換器(converter)可以解決這個問題,,不過,,此一作法會增加芯片成本。折中的作法是只共享ADC的部分,,但有獨(dú)立的DAC,,這樣做的話,當(dāng)電話通信在進(jìn)行時,,也同時可以播放其它音頻(如播放另一通電話的鈴聲,,或播放音樂),,但在通信時不能同時進(jìn)行錄音,。ADC的耗電可以通過關(guān)掉一種功能,而以較低取樣速率的方式來加以控制,。
在計(jì)算機(jī)的音頻需求上,,基本上與消費(fèi)性市場相似,但為了要能播放不同取樣速率(8kHz,、44.1kHz,、48kHz)下錄音的音樂文件,所以需要有更有效率和便宜的解決方案,,而AC97就具有這樣的特性,。在廣義的手持式設(shè)備市場中,三種格式各有其擁護(hù)者:CD,、MD,、MP3隨身聽會采用I2S接口;移動電話會采用PCM接口;具音頻功能的PDA則使用和PC一樣的AC97編碼格式。
音頻系統(tǒng)整合策略
在較早的系統(tǒng)中,,通常是將電話與PDA的電路并排放在這個設(shè)備外殼內(nèi),,其中PCM語音編譯碼由通信處理器來控制,Hi-Fi立體聲(AC?7或I2S) 的處理則連到另一顆應(yīng)用處理器,。在此架構(gòu)中,,兩個音頻子系統(tǒng)之間的整合性還很低,分布式的硬件切換電路除了較占空間,、需要額外的外圍組件來做信號交換和混音外,,也會帶來諧波失真(harmonic distortion)等的問題,。
因此,為特定應(yīng)用而量身定制一套整合性的解決方案是較理想的作法,。在SoC的技術(shù)趨勢下,,已有一些廠商將立體聲數(shù)字模擬轉(zhuǎn)換器(DAC)或編譯碼器(CODEC)整合到特定功能的IC當(dāng)中。不過,,有些功能適合整合在一起,,有些則可能得到反效果。
舉例來說,,當(dāng)廠商將電源管理和音頻處理功能整合在一起時,,通常得在音質(zhì)的部分做妥協(xié),因?yàn)殡娫捶€(wěn)壓器(regulator) 所產(chǎn)生的噪音會干擾到附近的音頻路徑;若將音頻功能整合到數(shù)字IC中也有困難,,因?yàn)閷τ贖i-Fi的組件來說,,需要用到0.35mm的工藝來讓混合訊號處理得到最佳化效能,但目前數(shù)字邏輯方面的應(yīng)用已朝0.18mm以下的更高工藝發(fā)展,。以上述兩種整合性的芯片策略來說,,要讓兩種不同的電路同時存在于一個芯片當(dāng)中,其最終的芯片尺寸可能也會大到難以接受,。
此外,,揚(yáng)聲器功率放大機(jī)(louDSPeaker amplifier)特別難被整合。它所產(chǎn)生的熱是一個問題,,需要做散熱處理,,因此往往需要另一顆獨(dú)立的揚(yáng)聲器驅(qū)動IC。還有一個整合上的常見問題,,也就是為了讓IC盡量做到最小化,,可能會產(chǎn)生模擬輸入或輸出接腳數(shù)目不足的問題。
專屬的音頻IC可避免這些問題,,而音頻整合有好幾種方法可以達(dá)成,。共享ADC和DAC能減少硬件成本,但卻不能同時播放或錄制兩種音頻流格式,。為個別功能安排專用的轉(zhuǎn)換器(converter)可以解決這個問題,,不過,此一作法會增加芯片成本,。折中的作法是只共享ADC的部分,,但有獨(dú)立的DAC,這樣做的話,,當(dāng)電話通信在進(jìn)行時,,也同時可以播放其它音頻(如播放另一通電話的鈴聲,或播放音樂),但在通信時不能同時進(jìn)行錄音,。ADC的耗電可以通過關(guān)掉一種功能,,而以較低取樣速率的方式來加以控制。
以下針對音頻系統(tǒng)中的幾個重要組成進(jìn)行規(guī)劃上的分析:
頻率與接口
共享通信與應(yīng)用子系統(tǒng)的內(nèi)部電路雖然可行,,但對于接口來說并非如此,,因?yàn)椴煌囊纛l應(yīng)用得在獨(dú)立的頻率區(qū)域中以自己的頻率來運(yùn)作。只要情況仍是如此,,整合性智能型手機(jī)的CODEC就需要同時有PCM接口和獨(dú)立的I2S或AC97連結(jié)接口,。
在非移動性的設(shè)備(如PC)中,音頻頻率通常由一個石英振蕩器(crystal oscillator)來產(chǎn)生,,但在智能型手機(jī)的設(shè)計(jì)中,,為了避免額外的耗電、板面空間和頻率芯片的成本,,設(shè)計(jì)者偏向于將Hi-Fi音頻所需的頻率功能從既有的頻率中獨(dú)立出來,。由于低耗電、低噪音的鎖相回路(PLL)能被以相對較低成本整合到混合訊號芯片當(dāng)中,,所以今日芯片廠商的作法是將一顆或兩顆PLL 整合到他們的智能型手機(jī)CODEC中,。
麥克風(fēng)
在智能型手機(jī)中最難的設(shè)計(jì)議題,往往與麥克風(fēng)(Mic)有關(guān),。一般來說至少有兩個麥克風(fēng)需要考慮:一是內(nèi)建的內(nèi)部麥克風(fēng)和插入耳機(jī)(headset)的外部麥克風(fēng),。此外,可能還會有用于噪音消除(noise cancellation)或立體聲錄音的額外內(nèi)部麥克風(fēng),,以及車用免提功能所需要的另一個外部麥克風(fēng),。除了講話外,這些麥克風(fēng)也能透過應(yīng)用處理器的控制來錄制語音短訊或視頻短片中的音效,。
若要由音頻CODEC芯片來涵蓋各種切換功能,此芯片的電路需要做好妥善的設(shè)計(jì),。除了錄音功能,,CODEC也應(yīng)提供側(cè)音(side tone)的功能,這樣一來耳機(jī)用戶也能聽到自己的聲音,。插入偵測功能則能提供無縫的切換功能,,也就是當(dāng)耳機(jī)插入或拔出時,系統(tǒng)會自動轉(zhuǎn)換使用內(nèi)部或外部的耳機(jī),。
人聲(acoustic)的噪噪音消除是另一個問題,,它需要用到兩個麥克風(fēng),一個同時接收講話的聲音和背景噪音,,另一個則只接收背景噪音,。模擬的作法往往不足夠,因此需要透過數(shù)字信號處理來加強(qiáng),而音頻CODEC需達(dá)成兩個麥克風(fēng)訊號的數(shù)字化任務(wù),。
另一個問題是室外風(fēng)聲噪印的問題,,它的頻率通常低于200Hz,因此透過高通(high-pass)濾波器就能處理掉,,但這樣一來,,在室內(nèi)錄音時就少了低頻部分的聲音。對于兩用的麥克風(fēng)來說,,這個過濾器應(yīng)該是可選用的,,但很多的音頻ADC中都已內(nèi)建了這顆high-pass濾波器,因此,,手機(jī)廠商應(yīng)針對需求選擇合用的解決方案,。
外接耳機(jī)
手機(jī)外接耳機(jī)(headset/headphone)的使用也需要特殊的模擬電路,也就是當(dāng)耳機(jī)插入時,,音頻輸出信號就能繞徑到耳機(jī)上頭,。雖然整合機(jī)械性開關(guān)的插槽(socket)能夠滿足此要求,但它的尺寸過大且昂貴;此外,,揚(yáng)聲器的音量大小可能也不適合這個耳機(jī),。為內(nèi)部與外部音頻提供獨(dú)立的音量控制可以解決此問題,而且也能使用較簡單的插槽設(shè)計(jì),。這一外接耳機(jī)是否具有麥克風(fēng)也需要被偵測出來,,這可以通過是否感測到偏流(bias current)來分辨,如果沒有電流流動,,那就表示沒有麥克風(fēng)被插入,。智能型手機(jī)的音頻CODEC中應(yīng)加入這一電流傳感器,進(jìn)而能因應(yīng)不同情況達(dá)成音頻輸入輸出的處理,。
揚(yáng)聲器
智能電話在先后增加了多音調(diào)振鈴,、MP3播放及FM廣播等功能后,其播音系統(tǒng)也朝向立體聲揚(yáng)聲器來發(fā)展,。在手機(jī)揚(yáng)聲器的設(shè)計(jì)上,,主要的問題是配置架構(gòu)、功率與耗電性的考慮,。若要支持立體聲,,手機(jī)需要有兩個外部揚(yáng)聲器,但由于手機(jī)體積太小,,這兩個揚(yáng)聲器的位置難以拉開,,所以立體聲的效果不易展現(xiàn),這時就需要采用特殊的3D效果處理,。若是要支持免持聽筒的功能,,那就需要連結(jié)到另一個較大的揚(yáng)聲器上。為個別揚(yáng)聲器提供專屬的模擬輸出是最好的方式,但電源管理上必須有相應(yīng)改變,。
由于揚(yáng)聲器功率放大器會用掉大量的供電,,當(dāng)它們不使用時關(guān)掉電源是很重要的。智能型手機(jī)的音頻CODEC能提供一些電源管理功能,,為個別揚(yáng)聲器的輸出做好開關(guān)管理,,這樣一來能避免不需要的電源消耗。此外,,系統(tǒng)電源管理方案中的電壓穩(wěn)壓器通常無法為揚(yáng)聲器提供達(dá)到最大音量所需的功率,,因此CODEC芯片廠商采用加入芯片內(nèi)揚(yáng)聲器的作法,也就是直接通過電池來驅(qū)動揚(yáng)聲器,。這樣做雖然不見得能降低耗電,,但它也省下了對額外電壓穩(wěn)壓器的需求。
鈴聲
近幾年來,,手機(jī)鈴聲愈來愈復(fù)雜,,從單純的響鈴,到和弦鈴聲,,再到各種聲音都能制作成立體聲的WAV和MP3格式,。MIDI已成了和弦鈴聲的標(biāo)準(zhǔn)格式,很多廠商為這一應(yīng)用推出專屬的低耗電MIDI芯片,。要在音頻次系統(tǒng)中整合MIDI芯片,,CODEC上需要有額外的模擬輸入。
這些額外的輸入對于FM收音機(jī)IC的連結(jié)也是有用的,,能為多媒體應(yīng)用提供附加功能,。MIDI音頻的產(chǎn)生當(dāng)然也能由音頻CODEC來產(chǎn)生,但現(xiàn)今市場的趨勢是以特殊的鈴聲文件來儲存,,并通過現(xiàn)存的Hi-Fi DAC來播放,,欠缺MIDI軟件庫的CODEC芯片廠商并不會積極去做這件事情。
結(jié)語
智能型手機(jī)的下一步會如何?就Hi-Fi的立體聲來說,,儼然已是必備的系統(tǒng)功能,,至于I2S與AC97在手機(jī)音頻系統(tǒng)上的競爭仍然會繼續(xù)下去。有些人喜歡較單純的I2S界面,,但也有人更中意低引腳數(shù)和很容易可跑不同取樣速率的AC97。以智能型手機(jī)來說,,目前多數(shù)低耗電的處理器對兩種規(guī)格都支持,,看來兩者還是會并存下去。不過,,對于CODEC的廠商來說,,要同時支持兩項(xiàng)規(guī)格是比較困難的,因?yàn)锳C97的VRA(variable rate audio)功能需要和I2S不同的頻率架構(gòu),也需要多出許多額外的數(shù)字電路才能做到,。
不過,,智能型手機(jī)還會不會如PC世界一樣,從立體聲走向多聲道的環(huán)繞音效格式(Intel的Azalia)呢?在近期內(nèi)還看不出這樣的可能性,,因?yàn)榻袢盏亩嗦暤佬Чm然很炫,,但芯片的成本和耗電性都還太高,這不是手機(jī)世界所能接受的,。但今日否定的答案,,在未來的電子世界仍存在很大的變量,沒有人能說得準(zhǔn)的,。