摘 要: 同步實現(xiàn)對于OFDM基帶接收系統(tǒng)而言至關(guān)重要,對于面向移動多媒體的基帶芯片設(shè)計,同步的性能和低功耗設(shè)計更是很大的挑戰(zhàn)。結(jié)合中國移動多媒體廣播系統(tǒng)(CMMB)幀結(jié)構(gòu),、調(diào)制及其傳輸信道的特征,,提出了適用于多徑衰落信道,、高載波頻偏環(huán)境下的OFDM系統(tǒng)時間和載波頻率同步方案,,并在硬件實現(xiàn)中從算法優(yōu)化,、硬件構(gòu)架設(shè)計兩個方面進一步降低同步功耗。
關(guān)鍵詞: CMMB,; OFDM,; 同步; 低功耗
?
中國的CMMB(中國移動多媒體廣播)規(guī)范以中國的自有技術(shù)STiMi為基礎(chǔ),,現(xiàn)已成為中國手機電視的行業(yè)標(biāo)準,。CMMB系統(tǒng)幀結(jié)構(gòu)[1]如圖1所示,物理層信號為1 S/s,,劃分為40個時隙,,每個時隙的長度為25 ms,包括一個信標(biāo)和53個OFDM符號,,其中信標(biāo)由發(fā)射機標(biāo)識信號以及兩個相同的同步信號序列組成,。該系統(tǒng)載波頻率為2.6 GHz,帶寬10 MHz,,每個OFDM符號包括4 096個子載波,,其中包含82個連續(xù)導(dǎo)頻信號和384個離散導(dǎo)頻信號。CMMB系統(tǒng)物理層調(diào)制方式采用正交頻分復(fù)用(OFDM)結(jié)構(gòu),,OFDM調(diào)制利用許多并行的,、傳輸?shù)退俾蕯?shù)據(jù)的子載波來實現(xiàn)高速率的通信,它具有能有效抵抗信道的頻率選擇性衰落和脈沖噪聲的優(yōu)點,。然而,,OFDM系統(tǒng)對于多普勒(Doppler)頻移以及載波振蕩器的不穩(wěn)定引起的頻率偏移十分敏感,由于頻率偏移將破壞OFDM系統(tǒng)子載波之間的正交性,,引起載波間干擾(ICI),,并且,隨著頻率偏移的增加,,誤碼率(BER)性能惡化加劇,。此外,多徑衰落也將使傳輸信號發(fā)生畸變,,從而惡化系統(tǒng)性能,。因此,系統(tǒng)的時間同步,、頻率同步成為CMMB數(shù)字接收機設(shè)計的關(guān)鍵,。
?
?
由于基帶芯片面向移動手持終端,因此在同步的算法選擇和硬件框架結(jié)構(gòu)上必須考慮功耗的影響,,應(yīng)該盡量選擇低功耗算法和低復(fù)雜度硬件結(jié)構(gòu),;本文在同步設(shè)計中為了進一步降低同步功耗,,將優(yōu)化傳統(tǒng)算法和硬件結(jié)構(gòu)。
1 CMMB系統(tǒng)同步設(shè)計概述
本系統(tǒng)設(shè)計的幀同步及頻率同步均在時域中完成[2],,算法利用信標(biāo)中的兩個相同長度的同步序列的相關(guān)性,。由于系統(tǒng)的載波頻率較高,接收端與發(fā)射端晶振微小的不匹配將引入較大的頻率偏差,,這會影響同步的性能,,因此在設(shè)計幀同步時使用無數(shù)據(jù)輔助(粗同步)+數(shù)據(jù)輔助(精同步)的方案[3],同步結(jié)構(gòu)算法框圖如圖2所示,。
?
(1) 利用無數(shù)據(jù)輔助的方法,,利用信標(biāo)中兩個相同重復(fù)的2 048點OFDM同步信號之間的相關(guān)性,以4 096點為窗長,,窗內(nèi)的前2 048點與后2 048點做相關(guān)運算,,搜索峰值可以求出OFDM符號開始的位置,并且利用所求出的峰值可以求出小數(shù)倍載波間隔頻率的頻偏估計,;
(2) 在時間域中完成小數(shù)倍頻偏[4]和整數(shù)倍頻偏的估計并通過NCO進行補償,;
(3) 利用本地已知的2 048點同步信號,與接收到的數(shù)據(jù)在小范圍(一個保護間隔長度)搜索滑窗求相關(guān),,用閾值方法找到多徑的第一徑,從而找到FFT窗的精確位置,。
2 CMMB系統(tǒng)粗同步設(shè)計
2.1 常規(guī)滑窗相關(guān)硬件結(jié)構(gòu)
在CMMB系統(tǒng)中,,需要同步信號間卷積相關(guān):
這樣需要一塊2 048×26(實部虛部各13位存儲在同一地址中)的RAM存儲接收到的信號,以延遲2 048后和新進入數(shù)據(jù)做相關(guān)運算,;此外還需要一塊2 048×40的RAM存儲卷積后結(jié)果的實部和虛部以進行相關(guān)運算結(jié)果的累加運算,,前2 048個相關(guān)運算結(jié)果存儲在RAM中,第2 049個相關(guān)運算結(jié)果存儲在第0地址前,,先將和減去第0地址中原有的相關(guān)運算結(jié)果,,再加上新的相關(guān)運算結(jié)果,并將新的相關(guān)運算結(jié)果存儲在第0地址中[5],,RAM的其他地址讀寫以此類推,,即:
new即新進入的相關(guān)運算結(jié)果。
RTL設(shè)計完后采用0.13 μm SMIC庫進行Design Compiler綜合,,工作時鐘為80 MHz,,綜合結(jié)果如表1所示。
由表1中的結(jié)果可以看出,RAM讀寫功耗占整個粗同步模塊的功耗的比例很大,,因此需要用新的算法以減少粗同步模塊RAM的大小,,從而減小系統(tǒng)粗同步的功耗。
2.2 改進的粗同步硬件結(jié)構(gòu)
參考文獻[5]提出了設(shè)計一個低通濾波器代替圖3中相關(guān)運算結(jié)果的累加運算部分,,見圖4所示,。
該算法用一個乘法器代替了傳統(tǒng)算法中的RAM,,系數(shù)w經(jīng)仿真選為1-2^-9。仿真以估計位置和理想位置的距離作為評價標(biāo)準,,即(delta=pos-pos_ideal),,系統(tǒng)仿真如圖5所示,仿真環(huán)境:典型動態(tài)多徑,,0.001%載波頻偏,,150 Hz多普勒頻移。
?
由圖5可以看出,,當(dāng)信噪比下降到6 dB以下,,即delta<0,粗同步位置進入symbol內(nèi),,引起ISI干擾,,會造成系統(tǒng)性能的惡化,因此同步失??;當(dāng)信噪比大于6 dB時同步位置在CP內(nèi),雖然該算法與傳統(tǒng)累加運算算法相比,,誤差比較大,,但是完全可以容忍,不會造成系統(tǒng)惡化(最終誤碼率在10-6以下),。RTL設(shè)計中,,傳統(tǒng)方法的2 048×40的RAM由兩個20×10的乘法器替代,完成后RTL設(shè)計后采用0.13 μm SMIC庫進行Design Compiler綜合,,工作時鐘為80 MHz,,綜合結(jié)果如表2所示。對比表2和表1,,可以得出結(jié)論:改進的算法硬件比傳統(tǒng)的累加結(jié)構(gòu)的硬件的功耗降低3.2 mW,,這樣可以降低系統(tǒng)在粗同步時所消耗的功耗,這對于面向手持設(shè)備的基帶芯片而言是極其重要的,。
3 CMMB系統(tǒng)整數(shù)倍頻偏估計和精同步硬件設(shè)計
由于整數(shù)倍頻偏估計和精同步都需要用到本地已知同步序列,,因此將這兩個算法放入同一硬件模塊中,復(fù)用存儲本地已知同步序列的ROM,。
3.1 整數(shù)倍頻偏估計
CMMB系統(tǒng)整數(shù)倍頻偏估計在時域中完成,,其算法主要應(yīng)用同步序列:
但是在實際硬件設(shè)計中,需要計算e-j2πmfk,,可以說給硬件設(shè)計帶來了很大的麻煩,,尤其是K在0~2 048中變化,這樣每完成一次m的計算,,需要計算ee-j2πmfk共2048次,,需要耗費大量功耗與時間,,本文設(shè)計該硬件模塊時,將計算公式打開,,首先假設(shè)m固定:
這樣可以發(fā)現(xiàn),,式中惟一的指數(shù)為e-j2πmfk,而不再隨著k的變化而變化了,,這就是該模塊設(shè)計的核心思想,。
從公式中可以得出所需要的硬件代價:
(1)RASP2048X26M16,RAM用來存儲收到的同步信號的實部和虛部,;
(2)DROM2048X24M8,,ROM用來存儲已知的同步序列實部和虛部;
(3)e-j2πmfk值在該模塊設(shè)計中采用查找表的方式,,用ROM存儲e-j2πmfk(m=-max,…max),因為e-j2πmfk的值比較小,,所以需要較大位寬進行存儲,實部和虛部分別用22 bit表示,本模塊設(shè)計中max=5,,因此需要DROM64X44M8(0.13 μm SMIC庫ROM地址只能是2n,,該DROM可以擴展存儲到-32~32掃頻范圍);
(4)另外還需要開銷乘法器:2個13×12的乘法器和2個22×22的乘法器分別計算實部和虛部。
硬件結(jié)構(gòu)如圖6所示,。
插入兩個寄存器,,進行兩級pipeline結(jié)構(gòu),即13×12乘法器和22×22乘法器流水運算,,從而加快整數(shù)倍頻偏估計的速度并且減小硬件功耗,。
3.2 精同步硬件實現(xiàn)
精同步的算法即如何尋找多徑的第一徑。其算法是利用完成頻偏補償后的同步序列和已知同步序列相關(guān)求峰值的思想,。
假設(shè)粗同步誤差為2,即同步位置偏移實際位置兩個子載波,,仿真環(huán)境為典型動態(tài)多徑信道,,利用精同步算法可以得到圖7所示的峰值。
可以清楚地看出多徑間徑的關(guān)系,,本文算法和硬件實現(xiàn)時將搜索范圍定為[-100,100],,在該范圍內(nèi)所有相關(guān)值求平均后,用64*mean作為閾值進行判斷,,可以找出位置2處的峰值,,從而找到幀起始的精確位置。
在硬件設(shè)計上,,該模塊與整數(shù)倍頻偏估計算法共用一個模塊,,該模塊中有兩塊RAM:
(1)RASP2272X26:該RAM首先使用前2 048 X26存儲粗同步和小數(shù)倍頻偏補償后的同步序列的實部和虛部,該序列與本地已知同步序列相關(guān)求出整數(shù)倍頻偏估計,;
完成整數(shù)倍頻偏補償后,,將使用2 248 X26存儲粗同步序列位置前后100子載波范圍內(nèi)的數(shù)據(jù)的實部和虛部,,存儲后該序列以2 048為窗與本地已知序列求相關(guān)運算。
(2)RASP224X24M16:該RAM用來存儲精同步相關(guān)運算后的201個相關(guān)值的能量,,用來求均值和判斷精同步位置,。
此外模塊中還有兩塊ROM:
(1)DROM64X44M8:存儲e-j2πmfk,用來計算整數(shù)倍頻偏估計,,這在上一小節(jié)中有詳細說明,,該方法可以降低RASP2272X26的讀寫次數(shù),提高整數(shù)倍頻偏估計的速度,。
(2)DROM2048X24M8: 存儲本地已知同步序列,。
此外乘法器也共用13×12乘法器和22×22乘法器。
完成RTL設(shè)計后采用0.13 μm SMIC庫進行Design Compiler綜合,,工作時鐘為80 MHz,,綜合結(jié)果如表3所示。
4 NCO硬件設(shè)計
NCO硬件為了補償載波頻偏給系統(tǒng)帶來的惡化,,該模塊硬件主要由16級流水的cordic算法[6]實現(xiàn),綜合結(jié)果見表4,。
本文提出了適用于多徑衰落信道、高載波頻偏環(huán)境下的CMMB基帶接收系統(tǒng)時間和載波頻率同步方案,,并在硬件實現(xiàn)中從算法優(yōu)化,、硬件構(gòu)架設(shè)計兩個方面進一步降低同步硬件功耗。
參考文獻
[1]?CMMB廣播信道幀結(jié)構(gòu),、信道編碼和調(diào)制.
[2] ZHAO Xiang, LIM M S. A novel cyclic-shifted preamble scheme for symbol synchronization based on OFDM?WLANs.ICACT,2006:919-922.
[3] FORT A, WEIJERS J W, DERUDDER V, et al. A?performance and complexity comparison of auto-correlation?and across-correlation for OFDM burst synchronization.?ICASSP 2003: 341-344.
[4]?YU Zh.H.,CHEN Kai,HUANG Yu Mei, et al. OFDM?timing and frequency offset estimation based on repeated?training sequence. Wireless Communications, Networking?and Mobile Computing, 2007. WiCom 2007. International?Conference on Volume,Issue,21-25 Sept. 2007:264-266.
[5] ZHENG Hua Rong,TANG Jue, SHEN Bo. Low-complexity
?joint synchronization of symbol timing and carrier frequency
?for OFDM systems. IEEE Transaction on Consumer
?Electronics,2006,52:317-320.
[6] ?DAWID H, MEYR H. VLSI implementation of the cordic
?algorithm using redundant arithmetic.1992 IEEE:1089-1092.