《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 設(shè)計(jì)應(yīng)用 > 基于LTE/4G的新型處理器架構(gòu)滿足無(wú)線處理的需求
基于LTE/4G的新型處理器架構(gòu)滿足無(wú)線處理的需求
摘要: 全球移動(dòng)設(shè)備供應(yīng)商協(xié)會(huì)(GSA)2010年4月的報(bào)告指出,,全球已有31個(gè)國(guó)家承諾將部署64個(gè)LTE網(wǎng)絡(luò),,預(yù)計(jì)到2010年底將有22個(gè)LTE網(wǎng)絡(luò)交付使用,,截止2011年年底將有39個(gè)或更多LTE網(wǎng)絡(luò)交付使用,;總計(jì)88個(gè)運(yùn)營(yíng)商已經(jīng)承諾將在42個(gè)國(guó)家部署LTE系統(tǒng),,有的已經(jīng)開(kāi)始進(jìn)行測(cè)試或進(jìn)行其他規(guī)劃活動(dòng),。
Abstract:
Key words :

 引言

  為了讓現(xiàn)今的無(wú)線蜂窩網(wǎng)絡(luò)滿足日益增長(zhǎng)的無(wú)線數(shù)據(jù)處理需求,全球加速向LTE/4G遷移的趨勢(shì)已經(jīng)日益明顯,。LTE或3.9G通過(guò)采用更有效的傳輸技術(shù)來(lái)提升數(shù)據(jù)速率,,下一步,4G要提升到更高數(shù)據(jù)率,,LTE,、4G基礎(chǔ)設(shè)施給半導(dǎo)體供應(yīng)商提出的挑戰(zhàn)是要用數(shù)字信號(hào)處理器(DSP)來(lái)滿足更高的數(shù)據(jù)處理需求,這些新型DSP的性能要比我們今天所用的DSP高出幾個(gè)數(shù)量級(jí),!

  全球移動(dòng)設(shè)備供應(yīng)商協(xié)會(huì)(GSA)2010年4月的報(bào)告指出,,全球已有31個(gè)國(guó)家承諾將部署64個(gè)LTE網(wǎng)絡(luò),預(yù)計(jì)到2010年底將有22個(gè)LTE網(wǎng)絡(luò)交付使用,,截止2011年年底將有39個(gè)或更多LTE網(wǎng)絡(luò)交付使用;總計(jì)88個(gè)運(yùn)營(yíng)商已經(jīng)承諾將在42個(gè)國(guó)家部署LTE系統(tǒng),,有的已經(jīng)開(kāi)始進(jìn)行測(cè)試或進(jìn)行其他規(guī)劃活動(dòng),。

  半導(dǎo)體產(chǎn)業(yè)商機(jī)巨大但挑戰(zhàn)并存,LTE的性能需求是現(xiàn)今3G網(wǎng)絡(luò)性能需求的100到1000倍,!相比目前在3G使用的CDMA無(wú)線技術(shù),,LTE采用的OFDMA技術(shù)采用多天線信號(hào)處理可以實(shí)現(xiàn)更高的頻譜效率,并可以支持更寬的頻譜。不過(guò),,OFDMA技術(shù)也更為復(fù)雜,,需要的計(jì)算量比CDMA技術(shù)大得多。如圖1所示,,從GSM遷移到UMTS/HSDPA再遷移到LTE,,計(jì)算量需求要提升4、5個(gè)數(shù)量級(jí)――從大約10個(gè)MOPS(每秒百萬(wàn)次運(yùn)算)提高到10萬(wàn)甚至1百萬(wàn)MOPS,,如此才可以提供LTE所要求的10到100 Mbps數(shù)據(jù)傳輸性能,。

 

從GSM遷移到UMTS/HSDPA再到LTE,計(jì)算量需求要提升4,、5個(gè)數(shù)量級(jí)

 

  圖1,、從GSM遷移到UMTS/HSDPA再到LTE,計(jì)算量需求要提升4,、5個(gè)數(shù)量級(jí)

  LTE還采用了先進(jìn)的多天線信號(hào)處理技術(shù),,涉及到兩種最流行的技術(shù)MIMO(多輸入多輸出)編程和波束形成,同樣,,這也都是高度密集計(jì)算型應(yīng)用,,需要新一代優(yōu)化的專用DSP解決方案。

  1 所需的DSP性能達(dá)到新高

  LTE的運(yùn)算處理要求如此巨大,,因此對(duì)DSP的性能提升要求也是巨大的 ――單個(gè)通用DSP不能滿足這樣的性能需求,,我們需要多顆DSP來(lái)實(shí)現(xiàn)LTE系統(tǒng),而且這些DSP必須非常高效,。以往的“通用”DSP將無(wú)法滿足數(shù)據(jù)處理要求,。半導(dǎo)體供應(yīng)商和IP供應(yīng)商都在努力打造全新一代DSP,其性能可以滿足運(yùn)營(yíng)商新建基礎(chǔ)設(shè)施的需求,。

  要開(kāi)發(fā)這些新的DSP,,我們所面臨的挑戰(zhàn)是難以想像的,它無(wú)法通過(guò)提升DSP時(shí)鐘頻率來(lái)實(shí)現(xiàn)――這樣做會(huì)大幅增加功耗,。我們需要針對(duì)運(yùn)算任務(wù)優(yōu)化的全新架構(gòu),,這不僅意味著硬件層面的開(kāi)發(fā),也需要開(kāi)發(fā)配套的軟件――因?yàn)樵絹?lái)越多的處理正在通過(guò)軟件來(lái)完成,。

  早期在開(kāi)發(fā)軟件定義無(wú)線電(SDR)方面的嘗試令人失望,,因?yàn)樗麄兇蠖嗷趩我坏腄SP,其性能無(wú)法跟上運(yùn)算需求的增長(zhǎng),。而將密集運(yùn)算交給RTL模塊的方法從根本上違背了軟件無(wú)線電的初衷,,因?yàn)镽TL模塊是不可編程的。然而我們可以用多顆DSP處理器來(lái)實(shí)現(xiàn)無(wú)線射頻系統(tǒng)――多顆針對(duì)不同任務(wù)進(jìn)行優(yōu)化設(shè)計(jì)的專用DSP,。這些全新定制的專用DSP內(nèi)核在設(shè)計(jì)之初就是從整個(gè)系統(tǒng)的角度出發(fā),,完全可以滿足LTE的運(yùn)算性能需求。

  2 所需的處理類型

  一個(gè)典型的現(xiàn)代通信收發(fā)機(jī)可以劃分為三個(gè)計(jì)算域:

  信號(hào)域:實(shí)現(xiàn)復(fù)數(shù)或?qū)崝?shù)數(shù)據(jù)的優(yōu)化運(yùn)算,包括FFT,、濾波,、同步以及矩陣運(yùn)算等靠近系統(tǒng)中RF一側(cè)的運(yùn)算。

  比特軟值域(soft bit domain):包括從軟件解映射模塊到前向糾錯(cuò)(FEC)解碼模塊等靠近接收端MAC一側(cè)的運(yùn)算,。

  比特域:通常是在發(fā)送端靠近MAC一側(cè),,包括CRC編碼、加擾,、FEC編碼和比特交織等操作,。

  這三種根本不同的計(jì)算需求需要不同類型的DSP內(nèi)核(IP內(nèi)核是必要的,因?yàn)閺墓暮兔娣e效率的角度看,,所有這些功能必須在單芯片而不是分開(kāi)的芯片上實(shí)現(xiàn)),。

  3 LTE基帶子系統(tǒng)分析

  圖2展示了一個(gè)LTE基帶子系統(tǒng)的功能模塊圖。該圖上方顯示了LTE接收端的信號(hào)處理通道,。有天線連接到接收端RF模塊,,它很可能是MIMO配置的多天線系統(tǒng)。RF接收模塊將信號(hào)輸出到前端濾波模塊,,該模塊驅(qū)動(dòng)隨后的OFDM信道估計(jì)和MIMO檢測(cè)模塊,,這個(gè)模塊將來(lái)自多天線的信號(hào)合并起來(lái)而且可以改善接收端的帶寬和信號(hào)保真度,信號(hào)合并后會(huì)進(jìn)行復(fù)數(shù)的解調(diào),,然后是前向糾錯(cuò),,最終直接給LTE MAC層提供用于高層協(xié)議處理的比特流。在發(fā)射端,,來(lái)自MAC層的比特流通過(guò)卷積編碼以及各種頻域變換后,、輸出整形,然后送給發(fā)射端RF模塊,、功率放大器和天線,。

LTE基帶模塊方框圖
  圖2 LTE基帶模塊方框圖

  針對(duì)LTE的ConnX ATLAS參考架構(gòu)

  ConnX ATLAS參考架構(gòu)是專為滿足從RF一側(cè)的前端濾波到MAC一側(cè)的傳輸模塊處理需求而開(kāi)發(fā)的,ATLAS參考架構(gòu)基于LTE 的UE CAT-4系統(tǒng),,支持一個(gè)發(fā)射天線,,兩個(gè)接收天線和20MHz帶寬。也可以提供 10MHz及5MHz的ATLAS系統(tǒng),。圖3為ConnX ATLAS UE(用戶設(shè)備)的功能方框圖,。

 

ATLAS LTE用戶設(shè)備方框圖

  圖3 ATLAS LTE用戶設(shè)備方框圖

  接收鏈路(圖3底端)接收來(lái)自前端濾波器的數(shù)據(jù)并為MAC生成傳輸數(shù)據(jù)塊,它包含控制器和三個(gè)計(jì)算域:信號(hào)處理域(接收信號(hào)處理器或RxSP),、矩陣處理域(接收信道處理器或RxChP)以及比特軟值域(接收混合ARQ 處理器或者叫 RxHARQ,、Turbo引擎和接收控制處理器或者叫RxCP)

  所有這些DSP包括Turbo 引擎,都可以用Tensilica公司的Xtensa可定制處理器技術(shù)實(shí)現(xiàn),,從而針對(duì)特定的任務(wù)進(jìn)行優(yōu)化,。利用可配置技術(shù)還可以同時(shí)創(chuàng)建功能齊全的配套軟件工具鏈,所以不需要把時(shí)間浪費(fèi)在開(kāi)發(fā)不同DSP的基本指令集仿真器,、調(diào)試器方面,。

  Tensilica公司的基帶引擎ConnX BBE16是構(gòu)成RxSP和RxChP的基礎(chǔ),該ConnX BBE16是一個(gè)128位,、3發(fā)射,、16MAC的數(shù)字信號(hào)處理器,能夠在單周期內(nèi)完成多個(gè)復(fù)數(shù)乘法運(yùn)算和一個(gè)復(fù)數(shù)基-4FFT運(yùn)算,。RxSP為每個(gè)符號(hào)產(chǎn)生源數(shù)據(jù)塊并進(jìn)行信道估計(jì),。源數(shù)據(jù)塊會(huì)立即寫入接收鏈路中的下一個(gè)處理器RxChP的輸入緩沖區(qū),RxChP執(zhí)行MIMO解碼,,并產(chǎn)生比特軟值給HARQ模塊,。

  RxHARQ處理器接受解碼后的比特軟值,并將它們合并為合適的冗余版本,,接著執(zhí)行HARQ重組以產(chǎn)生碼塊,,碼塊被寫入Turbo解碼器的輸入緩沖區(qū),完成解碼后又被寫入RxCP的輸入緩沖區(qū),。

  RxCP是主控制器,,執(zhí)行休眠控制和電源管理。它對(duì)信道頭進(jìn)行解碼以便配置收發(fā)鏈路正常工作,,它還為MAC處理器提供了控制和數(shù)據(jù)接口,。

  4 ATLAS發(fā)射鏈路

  發(fā)射鏈路包括兩個(gè)計(jì)算域和兩個(gè)處理器,發(fā)射位處理器(TxBP)和發(fā)射信號(hào)處理器(TxSP),。

  TxBP執(zhí)行CRC編碼,、加擾、Turbo編碼,、子塊交織,、速率匹配和物理上行控制通道編碼。針對(duì)這一過(guò)程,,Tensilica開(kāi)發(fā)了一種比特流處理器(ConnX BSP3),,它是一個(gè)32位DSP,增加了一些特殊指令,,用于CRC,、Turbo編碼和交織運(yùn)算的加速。

  TxSP接收編碼后的比特流,,并產(chǎn)生相應(yīng)的SC–FDMA符號(hào),,它們?cè)偬峁┙o前端濾波器用于上變頻和MASK兼容, TxSP用Tensilica的BBE16 DSP實(shí)現(xiàn),,執(zhí)行CRC編碼,、位加擾,、Turbo編碼、格雷碼編碼,、RB映射,、層映射、DRT,、FFT和運(yùn)營(yíng)商附加的前綴匹配運(yùn)算等,。

  5 基于同一架構(gòu)的多核體系

  ATLAS參考架構(gòu)的優(yōu)勢(shì)在于,所有的內(nèi)核都基于Tensilica的Xtensa處理器架構(gòu),。這意味著所有內(nèi)核可以共享相同的基本指令集,,并使用相同的開(kāi)發(fā)工具。這樣就簡(jiǎn)化了整個(gè)設(shè)計(jì)工作,,并可以將培訓(xùn)成本降到最低,。

  采用多核方案實(shí)現(xiàn)LTE系統(tǒng),因?yàn)槊總€(gè)DSP內(nèi)核是針對(duì)不同任務(wù)專門優(yōu)化的,,所以可以獲得LTE所需的最大效率和性能,。ATLAS架構(gòu)專為模塊化設(shè)計(jì)而開(kāi)發(fā),通過(guò)增減不同類型的處理器,,它可以很容易擴(kuò)展為不同性能級(jí)別的產(chǎn)品,。由于處理器能夠進(jìn)一步定制,所以設(shè)計(jì)人員可以貫徹Tensilica公司的設(shè)計(jì)理念并將其進(jìn)一步發(fā)揚(yáng)光大,,以更好地匹配他們的性能,、功耗和成本預(yù)算,或者更好地實(shí)現(xiàn)他們的獨(dú)特算法,。

  使用小型定制處理器的優(yōu)勢(shì)是,,如果不需要這部分處理能力的時(shí)候,該內(nèi)核和它使用的存儲(chǔ)器都可以關(guān)斷(與3G和3.5G中的設(shè)計(jì)類似,,在這些設(shè)計(jì)*耗是最受關(guān)注的),,這有助于將功耗保持在最低水平。一個(gè)優(yōu)化的多核架構(gòu)可以允許使用更小,、更低功耗的內(nèi)核而無(wú)需提升系統(tǒng)頻率,。

  針對(duì)LTE系統(tǒng)中的關(guān)鍵運(yùn)算定制DSP,還可以提高設(shè)計(jì)人員的工作效率,。由于所有處理器都基于Tensilica的Xtensa可配置處理器內(nèi)核,,它們使用相同的軟件工具鏈。編譯器,、調(diào)試器,、ISS等都可以識(shí)別和利用定制的硬件并提高軟件的開(kāi)發(fā)效率。

  多顆DSP串行連接的方式也非常適合LTE無(wú)線算法中的數(shù)據(jù)流處理方式,。因?yàn)橐环N算法只運(yùn)行在一個(gè)內(nèi)核上,,所以軟件編程模型和調(diào)試都變得更加方便,,多顆處理器之間的數(shù)據(jù)傳輸不是基于全局共享總線,而是專門的點(diǎn)對(duì)點(diǎn)連接,,因此數(shù)據(jù)無(wú)需總線仲裁就可以快速地加載進(jìn)其他DSP的存儲(chǔ)器中,。此外,與典型的基于總線的系統(tǒng)相比,,也不會(huì)因?yàn)楦嗵幚砥鲯斓娇偩€上而降低性能。

  6 復(fù)雜的LTE軟件

  LTE系統(tǒng)中的軟件也相當(dāng)復(fù)雜,,需要真正了解需求的專業(yè)軟件供應(yīng)商提供,,Tensilica公司一直與mimoOn合作,該公司因軟件專長(zhǎng)而倍受產(chǎn)業(yè)推崇,,mimoOn開(kāi)發(fā)了LTE的物理層軟件堆棧優(yōu)化程序,,可以讓采用ATLAS架構(gòu)的專用Tensilica DSP發(fā)揮最高性能。

  7 完整LTE L1 PHY的實(shí)現(xiàn)

  ConnX的ATLAS LTE的參考架構(gòu)實(shí)現(xiàn)了完整的LTE的L1物理層設(shè)計(jì),,包括了運(yùn)算量要求極大的Tubro解碼器,,并且完全基于軟件可編程的DSP處理器實(shí)現(xiàn)。它可以作為設(shè)計(jì)團(tuán)隊(duì)實(shí)現(xiàn)LTE基帶系統(tǒng)的起點(diǎn),,設(shè)計(jì)團(tuán)隊(duì)需要把L2的組件和其它的系統(tǒng)互連組件以及ATLAS組件整合在一起,。

  由于是模塊化設(shè)計(jì),所以設(shè)計(jì)團(tuán)隊(duì)可以部署ATLAS架構(gòu)中的所有7個(gè)模塊,,也可以復(fù)用他們已有的RTL模塊去替代一個(gè)或者更多的ATLAS組件,。不管是LTE設(shè)計(jì)師還是以后的LTE Advanced(4G)設(shè)計(jì)師,ATLAS LTE參考架構(gòu)中的模塊化組件都可以讓他們事半功倍,。

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。