關(guān)鍵字:LTE DSP 多核SoC 浮點(diǎn)運(yùn)算 MIMO
LTE概述
蜂窩網(wǎng)絡(luò)的數(shù)據(jù)使用正迅速成長(zhǎng),基礎(chǔ)設(shè)備廠商亦期待4G標(biāo)準(zhǔn),,以便為移動(dòng)用戶(hù)提供更大的容量及更好的使用體驗(yàn),。3GPP所開(kāi)發(fā)的LTE已被許多運(yùn)營(yíng)商選擇為無(wú)線基站及手機(jī)的新一代解決方案。LTE是3GPP標(biāo)準(zhǔn)第8版UMTS的提升,。LTE一般稱(chēng)為4G標(biāo)準(zhǔn),,是目前無(wú)線傳輸數(shù)據(jù)的重大變革。
LTE采用OFDMA(正交頻分多址)技術(shù),,而3G技術(shù)則采用CDMA(碼分多址)技術(shù),,此一變革可透過(guò)多天線信號(hào)處理達(dá)到較高的頻譜效率,并為較寬譜頻帶寬提供更多支持,。
在OFDMA中,,快速傅立葉轉(zhuǎn)換(FFT)將可用頻寬分割成許多正交的較小頻寬??焖俑盗⑷~逆轉(zhuǎn)換(IFFT)可重建頻帶,。FFT及IFFT是經(jīng)過(guò)詳加定義的算法,當(dāng)其采樣數(shù)為2的乘冪時(shí)即可有效執(zhí)行,。OFDM系統(tǒng)常見(jiàn)的FFT采樣數(shù)為512,、1024及2048,較小的采樣則為128及256,。支援的頻寬為5,、10、15及20MHz,。該技術(shù)的優(yōu)點(diǎn)之一是能簡(jiǎn)易地適用于不同的頻寬,。
LTE也能夠使用先進(jìn)的多天線信號(hào)處理技術(shù)。其中兩項(xiàng)常用的技術(shù)為多入多出(MIMO)處理及波束成形,。在MIMO中,系統(tǒng)發(fā)現(xiàn)從其中一個(gè)傳輸天線接收到的信號(hào)會(huì)與第二個(gè)天線接收到的信息有極大的差異,,這在室內(nèi)或人口密集的大城市相當(dāng)常見(jiàn),,因?yàn)槭瞻l(fā)器及接收器之間有相當(dāng)多反射與多重路徑。在這樣的情況下,,各個(gè)天線在相同頻率下會(huì)傳輸不同的信號(hào),,在經(jīng)由接收器信號(hào)處理即可復(fù)原。
LTE對(duì)于SoC架構(gòu)的影響
這些新的LTE特性顯現(xiàn)出基站必須以較短的延遲及較多的彈性支持較高的吞吐量。這對(duì)系統(tǒng)設(shè)計(jì)的許多層面形成極大的壓力,。為了滿(mǎn)足這些需求,,TI開(kāi)發(fā)出全新的SoC架構(gòu),其中許多內(nèi)建的組件可滿(mǎn)足LTE蜂窩基站的需求(見(jiàn)圖1),。
圖1:德州儀器的多核SoC架構(gòu),。
TI全新的架構(gòu)采用先進(jìn)的DSP核技術(shù),頻率高達(dá)1.2GHz,,而且總處理能力達(dá)到256GMAC,,遠(yuǎn)高于當(dāng)前市面的DSP(見(jiàn)圖2)。該內(nèi)核支持定點(diǎn)及浮點(diǎn)運(yùn)算,,其中的指令集完全與TI的TMS320C64x+ DSP指令集向下兼容,。定點(diǎn)及浮點(diǎn)運(yùn)作的處理速度均超過(guò)1GHz,顯示DSP領(lǐng)域出現(xiàn)真正的變化,。開(kāi)發(fā)人員將不再需要在定點(diǎn)的原始速率及浮點(diǎn)的精度之間抉擇,,如今已可兩者兼得,因?yàn)門(mén)I全新的架構(gòu)支持在定點(diǎn)及浮點(diǎn)指令之間切換,。
圖2:德州儀器全新的架構(gòu)采用先進(jìn)的DSP內(nèi)核技術(shù),,頻率速度高達(dá)1.2GHz。
MIMO處理涉及針對(duì)相同頻譜的信號(hào)進(jìn)行數(shù)據(jù)譯碼,。相較于此一程序的算法,,由于典型N變量的N是未知數(shù),需要矩陣求逆法才能解決,。將矩陣求逆引入處理鏈,,對(duì)于定點(diǎn)處理器的性能深具影響。這是因?yàn)榫仃嚽竽嫒菀资艿骄认拗频挠绊?,?dǎo)致16位及32位定點(diǎn)運(yùn)作的性能不佳,,甚至無(wú)法運(yùn)作。程序設(shè)計(jì)人員一般都必須使用虛擬浮點(diǎn)法來(lái)達(dá)到所需的精度,,同時(shí)嘗試保留足夠的處理能力來(lái)執(zhí)行系統(tǒng),。
TI全新的架構(gòu)針對(duì)業(yè)界最高速DSP引進(jìn)原生浮點(diǎn)支持,可謂是一大突破,。浮點(diǎn)處理器的速度一般比定點(diǎn)處理器慢,,因此不適用于蜂窩基站這樣的高性能場(chǎng)合。結(jié)合原生浮點(diǎn)支持及領(lǐng)先業(yè)界的C64x+定點(diǎn)架構(gòu)后,,TI帶來(lái)定點(diǎn)及浮點(diǎn)兩者的最高處理效能,,進(jìn)而對(duì)LTE系統(tǒng)發(fā)揮影響。程序設(shè)計(jì)人員可使用優(yōu)化的16位程序代碼,,其中精度不是影響的因素,,而且對(duì)于需要高精度的算法可達(dá)到IEEE浮點(diǎn)精度,,例如MIMO均衡器。這使得LTE系統(tǒng)架構(gòu)的效率相當(dāng)高,,使得基站可達(dá)到最低的功耗,、最高的效能及最大的輸出量。
浮點(diǎn)算法設(shè)計(jì)的另一項(xiàng)優(yōu)點(diǎn)是能夠簡(jiǎn)易地開(kāi)發(fā)和升級(jí)算法,,并導(dǎo)入實(shí)際的系統(tǒng)中,。通信系統(tǒng)的一般設(shè)計(jì)流程是先根據(jù)計(jì)算機(jī)模型開(kāi)發(fā)算法,然后將其用于初始的系統(tǒng)部署,。隨著部署的范圍及運(yùn)用不斷擴(kuò)大,,工程人員需要收集實(shí)際數(shù)據(jù)提供給算法團(tuán)隊(duì),以供提升系統(tǒng)性能,。這些全新的算法通常是以本身是浮點(diǎn)運(yùn)作的MATLAB實(shí)現(xiàn)進(jìn)行開(kāi)發(fā),。其中的難題在于將這些浮點(diǎn)MATLAB算法轉(zhuǎn)換為定點(diǎn)DSP,同時(shí)維持算法及系統(tǒng)兩者的性能,,因?yàn)椴混`活的算法會(huì)用盡系統(tǒng)資源,,而降低整體的基站性能。
如果涉及復(fù)雜的矩陣處理,,將程序代碼從MATLAB導(dǎo)入實(shí)際系統(tǒng)通常需要幾周或幾星期的時(shí)間,。透過(guò)TI全新架構(gòu)的原生浮點(diǎn)支持,便不需要進(jìn)行這整個(gè)程序,。透過(guò)使用浮點(diǎn)C語(yǔ)言程序代碼以及直接編譯于TI的DSP,,即可從MATLAB導(dǎo)入程序代碼。
其重要性對(duì)于LTE系統(tǒng)的系統(tǒng)設(shè)計(jì)人員及程序設(shè)計(jì)人員來(lái)說(shuō),,并非言過(guò)其實(shí),。隨著LTE演變?yōu)長(zhǎng)TE-A及未來(lái)的標(biāo)準(zhǔn),浮點(diǎn)很可能在未來(lái)變得更加重要,,因?yàn)槎嗵炀€信號(hào)處理的趨勢(shì)顯得日益復(fù)雜,。
多核導(dǎo)航器
現(xiàn)今基站OEM面臨的最大問(wèn)題之一是開(kāi)發(fā)出適用于基站的軟件。大系統(tǒng)的軟件開(kāi)發(fā)會(huì)耗費(fèi)長(zhǎng)久的人力投入時(shí)間,。TI全新的架構(gòu)運(yùn)用前幾代多核及基站系統(tǒng)開(kāi)發(fā)的經(jīng)驗(yàn),,推出使用簡(jiǎn)便但功能強(qiáng)大的SoC。TI全新架構(gòu)的基礎(chǔ)組件是新的多核導(dǎo)航器(Multicore Navigator),。TI的多核導(dǎo)航器是能夠在SoC中無(wú)縫地移動(dòng)數(shù)據(jù)的系統(tǒng)組件,。
一旦經(jīng)過(guò)配置,TI的多核導(dǎo)航器即可處理封包傳輸,、內(nèi)存配置,、加速器觸發(fā)及多重目的地,任何DSP核都不會(huì)消耗單一周期,。這能夠釋放算法系統(tǒng)層級(jí)處理所需的DSP資源,,完全不會(huì)使數(shù)據(jù)移動(dòng)停滯;以往數(shù)據(jù)移動(dòng)需要多次中斷及環(huán)境轉(zhuǎn)換,,導(dǎo)致系統(tǒng)性能降低,。
舉例來(lái)說(shuō),在LTE系統(tǒng)中,,行動(dòng)數(shù)據(jù)封包會(huì)到達(dá)天線接口(支持OBSAI及CPRI標(biāo)準(zhǔn)的專(zhuān)屬高速接口),。這些封包會(huì)在經(jīng)過(guò)隊(duì)列后傳送到FFT協(xié)同處理器(LTE L1處理的第1個(gè)步驟)進(jìn)行處理,然后經(jīng)過(guò)隊(duì)列后傳送到適當(dāng)?shù)腄SP核進(jìn)行下一個(gè)處理步驟,,以上完全不需要任何CPU介入,。同樣地,數(shù)據(jù)可以從多個(gè)天線及多個(gè)區(qū)塊同時(shí)傳達(dá),,并且自動(dòng)且適當(dāng)?shù)貍魉?。?shù)據(jù)可以在系統(tǒng)組件之間移動(dòng),完全不需要CPU介入,,也不會(huì)造成不同核之間的競(jìng)用,。
隨著TI對(duì)于關(guān)鍵基站組件的了解加深,便從先前的系統(tǒng)設(shè)計(jì)組件改良推出多核導(dǎo)航器,。多核導(dǎo)航器為封包化數(shù)據(jù)流提供極高的效率,,相當(dāng)適用于LTE與WiMAX等高速3G系統(tǒng)(HSPA)與4G系統(tǒng)的封包處理,另外也能夠提供個(gè)別處理隊(duì)列及數(shù)據(jù)串流的硬件機(jī)制,,這表示同時(shí)進(jìn)行的傳輸運(yùn)作不會(huì)相互干擾,。換句話說(shuō),個(gè)別DSP核不需要等候其它內(nèi)核完成處理,,而能夠共享資源,。
TeraNet2
數(shù)據(jù)經(jīng)過(guò)系統(tǒng)外送到天線或進(jìn)行傳輸時(shí),SoC架構(gòu)必須支持極高的外部及內(nèi)部數(shù)據(jù)速率,。支持這些速率需要許多不同層級(jí)的多種專(zhuān)用加速及可編程軟件組件,。
支持這些組件之間的數(shù)據(jù)移動(dòng)是設(shè)計(jì)中的關(guān)鍵層面之一。TI的TeraNet2屬于SoC層級(jí)片上網(wǎng)絡(luò)的一部分,,能夠在內(nèi)核,、外圍、內(nèi)存及加速器等組件之間提供每秒2TB的高速數(shù)據(jù)傳輸速率,。就系統(tǒng)層級(jí)而言,,這表示所有組件能夠同時(shí)獨(dú)立執(zhí)行,完全不需要等候其它組件完成處理或數(shù)據(jù)傳輸,。在如同LTE基站的高度優(yōu)化且復(fù)雜的系統(tǒng)中,,這對(duì)于性能有極大的影響,系統(tǒng)開(kāi)發(fā)人員得以完全發(fā)揮SoC的性能,。
L2處理
使用MIMO不僅影響物理層處理,,也影響L2調(diào)度,,不過(guò)一般不需要極為復(fù)雜的算法。調(diào)度是基站決定各移動(dòng)用戶(hù)或設(shè)備在每幀中能獲得多少無(wú)線頻寬的過(guò)程,。在LTE中,,每隔1毫秒便會(huì)根據(jù)下列因素完成決定:
1.用戶(hù)活動(dòng)–語(yǔ)音、視頻,、游戲等
2.服務(wù)計(jì)劃的類(lèi)型
3.用戶(hù)位置–高或低信號(hào)區(qū)域
這些因素會(huì)影響調(diào)度器如何決定幀分配,。
MIMO使得其中的復(fù)雜度增加,因?yàn)榛拘枰淮螌⑼耆嗤念l帶分配給多位用戶(hù),。若要這么做,,基站必須根據(jù)從各個(gè)用戶(hù)所測(cè)得的數(shù)據(jù)進(jìn)行計(jì)算,因此決定多少用戶(hù)可同時(shí)進(jìn)行調(diào)度,。這需要每毫秒針對(duì)各種可能的用戶(hù)組合進(jìn)行矩陣求逆,,對(duì)于實(shí)時(shí)定點(diǎn)處理引擎而言,這是相當(dāng)繁復(fù)的作業(yè),。不良的調(diào)度效能會(huì)導(dǎo)致昂貴的頻譜使用欠佳,,造成用戶(hù)無(wú)法順利處理作業(yè)。如同對(duì)于MIMO計(jì)算一般,,TI全新架構(gòu)中不可或缺的浮點(diǎn)支持可大幅簡(jiǎn)化及加速必要的處理,,因?yàn)樵↑c(diǎn)支持十分有助于矩陣求逆。
多核共享內(nèi)存控制器
另一項(xiàng)重要多核功能改進(jìn)之處是TI全新的多核共享內(nèi)存控制器,。由于多核需要依序處理數(shù)據(jù),,從外部?jī)?nèi)存存取數(shù)據(jù)或在各內(nèi)核的本地內(nèi)存之間移動(dòng)數(shù)據(jù),會(huì)使實(shí)際性能大幅降低,。在TI全新的架構(gòu)中,,多核共享內(nèi)存控制器能夠讓內(nèi)核有效存取共享內(nèi)存,就如同專(zhuān)用的本地內(nèi)存一般,。如此便不需要進(jìn)行任何數(shù)據(jù)傳輸,,而且能夠使各內(nèi)核立即有效處理共享內(nèi)存中儲(chǔ)存的數(shù)據(jù)。
透過(guò)結(jié)合多核共享內(nèi)存控制器,、多核導(dǎo)航器與TeraNet2,,TI能提供高效率的系統(tǒng)層級(jí)設(shè)計(jì),使客戶(hù)得以發(fā)揮絕佳的多核效用,。
可擴(kuò)展性
LTE使得無(wú)線數(shù)據(jù)速度及蜂窩網(wǎng)絡(luò)拓樸展現(xiàn)嶄新的境界,。目前蜂窩網(wǎng)絡(luò)主要采用宏蜂窩(macrocell)小區(qū),極少采用微微蜂窩(picocell)及飛蜂窩(femtocell)小區(qū),。隨著數(shù)據(jù)使用持續(xù)大幅飆長(zhǎng),,經(jīng)過(guò)提升的LTE頻譜效率也無(wú)法再支持傳統(tǒng)的大型網(wǎng)絡(luò)拓樸。
3GPP標(biāo)準(zhǔn)團(tuán)隊(duì)注意到這一點(diǎn),,因此正開(kāi)發(fā)在蜂窩網(wǎng)絡(luò)中加入微微蜂窩小區(qū)和飛蜂窩小區(qū)的簡(jiǎn)化方法,,以便形成由不同大小的蜂窩小區(qū)組成的異構(gòu)網(wǎng)絡(luò),,而不僅是由宏蜂窩小區(qū)組成的同構(gòu)網(wǎng)絡(luò)(見(jiàn)圖3)。對(duì)于需要在各種基站架構(gòu)運(yùn)用研究及開(kāi)發(fā)資源的系統(tǒng)設(shè)計(jì)人員而言,,解決方案及架構(gòu)的可擴(kuò)展性是異構(gòu)網(wǎng)絡(luò)中相當(dāng)重要的部份,。
圖3:宏蜂窩、微蜂窩,、微微蜂窩及飛蜂窩小區(qū)交錯(cuò)并協(xié)同工作將形成未來(lái)的異構(gòu)網(wǎng)絡(luò)。
透過(guò)多核導(dǎo)航器,,TI全新的SoC架構(gòu)使得軟件重復(fù)使用及重新部署達(dá)到前所未有的層級(jí),。此一全新架構(gòu)也支持各設(shè)備中不同數(shù)量的處理組件,這些處理組件可能是L1,、L2,、L3及傳輸功能的核心或協(xié)處理加速器。由于設(shè)備制造商能夠通過(guò)異構(gòu)網(wǎng)絡(luò)的所有組件實(shí)現(xiàn)他們的系統(tǒng),,因此彈性軟硬件設(shè)計(jì)的結(jié)合有助于縮短不同開(kāi)發(fā)的上市時(shí)間,、優(yōu)化硬件成本,以及降低工程成本,。
其中的關(guān)鍵在于多核導(dǎo)航器采用多核的概念,,使得各內(nèi)核能夠依據(jù)硬件獨(dú)立運(yùn)作。因此,,使用多核導(dǎo)航器開(kāi)發(fā)的內(nèi)核,、協(xié)處理器及外圍軟件三者的概念僅需要最低程度的修改,因?yàn)橛布梢罁?jù)異構(gòu)網(wǎng)絡(luò)中不同類(lèi)型基站的性能需求加以調(diào)整,。
本文小結(jié)
蜂窩網(wǎng)絡(luò)的變化相當(dāng)劇烈且深遠(yuǎn),;流經(jīng)系統(tǒng)的數(shù)據(jù)量日益增加,營(yíng)運(yùn)商及基站制造商正不斷地努力趕上,。器件級(jí)別的創(chuàng)新將有助于提供所需的工具來(lái)維持和提升基礎(chǔ)架構(gòu),,以支持新一代無(wú)線設(shè)備,全新的SoC架構(gòu)正是TI引領(lǐng)創(chuàng)新4G技術(shù)的其中一例,。