arm公司在32位RISC的CPU開發(fā)領(lǐng)域不斷取得突破,其結(jié)構(gòu)已經(jīng)從V3發(fā)展到V6。
BSP(Board Support Package)板級支持包介于主板硬件和操作系統(tǒng)之間,,其功能與PC機上的BIOS相類似,,主要完成硬件初始化并切換到相應(yīng)的操作系統(tǒng),。BSP是相對于操作系統(tǒng)而言的,,不同的操作系統(tǒng)對應(yīng)于不同定義形式的BSP,例如VxWorks的BSP和Linux的BSP相對于某一CPU來說,,盡管實現(xiàn)的功能一樣,,可是寫法和接口定義是完全不同的。另外,,仔細研究所用的芯片資料也十分重要,,例如盡管arm在內(nèi)核上兼容,但每家芯片都有自己的特色,。所以這就要求BSP程序員對硬件,、軟件和操作系統(tǒng)都要有一定的了解。
本文介紹基于arm體系的嵌入式應(yīng)用系統(tǒng)初始化部分BSP的程序設(shè)計,。本文引用的源碼全部是基于HMS320C7202芯片設(shè)計,,并已成功運行。
1 初始化過程
盡管各種嵌入式應(yīng)用系統(tǒng)的結(jié)構(gòu)及功能差別很大,,但其系統(tǒng)初始化部分完成的操作有很大一部分是相似的,。嵌入式系統(tǒng)的啟動流程如圖1所示。
1.1 設(shè)置入口指針
啟動程序首先必須定義指針,,而且整個應(yīng)用程序只有一個入口指針,。一般地,程序在編譯鏈接時將異常中斷向量表鏈接在0地址處,,并且作為整個程序入口點,。入口點代碼如下:
ENTRY(_start) ;開始
1.2 設(shè)置異常中斷向量表
arm要求中斷向量表必須放置在從0開始,、連續(xù)8×4字節(jié)的空間內(nèi),。各異常中斷向量地址以及中斷的算是優(yōu)先級如表1:
中斷向量地址 | 異常中斷類型 | 異常中斷模式 | 優(yōu)先級(6最低) |
0x0 | 復(fù)位 | 特權(quán)模式(SVC) | 1 |
0x4 | 未定義中斷 | 未定義指令中止模式(Undef) | 6 |
0x8 | 軟件中斷(SWI) | 特權(quán)模式(SVC) | 6 |
0x0c | 指令預(yù)取中止 | 中止模式 | 5 |
0x10 | 數(shù)據(jù)訪問中止 | 中止模式 | 2 |
0x14 | 保留 | 未使用 | 未使用 |
0x18 | 外部中斷請求(IRQ) | 外部中斷(IRQ)模式 | 4 |
0x1c | 快速中斷請求(FIQ) | 快速中斷(FIQ)模式 | 3 |
表1 各異常中斷的中斷向量地址以及中斷的處理優(yōu)先級
中斷向量地址 異常中斷類型 異常中斷模式 優(yōu)先級(6最低)
0x0 復(fù)位 特權(quán)模式(SVC) 1
0x4 未定義中斷 未定義指令中止模式(Undef) 6
0x8 軟件中斷(SWI) 特權(quán)模式(SVC) 6
0x0c 指令預(yù)取中止 中止模式 5
0x10 數(shù)據(jù)訪問中止 中止模式 2
0x14 保留 未使用 未使用
0x18 外部中斷請求(IRQ) 外部中斷(IRQ)模式 4
0x1c 快速中斷請求(FIQ) 快速中斷(FIQ)模式 3
每當(dāng)一個中斷發(fā)生后,ARM處理器便強制把程序計數(shù)器(PC)指針置為向量表中對應(yīng)中斷類型的地址值,。因為每個中斷向量僅占據(jù)放置1條arm指令的空間,,所以通常放置1條跳轉(zhuǎn)指令或向程序計數(shù)器(PC)寄存器賦值的數(shù)據(jù)訪問指令,使程序跳轉(zhuǎn)到相應(yīng)的異常中斷處理程序執(zhí)行,。如果異常中斷處理程序起始地址小于32MB,,使用B跳轉(zhuǎn)指令;如果跳轉(zhuǎn)范圍大于32MB,,使用LDR指令,。
另外,對于各未用中斷,,可使其指向一個只含返回指令的啞函數(shù),,以防止錯誤中斷引起系統(tǒng)的混亂。
1.3 初始化存儲系統(tǒng)
初始化存儲系統(tǒng)的編程對象是系統(tǒng)的存儲器控制器,,一個系統(tǒng)可能存在多種存儲器類型的接口,,不同的存儲系統(tǒng)的設(shè)計不盡相同。Flash和SRAM同屬于靜態(tài)存儲器類型,,可以合用一個存儲器端口,;而DRAM因為有動態(tài)刷新和地址線復(fù)用等特性,通常配有專用的存儲器端口,。其中,,SDRAM必須在初始化階段進行設(shè)置,因為大部分的程序代碼和數(shù)據(jù)都要在SDRAM中運行,。
在HMS30C7202中,,與SDRAM配置有關(guān)的寄存器有4個:配置寄存器、刷新定時寄存器,、寫緩沖寫回寄存器和等待驅(qū)動寄存器,,需要根據(jù)實際的系統(tǒng)設(shè)計對此分別加以正確配置。
SDRAM的初始化過程如下:加電→延遲10ms(各具體SDRAM器件延時時間可能不同)→設(shè)置配置寄存器參數(shù)→延時→寫刷新定時寄存器,,設(shè)置刷新周期→延時→使能自動刷新→延時→設(shè)置模式寄存器(位于SDRAM內(nèi)部),。
1.4 存儲器地址分布重映射(remap)和MMU
系統(tǒng)一上電,程序?qū)⒆詣訌?地址處開始執(zhí)行,。因此,,必須保證在0地址處存在正確的代碼,即要求0地址開始入是非易失性的ROM或Flash等,。但是因為ROM或Flash的訪問速度相對較慢,,每次中斷響應(yīng)發(fā)生后,都要從讀取ROM或Flash上面的向量表開始,,影響了中斷響應(yīng)速度,。一般程序執(zhí)行后將SDRAM映射為地址0,并把系統(tǒng)程序加載到SDRAM中運行,,其具體步驟可以采用以下的方案:
?。?)上電后,從0地址的ROM開始往下執(zhí)行,;
?。?)根據(jù)映射前的地址,對SDRAM進行必要的代碼和數(shù)據(jù)拷貝,;
?。?)拷貝完成后,進行重映射操作;
?。?)因為RAM在重映射前準(zhǔn)備好了內(nèi)容,,使得PC指針能繼續(xù)在RAM里取得正確的指令。
在這種地址映射的變化過程中,,程序員需要仔細考慮的是:程序的執(zhí)行流程不能被這種變化所打斷,,注意保證程序流程在重映射前后的承接關(guān)系。
存儲器的地址分配是很靈活的,,可以將I/O操作映射成內(nèi)存操作,,也可以通過映射對某些不可訪問的地址空間進行保護等。進行存儲器初始化設(shè)計時,,一定要根據(jù)應(yīng)用程序的具體要求來完成地址分配,。對地址管理通過MMU即存儲器管理單元實現(xiàn)。
在arm系統(tǒng)中,,MMU通過頁式虛擬存儲管理,,將虛擬空間和物理空間分別分成一個個固定大小的頁,并建立兩者之間的映射關(guān)系,,從而實現(xiàn)虛擬地址到物理地址的轉(zhuǎn)換,。MMU還可完成存儲器訪問權(quán)限的控制和虛擬存儲器空間緩沖特性的設(shè)置。
以下是實現(xiàn)MMU的部分代碼:
for=(i=1;i<0x1000;i++){pagetable[i]=(i<<20)|MMU_SECDESC;} //建立頁表,,每頁大小為1MB,,頁表偏移序號是物理地址的高12位;
for(addr=SDRAM_BASE;addr<(SDRAM_BASE+SDRAM_SIZE/2);addr+=SIZE_1M)
pagetable[addr>>20]=addr|MMU_SECDESE|MMU_CACHEABLE|MMU_BUFFERABLE;
//將SDRAM_BASE至(SDRAM_BASE+SDRAM_SIZE/2)空間的設(shè)置為不可CACHE和不可BUFFER的for
(addr=SDRAM_BASE+SDRAM_SIZE/2;addr< (SDRAM_BASE+SDRAM_SIZE);addr+=SIZE_1M)
pagetable[addr>>20]=(addr+0x1000000)|MMU_SECDESC|MMU_CACHEABLE|MMU_BUFFERABLE;
//將這段空間的地址映射關(guān)系設(shè)置為VA(虛擬地址)=PA(物理地址)+0x1000000pagetable[0]=(0x42f00000)|MMU_SECDESC|MMU_CACHEABLE|MMU_BUFFERABLE;
//將SDRAM的虛擬地址0x42f00000映射到0處
1.5 初始化各模式下的堆棧指針
因為arm處理器有7種執(zhí)行狀態(tài),,每一種狀態(tài)的堆棧指針寄存器(SP)都是獨立的(System和User三項式使用相同SP寄存器),。因此,對程序中需要用到的每一種模式都要給SP寄存器定義一個堆棧地址,。
方法是改變狀態(tài)寄存器(CPSR)內(nèi)的狀態(tài)位,,使處理器切換到不同的狀態(tài),然后給SP賦值,。這里列出的代碼定義了三種模式的SP指針,,其中,I_Bit表示IRQ的中斷禁止位,;F_Bit表示FIQ的中斷禁止位:
@,;Set up SVC stack to be 4K on top of zero-init data
LDR r1,=installStack
ADDsp,r1,#2048
@;Set up IRQ and FIQ stacks
MOV r0,#(Mode_IRQ32|I_Bit)
MSRcpsr,r0
MOV r0,r0
ADDsp,r1,#2048*2
MOV r0,#(Mode_FIQ32|I_Bit |F_Bit)
MSR cpsr,r0
MOV r0,r0
ADDsp,r1,#2048*3
一般堆棧的大小要根據(jù)需要而定,但是要盡可能給堆棧分配快速和高帶寬的存儲器,。堆棧性能的提高對系統(tǒng)性能的影響是非常明顯的,。
1.6 初始化有特殊要求的端口、設(shè)備
有些關(guān)鍵的I/O部件必須在使能IRQ和FIQ之前進行初始化,。因為如果在使能IRQ和FIQ之前沒有進行初始化,,可以產(chǎn)生假的異常中斷信號,。程序中初始化了HMS30C7202的串口1用來調(diào)試程序與其它設(shè)備通信。串口1是一個通用全雙工異步接收/發(fā)送器(UART),,它支持16C550的大部分功能,。UART有接收緩沖/發(fā)送保持寄存器、波特率除數(shù)鎖存器,、中斷允許寄存器等9個寄存器。對串口1的初始化主要是對各寄存器的設(shè)置,,其實現(xiàn)代碼如下所示:
_outb(ser_base+0x30,1);
_outw(0x8002301c,0xffff9f9f) ;GPIO PORT A Enable
Register
_outw(0x800230A4,0x6060) ;GPIO PORT A MultiFunction elect-Register
serial_outb(SERIAL_LCR,0x80);
serial_outb(SERIAL_LCR,0x80);
serial_outb(SERIAL_DLL,baud_data[cur_baud]);
serial_outb(SERIAL_DLM,0x0);
serial_outb(SERIAL_LCR,0x03);
seial_outb(SERIAL_FCR,0x01);
serial_outb(SERIAL_IER,0x00);
serial_outb(SERIAL_MCR,0x03);
1.7 切換處理器模式,,開中斷
最后轉(zhuǎn)換到應(yīng)用程序運行所需的最終模式,一般是User模式,。不要過早切換到User模式進行User模式的堆棧設(shè)備,。因為進入User模式后就不能再操作CPRS回到別的模式了,可能會對接下去的程序執(zhí)行造成影響,。
這時才使能異常中斷,,通過清除CPRS寄存器中的中斷禁止位實現(xiàn)。如果過早地開中斷,,在系統(tǒng)初始化之前就觸發(fā)了有效中斷,,會導(dǎo)致系統(tǒng)的死機。
1.8 呼叫主應(yīng)用程序
當(dāng)所有的系統(tǒng)初始化工作完成后,,就需要把程序流程轉(zhuǎn)入主應(yīng)用程序,。
2 技術(shù)難點分析
2.1 多種語言的混合編程
ARM有兩種匯編指令集:16位THUMB指令集和32位ARM指令集。使用16位的寄存器可以降低成本,,而且16位THUMB指令集整體執(zhí)行速度比ARM 32位指令集快,,提高了代碼密度。為了滿足arm子程序和Thumb子程序互相調(diào)用,,必須保證編寫的代碼遵循ATPCS,。ATPCS規(guī)定了子程序調(diào)用的基本規(guī)則。
arm系統(tǒng)結(jié)構(gòu)也支持C,、C++以及匯編語言的混合編程,。匯編語言和C/C++語言的混合編程,在一個追求效率的程序中比較常見,。許多人認(rèn)為像BSP這樣底層的程序應(yīng)該用純匯編語言編寫,,其實不然。用匯編語言編寫的程序可讀性不高,,而且不宜維護,,不便于向其它類型的CPU移植,而這些方面卻是C語言程序的優(yōu)勢,。BSP能否用純C語言去寫呢,?也不行,。因為某些操作是用C實現(xiàn)不了的。例如操作特殊寄存器的指令,、CP15寄存器的指令,、中斷使能及堆棧地址的設(shè)定等。在匯編和C/C++之間的函數(shù)調(diào)用時,,也要遵循ATPCS的定義,,還要注意的是用C語言編寫嵌入式程序時,要避免使用不能被固化到ROM中的庫函數(shù),。
混合編程情況下的程序編譯及鏈接后的輸出代碼與沒有混合編程時是不同的,。所以當(dāng)多個源文件如果使用了不同的設(shè)置進行編譯,相互之間的調(diào)用可能產(chǎn)生兼容性問題,,對此一定要加以仔細考慮,。編譯時,要告訴編譯器和鏈接器足夠的信息,,一方面,,讓編譯器能夠使用正確的指令碼進行編譯;另一方面,,在不同的狀態(tài)之間發(fā)生函數(shù)調(diào)用時,,鏈接器將插入一段鏈接代碼(veneers)來實現(xiàn)狀態(tài)轉(zhuǎn)換。
2.2 MMU的實現(xiàn)過程
頁表是實現(xiàn)MMU的重要手段,。頁表存放在內(nèi)存中,,從虛擬地址到物理地址的變換過程其實就是查詢頁表的過程。大小為1MB的存儲塊通常被稱為段,,圖2說明了如何查表進行段式尋址的全過程:32位的虛擬地址可分為12位的一級頁表序號和20位的段內(nèi)地址偏移,。12位的一級頁表序號和CP15寄存器的C2中的18位變換表基址合并成一級描述符地址查表找出相應(yīng)的一級描述符;然后,,段對應(yīng)的物理基地址與段內(nèi)地址偏移量合并成為真正的存儲器存取地址即物理地址,,讀出相應(yīng)數(shù)據(jù)。
本文介紹的BSP程序已經(jīng)在以HMS30C7202為主芯片的開發(fā)系統(tǒng)上運行并測試通過,,并且成功地引導(dǎo)了Linux內(nèi)核,,文中引用代碼可以直接使用。今后可以在此基礎(chǔ)上添加命令行解釋程序,,在引導(dǎo)操作系統(tǒng)前進行存存儲器的讀寫等,,擴展開發(fā)系統(tǒng)的功能。