ARM系列處理器是 RISC (Reducded InSTructiON Set Computing)處理器,。很多基于ARM的高效代碼的程序設(shè)計策略都源于RISC 處理器,。和很多 RISC 處理器一樣,ARM 系列處理器的內(nèi)存訪問,,也要求數(shù)據(jù)對齊,,即存取“字(Word)”數(shù)據(jù)時要求四字節(jié)對齊,地址的bits[1:0]==0b00;存取“半字(Halfwords)”時要求兩字節(jié)對齊,,地址的bit[0]==0b0;存取“字節(jié)(Byte)”數(shù)據(jù)時要求該數(shù)據(jù)按其自然尺寸邊界(Natural Size Boundary)定位,。
ARM 編譯程序通常將全局變量對齊到自然尺寸邊界上,以便通過使用 LDR和 STR 指令有效地存取這些變量,。這種內(nèi)存訪問方式與多數(shù) CISC (Complex Instruction Set Computing)體系結(jié)構(gòu)不同,,在CISC體系結(jié)構(gòu)下,指令直接存取未對齊的數(shù)據(jù),。因而,,當需要將代碼從CISC 體系結(jié)構(gòu)向 ARM 處理器移植時,內(nèi)存訪問的地址對齊問題必須予以注意,。在RISC體系結(jié)構(gòu)下,,存取未對齊數(shù)據(jù)無論在代碼尺寸或是程序執(zhí)行效率上,都將付出非常大的代價,。
本文將從以下幾個方面討論在ARM體系結(jié)構(gòu)下的程序設(shè)計問題,。
未對齊的數(shù)據(jù)指針
C和C++編程標準規(guī)定,指向某一數(shù)據(jù)類型的指針,,必須和該類型的數(shù)據(jù)地址對齊方式一致,,所以ARM 編譯器期望程序中的 C 指針指向存儲器中字對齊地址,因為這可使編譯器生成更高效的代碼,。
比如,,如果定義一個指向 int 數(shù)據(jù)類型的指針,用該指針讀取一個字,,ARM 編譯器將使用LDR 指令來完成此操作,。如果讀取的地址為四的倍數(shù)(即在一個字的邊界)即能正確讀取。但是,如果該地址不是四的倍數(shù),,那么,,一條 LDR 指令返回一個循環(huán)移位結(jié)果,而不是執(zhí)行真正的未對齊字載入,。循環(huán)移位結(jié)果取決于該地址向?qū)τ谧值倪吔绲钠屏亢拖到y(tǒng)所使用的端序(Endianness),。例如,如果代碼要求從指針指向的地址 0x8006 載入數(shù)據(jù),,即要載入 0x8006,、0x8007、0x8008 和 0x8009 四字節(jié)的內(nèi)容,。但是,,在 ARM 處理器上,這個存取操作載入了0x8004,、0x8005,、0x8006 和 0x8007 字節(jié)的內(nèi)容。這就是在未對齊的地址上使用指針存取所得到的循環(huán)移位結(jié)果,。
因而,,如果想將指針定義到一個指定地址(即該地址為非自然邊界對齊),那么在定義該指針時,,必須使用 __packed 限定符來定義指針: 例如,,
__packed int *pi; // 指針指向一個非字對其內(nèi)存地址
使用了_packed限定符限定之后,ARM 編譯器將產(chǎn)生字節(jié)存取命令(LDRB或STRB指令)來存取內(nèi)存,,這樣就不必考慮指針對齊問題,。所生成的代碼是字節(jié)存取的一個序列,或者取決于編譯選項,、跟變量對齊相關(guān)的移位和屏蔽,。但這會導致系統(tǒng)性能和代碼密度的損失。
值得注意的是,,不能使用 __packed 限定的指針來存取存儲器映射的外圍寄存器,,因為 ARM 編譯程序可使用多個存儲器存取來獲取數(shù)據(jù)。因而,,可能對實際存取地址附近的位置進行存取,,而這些附近的位置可能對應(yīng)于其它外部寄存器。當使用了位字段(Bitfield)時,, ARM 程序?qū)⒃L問整個結(jié)構(gòu)體,,而非指定字段。
編譯器的缺省行為
多數(shù)嵌入式應(yīng)用程序最初都是在原型環(huán)境下開發(fā)的,。無論什么樣的原型環(huán)境的資源與最終產(chǎn)品環(huán)境都是有差異的,。因此,,考慮如何將嵌入式應(yīng)用程序從其所依賴的開發(fā)工具或調(diào)試環(huán)境中移植到在目標硬件上獨立運行是非常重要的。
開始編寫嵌入式應(yīng)用程序時,,開發(fā)者可能并不清楚目標硬件的具體規(guī)格,。如,目標系統(tǒng)使用了什么樣的外圍設(shè)備,、存儲器映射情況甚至不能確定處理器的型號,。 為在了解這些詳細信息前能夠繼續(xù)軟件的開發(fā),RVCT 工具提供了很多默認的操作,,使用戶能編譯和調(diào)試與目標系統(tǒng)無關(guān)的應(yīng)用程序代碼,。下面詳細介紹介紹這些編譯選項,只有深入了解這些編譯選項設(shè)置,,才能使開發(fā)更順利的進行。
調(diào)整 C 庫使其適應(yīng)目標硬件
默認情況下,,C 庫利用semihostig機制來提供設(shè)備驅(qū)動級的功能,,使得主機主機能夠用作輸入和輸出設(shè)備。這種機制對于嵌入式開發(fā)十分有用,,因為用于開發(fā)的硬件系統(tǒng)通常沒有最終系統(tǒng)的輸入和輸出設(shè)備,。
最簡單的函數(shù)重定向的例子就是用戶希望fputc()函數(shù)能夠?qū)⒆址麖哪繕讼到y(tǒng)的串口輸出而不是在調(diào)試時,將字符從調(diào)試器的控制臺輸出,。這時就需要重新實現(xiàn)該函數(shù),。下面的例子將fputc() 的輸入字符參數(shù)重新指向一連續(xù)輸出函數(shù) sendchar(),將定該例在一個獨立的源文件中實現(xiàn)的,。這樣,,fputc() 在依目標而定的輸出和 C 庫標準輸出函數(shù)之間充當一個抽象層。
圖1 C庫函數(shù)重定向
例子程序的代碼如下所示,。
extern void sendchar(char *ch);
int fputc(int ch, FILE *f)
{?? /* e.g. write a character to an UART */
char tempch = ch;
sendchar(&tempch);
return ch;
}
映象文件存儲器映射調(diào)整
映像由域(Regions)和輸出段(Output Sections)組成,。每個域可以有不同的加載地址和執(zhí)行地址。
分散加載可以更加方便準確的指定映像存儲器映射,,為映像組件分組和布局提供了全面控制,。它能夠描述由載入時和執(zhí)行時分散在存儲器映射中的多個區(qū)組成的復雜映像映射。雖然,,分散加載可以用于簡單映像,,但它通常僅用于具有復雜存儲器映射的映像。
要構(gòu)建映像的存儲器映射,,必須向armlink 提供以下信息:
·? 分組信息? 決定如何將各輸入段組織成相應(yīng)的輸出段和域;
·? 定位信息? 決定各域在存儲空間的起始地址,。
有兩種方法可以實現(xiàn)指定映像文件的分組和定位信息:如果映像文件中地址映射關(guān)系比較簡單,可以使用命令行選項;如果映像文件中地址映射關(guān)系比較復雜的情況,,可以使用一個配置文件,。使用該配置文件可以高速鏈接器相關(guān)的地址映射關(guān)系,。配置文件又叫Scatter文件,是一個文本文件,,通過下面的鏈接選項來實現(xiàn),。
-scatter? filename
復位和初始化
ARM嵌入式系統(tǒng)的初始化序列如圖2所示。系統(tǒng)啟動時立即執(zhí)行復位處理程序,,然后進入$Sub$main()的代碼執(zhí)行,。
復位處理程序是用匯編語言編寫的代碼塊,它在系統(tǒng)復位時執(zhí)行,,完成系統(tǒng)必須初始化操作,。對于具有局部存儲器的內(nèi)核,如Caches,、緊密藕荷存儲器 (TCM),、存儲管理單元 (MMU) 和存儲器保護單元 (MPU) 等,在初始化過程這一階段完成必要的配置,。復位處理程序在執(zhí)行之后,,通常跳轉(zhuǎn)到 __main 以開始 C 庫的初始化序列。
一般情況下,,系統(tǒng)初始化代碼和主應(yīng)用程序是分開的,。系統(tǒng)初始化要在主應(yīng)用程序啟動前完成。但部分與硬件相關(guān)的系統(tǒng)初始化過程,,如啟用Cache和中斷,,必須在C庫初始化代碼執(zhí)行完成后才能執(zhí)行。
為了在進入主應(yīng)用程序之前,,完成系統(tǒng)初始化,,可以使用$sub和$super函數(shù)標識符在進入主程序之前插入一個例程。這一機制可以在不改變源代碼的情況下擴展函數(shù)的功能,。
下面的例子說明了如何使用$sub和$super函數(shù)標識,。鏈接程序通過調(diào)用$sub$$main()函數(shù)取代對main()的調(diào)用。所以用戶可以在自己編寫的$sub$$main()例程中啟用Cache或使能中斷,。
extern void $Super$$main(void);
void $Sub$$main(void)
{
cache_enable();??? // enables caches
int_enable();????? // enables interrupts
$Super$$main();??? // calls original main()
}
在$Sub$$main(void)函數(shù)中,,鏈接程序通過調(diào)用$Super$$main(),是代碼跳轉(zhuǎn)到實際的main()函數(shù),。
在完成硬件初始化之后,,必須考慮主應(yīng)用程序運行在何種模式。如果應(yīng)用程序運行在特權(quán)模式(Privileged mode),,只需在退出復位處理程序前切換到適當?shù)哪J?如果應(yīng)用程序運行在用戶模式下,,要在完成系統(tǒng)初始化之后,再切換到用戶模式,。模式的切換工作,,一般在$Sub$$main(void)函數(shù)中完成,。
圖2 ARM嵌入式系統(tǒng)的初始化序列