Cortex-M3內(nèi)核浮點型運算的研究與實現(xiàn)-AET-電子技術(shù)應(yīng)用

Cortex-M3內(nèi)核浮點型運算的研究與實現(xiàn)

現(xiàn)代電子技術(shù)

梅靜靜，王申良

摘要： 通過分析Cortex-M3內(nèi)核的結(jié)構(gòu)與浮點型格式，充分利用Cortex-M3內(nèi)核中的分支預(yù)測、單周期乘法、硬件除法等眾多功能強大的特性，使用Thumb-2指令集實現(xiàn)了單精度浮點型的加、減、乘、除與比較運算，并給出了加減法運算的流程圖和除法運算的源程序。

關(guān)鍵詞： 運算浮點內(nèi)核 Cortex-M3

Abstract：

Key words :

摘要：通過分析Cortex-M3 內(nèi)核的結(jié)構(gòu)與浮點型格式，充分利用Cortex-M3內(nèi)核中的分支預(yù)測、單周期乘法、硬件除法等眾多功能強大的特性，使用Thumb-2指令集實現(xiàn)了單精度浮點型的加、減、乘、除與比較運算，并給出了加減法運算的流程圖和除法運算的源程序。
關(guān)鍵詞：Cortex-M3內(nèi)核；浮點型；速度

引言
在一些較為復(fù)雜的運算中，經(jīng)常需要處理取值范圍大、精度高的浮點型數(shù)據(jù)。但一般的低端嵌入式內(nèi)核中沒有浮點型硬件運算器，因此處理語音信號等數(shù)據(jù)比較困難。本文提出了一種基于Cortex-M3內(nèi)核的浮點型運算的處理方法。

1 Thumb-2指令集與COrtex-M3內(nèi)核結(jié)構(gòu)
Thumb-2指令集具有以下優(yōu)點：許多指令(包括乘法相關(guān)指令、突破性的32位硬件除法指令等)都是單周期的，并且位段處理指令取指都按32位處理。
Cortex-M3是一個32位處理器內(nèi)核，采用哈佛結(jié)構(gòu)，擁有獨立的指令總線和數(shù)據(jù)總線，可以讓取指與數(shù)據(jù)訪問并行不悖。它具有如下特點：功耗低，有睡眠、停機(jī)和待機(jī)3種模式；實時性好；響應(yīng)中斷快，而且響應(yīng)中斷所需的周期數(shù)是確定的；采用Thumb-2指令集，使得代碼
密度和執(zhí)行效率更高。

2 浮點數(shù)的格式
IEEE的浮點型數(shù)據(jù)標(biāo)準(zhǔn)規(guī)定，浮點數(shù)具有單精度(4字節(jié))、雙精度(8字節(jié))和擴(kuò)展精度(10字節(jié))三種浮點型格式。在實際的應(yīng)用中，使用最多的是單精度浮點數(shù)，格式如下：

    浮點數(shù)表示為：X=MsEsEm-1…E1E0 M-1M-2…M-n。IEEE標(biāo)準(zhǔn)規(guī)定：階碼用移碼；尾數(shù)的符號位用1表示負(fù)數(shù)，0表示正數(shù)；尾數(shù)的數(shù)據(jù)位用原碼表示，并且隱藏了第24位(即M-1)，M-1為1，所以尾數(shù)是大于等于0．5小于1的小數(shù)。
    階碼用移碼表示、尾數(shù)用原碼表示浮點數(shù)的好處：
    ①浮點數(shù)據(jù)零的所有位均為零。
    ②2個浮點數(shù)比較大小時，可不必區(qū)分階碼位和數(shù)據(jù)位，視為有符號32位整型數(shù)據(jù)比較。

3 浮點型運算的具體實現(xiàn)
3．1 加減運算
Cortex-M3是32位的內(nèi)核，可以把單精度浮點數(shù)存儲為32位的有符號整數(shù)，這樣便于比較運算。加減運算的流程如圖1所示。

3．2 乘法運算
    對于浮點型乘法運算，因為Cortex-M3內(nèi)核支持單周期乘法指令，所以運算速度比較快。運算流程與加減運算相似，不同之處有：階碼相加最高位取反得結(jié)果的階碼；尾數(shù)不用正負(fù)號調(diào)整，直接相乘，而尾數(shù)的符號位異或即可得結(jié)果的符號位；兩個24位尾數(shù)相乘的結(jié)果為48位，尾數(shù)規(guī)格化的時候，判斷第48位是否為1，如果為1則階碼加1，如果為O則第47位一定為1，階碼不必調(diào)整。
3．3 除法運算
    除法運算中，提取階碼、重現(xiàn)尾數(shù)、提取尾數(shù)以及尾數(shù)符號位的操作與乘法運算相同，因此除法運算過程與乘法運算過程的基本相似，只是計算X、Y尾數(shù)的商有所不同。
    計算商的方法為：先把X的尾數(shù)左移8位，與Y的尾數(shù)相除得結(jié)果Z1，并計算出余數(shù)W1=X-Z1*Y；W1先左移8位，與Y的尾數(shù)相除得結(jié)果Z2，并計算出余數(shù)W2=W1-Z2*Y；W2左移8位，與Y的尾數(shù)相除得結(jié)果Z3。調(diào)整Z1、Z2、Z3并組裝成24位或25位尾數(shù)。除法運算的源程序如下：

3．4 浮點型數(shù)據(jù)比較
從浮點型數(shù)據(jù)存儲的格式來看，可以把浮點數(shù)按照有符號整型數(shù)據(jù)來比較大小。比較的結(jié)果：相等輸出O，大于輸出1，小于輸出-1。

4 測試結(jié)果
利用基于Cortex-M3內(nèi)核的STM32F103VET6處理器測試浮點型運算的速度，處理器的工作頻率為72 MHz，測試的方法為：每完成一次浮點型運算，處理器的一引腳變化一次電平。經(jīng)測試，變化一次電平耗時153ns。圖2、圖3是對乘法運算和除法運算的測試結(jié)果。從圖中可以看出，乘法的運算速率約為0．717μs／次，除法的運算速率約為0．957μs／次。可見，運算速率比較高，精度較高，可以滿足實際應(yīng)用要求。

結(jié)語
測試結(jié)果表明，在Cortex-M3內(nèi)核上實現(xiàn)浮點型運算，可以達(dá)到所要求的精度，運算速度較快，具有較高的實時性。本文提出的浮點型運算的處理方法在基于Cortex-M3內(nèi)核的處理器上有著較高的應(yīng)用價值。希望對從事這方面的人員有所幫助。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容