《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > Cortex-M3內(nèi)核浮點(diǎn)型運(yùn)算的研究與實(shí)現(xiàn)
Cortex-M3內(nèi)核浮點(diǎn)型運(yùn)算的研究與實(shí)現(xiàn)
現(xiàn)代電子技術(shù)
梅靜靜,,王申良
摘要: 通過分析Cortex-M3內(nèi)核的結(jié)構(gòu)與浮點(diǎn)型格式,,充分利用Cortex-M3內(nèi)核中的分支預(yù)測(cè),、單周期乘法,、硬件除法等眾多功能強(qiáng)大的特性,,使用Thumb-2指令集實(shí)現(xiàn)了單精度浮點(diǎn)型的加、減,、乘,、除與比較運(yùn)算,并給出了加減法運(yùn)算的流程圖和除法運(yùn)算的源程序,。
Abstract:
Key words :

摘要:通過分析Cortex-M3內(nèi)核的結(jié)構(gòu)與浮點(diǎn)型格式,,充分利用Cortex-M3內(nèi)核中的分支預(yù)測(cè)、單周期乘法,、硬件除法等眾多功能強(qiáng)大的特性,,使用Thumb-2指令集實(shí)現(xiàn)了單精度浮點(diǎn)型的加、減,、乘,、除與比較運(yùn)算,并給出了加減法運(yùn)算的流程圖和除法運(yùn)算的源程序,。
關(guān)鍵詞:Cortex-M3內(nèi)核,;浮點(diǎn)型;速度

引言
    在一些較為復(fù)雜的運(yùn)算中,,經(jīng)常需要處理取值范圍大,、精度高的浮點(diǎn)型數(shù)據(jù)。但一般的低端嵌入式內(nèi)核中沒有浮點(diǎn)型硬件運(yùn)算器,,因此處理語音信號(hào)等數(shù)據(jù)比較困難,。本文提出了一種基于Cortex-M3內(nèi)核的浮點(diǎn)型運(yùn)算的處理方法。

1 Thumb-2指令集與COrtex-M3內(nèi)核結(jié)構(gòu)
    Thumb-2指令集具有以下優(yōu)點(diǎn):許多指令(包括乘法相關(guān)指令,、突破性的32位硬件除法指令等)都是單周期的,,并且位段處理指令取指都按32位處理。
    Cortex-M3是一個(gè)32位處理器內(nèi)核,,采用哈佛結(jié)構(gòu),,擁有獨(dú)立的指令總線和數(shù)據(jù)總線,可以讓取指與數(shù)據(jù)訪問并行不悖,。它具有如下特點(diǎn):功耗低,,有睡眠、停機(jī)和待機(jī)3種模式,;實(shí)時(shí)性好,;響應(yīng)中斷快,而且響應(yīng)中斷所需的周期數(shù)是確定的,;采用Thumb-2指令集,,使得代碼
密度和執(zhí)行效率更高。

2 浮點(diǎn)數(shù)的格式
    IEEE的浮點(diǎn)型數(shù)據(jù)標(biāo)準(zhǔn)規(guī)定,,浮點(diǎn)數(shù)具有單精度(4字節(jié)),、雙精度(8字節(jié))和擴(kuò)展精度(10字節(jié))三種浮點(diǎn)型格式。在實(shí)際的應(yīng)用中,使用最多的是單精度浮點(diǎn)數(shù),,格式如下:

a.JPG
    浮點(diǎn)數(shù)表示為:X=MsEsEm-1…E1E0 M-1M-2…M-n,。IEEE標(biāo)準(zhǔn)規(guī)定:階碼用移碼;尾數(shù)的符號(hào)位用1表示負(fù)數(shù),,0表示正數(shù),;尾數(shù)的數(shù)據(jù)位用原碼表示,并且隱藏了第24位(即M-1),,M-1為1,,所以尾數(shù)是大于等于0.5小于1的小數(shù)。
    階碼用移碼表示,、尾數(shù)用原碼表示浮點(diǎn)數(shù)的好處:
    ①浮點(diǎn)數(shù)據(jù)零的所有位均為零,。
    ②2個(gè)浮點(diǎn)數(shù)比較大小時(shí),可不必區(qū)分階碼位和數(shù)據(jù)位,,視為有符號(hào)32位整型數(shù)據(jù)比較,。

3 浮點(diǎn)型運(yùn)算的具體實(shí)現(xiàn)
3.1 加減運(yùn)算
    Cortex-M3是32位的內(nèi)核,可以把單精度浮點(diǎn)數(shù)存儲(chǔ)為32位的有符號(hào)整數(shù),,這樣便于比較運(yùn)算,。加減運(yùn)算的流程如圖1所示。

b.JPG


3.2 乘法運(yùn)算
    對(duì)于浮點(diǎn)型乘法運(yùn)算,,因?yàn)镃ortex-M3內(nèi)核支持單周期乘法指令,,所以運(yùn)算速度比較快。運(yùn)算流程與加減運(yùn)算相似,,不同之處有:階碼相加最高位取反得結(jié)果的階碼,;尾數(shù)不用正負(fù)號(hào)調(diào)整,,直接相乘,,而尾數(shù)的符號(hào)位異或即可得結(jié)果的符號(hào)位;兩個(gè)24位尾數(shù)相乘的結(jié)果為48位,,尾數(shù)規(guī)格化的時(shí)候,,判斷第48位是否為1,如果為1則階碼加1,,如果為O則第47位一定為1,,階碼不必調(diào)整。
3.3 除法運(yùn)算
    除法運(yùn)算中,,提取階碼,、重現(xiàn)尾數(shù)、提取尾數(shù)以及尾數(shù)符號(hào)位的操作與乘法運(yùn)算相同,,因此除法運(yùn)算過程與乘法運(yùn)算過程的基本相似,,只是計(jì)算X、Y尾數(shù)的商有所不同。
    計(jì)算商的方法為:先把X的尾數(shù)左移8位,,與Y的尾數(shù)相除得結(jié)果Z1,,并計(jì)算出余數(shù)W1=X-Z1*Y;W1先左移8位,,與Y的尾數(shù)相除得結(jié)果Z2,,并計(jì)算出余數(shù)W2=W1-Z2*Y;W2左移8位,,與Y的尾數(shù)相除得結(jié)果Z3,。調(diào)整Z1、Z2,、Z3并組裝成24位或25位尾數(shù),。除法運(yùn)算的源程序如下:
    c.JPG

d.JPG


   
3.4 浮點(diǎn)型數(shù)據(jù)比較
    從浮點(diǎn)型數(shù)據(jù)存儲(chǔ)的格式來看,可以把浮點(diǎn)數(shù)按照有符號(hào)整型數(shù)據(jù)來比較大小,。比較的結(jié)果:相等輸出O,,大于輸出1,小于輸出-1,。

4 測(cè)試結(jié)果
    利用基于Cortex-M3內(nèi)核的STM32F103VET6處理器測(cè)試浮點(diǎn)型運(yùn)算的速度,,處理器的工作頻率為72 MHz,測(cè)試的方法為:每完成一次浮點(diǎn)型運(yùn)算,,處理器的一引腳變化一次電平,。經(jīng)測(cè)試,變化一次電平耗時(shí)153ns,。圖2,、圖3是對(duì)乘法運(yùn)算和除法運(yùn)算的測(cè)試結(jié)果。從圖中可以看出,,乘法的運(yùn)算速率約為0.717μs/次,,除法的運(yùn)算速率約為0.957μs/次??梢?,運(yùn)算速率比較高,精度較高,,可以滿足實(shí)際應(yīng)用要求,。

     e.JPG

f.JPG

結(jié)語
    測(cè)試結(jié)果表明,在Cortex-M3內(nèi)核上實(shí)現(xiàn)浮點(diǎn)型運(yùn)算,,可以達(dá)到所要求的精度,,運(yùn)算速度較快,具有較高的實(shí)時(shí)性,。本文提出的浮點(diǎn)型運(yùn)算的處理方法在基于Cortex-M3內(nèi)核的處理器上有著較高的應(yīng)用價(jià)值,。希望對(duì)從事這方面的人員有所幫助。
 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。