摘? 要: 介紹一種在8096/98系列單片機(jī)上實(shí)現(xiàn)的單精度浮點(diǎn)數(shù)快速除法。該算法采用了預(yù)估-修正的數(shù)值計(jì)算方法,并充分利用了16位CPU中的乘除法指令,計(jì)算速度快,、精度高,有很強(qiáng)的實(shí)用性。
關(guān)鍵詞: 浮點(diǎn)數(shù)? 除法 尾數(shù)? 預(yù)估-修正? 誤差? 精度
?
在較為復(fù)雜的單片機(jī)系統(tǒng)中,為擴(kuò)大取值范圍,實(shí)現(xiàn)復(fù)雜的計(jì)算和控制,一般都要涉及浮點(diǎn)數(shù)的運(yùn)算,。而一般單片機(jī)是沒有浮點(diǎn)數(shù)運(yùn)算指令的,必須自行編制相應(yīng)軟件。在進(jìn)行除法計(jì)算時,通常使用的方法是比較除法[1],即利用循環(huán)移位和減法操作來得到24~32位商,效率很低。有些文獻(xiàn)給出了一些改進(jìn)方法[2],但思路不清晰,很難推廣使用,。這里給出一種浮點(diǎn)數(shù)除法運(yùn)算的實(shí)用快速算法,。該方法以數(shù)值計(jì)算中的預(yù)估-修正方法為指導(dǎo),充分利用了16位單片機(jī)的乘除法功能,很輕易地實(shí)現(xiàn)了浮點(diǎn)數(shù)的除法。
1 浮點(diǎn)數(shù)格式
IEEE的浮點(diǎn)數(shù)標(biāo)準(zhǔn)規(guī)定了單精度(4字節(jié)),、雙精度(8字節(jié))和擴(kuò)展精度(10字節(jié))三種浮點(diǎn)數(shù)的格式,。最常用的是單精度浮點(diǎn)數(shù),格式如圖1所示。但是這種格式的階碼不在同一個字節(jié)單元內(nèi),不易尋址,從而會影響運(yùn)算速度,。
?
通常在單片機(jī)上采用的是一種變形格式的浮點(diǎn)數(shù),如圖2所示,。其中的23位尾數(shù)加上隱含的最高位1,,構(gòu)成一個定點(diǎn)原碼小數(shù),即尾數(shù)為小于1大于等于0.5的小數(shù),。有關(guān)浮點(diǎn)數(shù)格式的詳細(xì)內(nèi)容請參考有關(guān)文獻(xiàn)[1][2]。
?
2 快速除法的算法原理
在16位單片機(jī)中只有16位的乘除法,而浮點(diǎn)數(shù)的精度(即尾數(shù)的有效位數(shù))達(dá)24位,因此無法直接相除,但仍然可以利用16位的乘除法指令來實(shí)現(xiàn)24位除法,。不過,如果只進(jìn)行一次16位的除法必定會帶來很大誤差,因此問題的關(guān)鍵在于如何消除這個誤差,從而達(dá)到要求的精度,。這其實(shí)就是通常數(shù)值計(jì)算中所采用的預(yù)估-修正方法。
假設(shè)兩個浮點(diǎn)數(shù)經(jīng)過預(yù)處理后,被除數(shù)和除數(shù)尾數(shù)擴(kuò)展為32位(末8位為0)分別放入X和Y中,。令YL為Y的低16位,,并記YH=Y-YL。顯然YH≈Y,,X/Y與X/YH相差不多:
可見只需要在X/YH的基礎(chǔ)上再乘以一個修正因子(YH-YL)/YH,就可以得到X/Y的一次校準(zhǔn)值,。不難證明這個值已經(jīng)達(dá)到了24位的精度要求。事實(shí)上,相對誤差滿足:
這說明這個一次校準(zhǔn)值完全可以作為最終的結(jié)果,。
3 算法的具體實(shí)現(xiàn)
這里的YH雖仍是32位,但其低16位已為0,計(jì)算時可以將它視為16位數(shù),這不會影響計(jì)算精度,。通過兩次16位除法,就可得到精確的32位結(jié)果。例如,計(jì)算Q0時,第一次除法,X除以YH的高16位,得到的商為Q0的高16位,而16位余數(shù)末尾添0成32位,再除以YH的高16位,得到Q0的低16位(余數(shù)舍去),。由此得到了32位的Q0,。
在具體運(yùn)算中,X應(yīng)先除以4(X右移2位),以保證Q0不會溢出(YH取高16位):
在計(jì)算Q0′、Q1時,均進(jìn)行了兩次16位除法,使得Q0′,、Q1均為精確的32位,保證了計(jì)算過程中的精度,減小了累積誤差,。對于YL=0即除數(shù)只有16位有效數(shù)字的特殊情況,直接有Q1=1,還能省去兩次16位除法。
在計(jì)算Q時,則通過3次16位乘法實(shí)現(xiàn)了32位乘法,取結(jié)果的高32位,即得Q,。
整個算法至多只須用4次除法,、3次乘法和5次加法,就求得了浮點(diǎn)數(shù)商的尾數(shù),可見計(jì)算效率是很高的,保證了運(yùn)算速度。
浮點(diǎn)數(shù)除法流程圖如圖3所示,。
4 程序源代碼
限于篇幅,只給出源代碼中的關(guān)鍵部分,即有效數(shù)字的計(jì)算部分,。
;被除數(shù)為x,,除數(shù)為y
,;用yh,yl分別表示y的高16位和低16位
…
;假設(shè)x,,y的有效數(shù)字部分分別在(dx,,cx)和(bx,ax)中
,;計(jì)算預(yù)估值Q0′=(x/4)/yh
shrl? cx,, #2???????? ;計(jì)算x/4
divu cx,, bx????????? ,;計(jì)算(x/4)÷yh
ld?fx, cx??? ??????? ,;把商暫放入寄存器fx,,即Q0′的高16位有
????????????????????? ;效數(shù)字
clr?? cx
divu cx,, bx????????? ,;把余數(shù)末尾添0后再除以yh
ld? ex, cx???? ??;把商暫放入寄存器ex, 即Q0′
??????????????????????,;的低16位有效數(shù)字
??????????????????????,;(fx,ex) = Q0′
,;計(jì)算修正因子 Q1=(yh-yl)/yh
cmp ax,, 0??????????? ;判斷yl是否為0
jne?? getQ1?????????? ,;若yl非0,,計(jì)算修正因數(shù)Q1
ld?? ax, ex????????? ,;若yl=0,, 修正因數(shù)Q1=1
ld? ?bx, fx????????? ,;(Q0′×Q1)=Q0′,,可以直接計(jì)算Q
sjmp? getQ
getQ1:
ld? hx, bx?????????? ,;把yh放于寄存器hx中
neg? ax
dec? bx?????????????? ,;計(jì)算yh-yl
divu ax, hx????????? ,;計(jì)算Q1=(yh-yl)÷yh
ld??dx,, ax?? ????????,;把商暫時放入寄存器dx,即Q1的高16位有
????????????????????? ,;效數(shù)字
clr?? ax
divu ax,, hx?? ?????? ;把余數(shù)末尾添0后再除以yh,得Q1的
????????????????????? ,;低16位有效數(shù)字
ld? bx dx ??????????,;(bx,ax) = Q1
,;計(jì)算Q0′×Q1=(fx,,ex)×(bx,ax),,只取32位有效數(shù)字
ld???? hx,, bx
mulu???cx, bx,, ex?? ,;(dx,,cx) = bx×ex
mulu???ax,, fx??????? ;(bx,,ax) = ax×fx
clr? ex?
add? cx,, ax?
addc? dx, bx?
addc? ex,, 0?????????? ,;(ex,dx,,cx)=(dx,,cx)+(bx,ax)?
mulu? ax,, fx,, hx???? ;(bx,,ax) = fx×hx?
add? ax,, dx????????? ?;(bx,,ax) = (bx,,ax)+(ex,dx)?
addc??bx,, ex????? ????,;(bx,ax) = Q0′× Q1?
;計(jì)算校準(zhǔn)值Q = (Q0′×Q1)×4并調(diào)整階碼
getQ:
…
代碼到這里為止,浮點(diǎn)數(shù)商的有效數(shù)字已經(jīng)全部求出,。只要再執(zhí)行一些調(diào)整浮點(diǎn)數(shù)階碼的操作,就可以得到最終結(jié)果,。
在作者開發(fā)的一個80C196KC單片機(jī)系統(tǒng)中,涉及到了二進(jìn)制-十進(jìn)制數(shù)制轉(zhuǎn)換、分段線性插值,、數(shù)字濾波等大量浮點(diǎn)數(shù)的運(yùn)算,都是靠加減乘除等底層函數(shù)來實(shí)現(xiàn)的,。
此外,本算法思路清晰,因此很容易加以推廣。例如,為了得到更高的精度,,可取修正因子:
????
?
參考文獻(xiàn)
1 復(fù)旦大學(xué)計(jì)算機(jī)系微機(jī)開發(fā)研究室.十六位單片機(jī)8096的原理和設(shè)計(jì)方法.重慶:科學(xué)技術(shù)文獻(xiàn)出版社重
? 慶分社,,1988
2 涂時亮,姚志石.單片微機(jī)MCS-96/98實(shí)用子程序.上海:復(fù)旦大學(xué)出版社,, 1991
3 李慶揚(yáng).數(shù)值分析. 武漢:華中工學(xué)院出版社,, 1986