《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 解決方案 > NEON編碼 - 左右移位

NEON編碼 - 左右移位

2011-08-09
作者:Martyn ARM資深軟件工程師
關(guān)鍵詞: ARM NEON編碼

 

本文將介紹NEON提供的移位運(yùn)算,并顯示如何利用移位運(yùn)算在常用顏色深度之間轉(zhuǎn)換影像數(shù)據(jù)。

向量移位

NEON上的移位與標(biāo)量ARM編碼中可能用到的移位非常相似,,即每個(gè)向量元素的位數(shù)均向左或向右移位,,出現(xiàn)在每個(gè)元素左側(cè)或右側(cè)的位將被刪除,;它們不能移位至相鄰的元素。

移位的數(shù)量可通過指令中編碼的文字或附加的移位向量來(lái)指定。使用移位向量時(shí),應(yīng)用到輸入向量每個(gè)元素的移位取決于移位向量中對(duì)應(yīng)元素的值,。移位向量中的元素被當(dāng)作帶符號(hào)的值來(lái)處理,因此按元素分配,,左移位,、右移位和零移位都有可能發(fā)生。

帶符號(hào)元素的向量上發(fā)生的右移位由指令附加的類型指定,,并會(huì)將符號(hào)擴(kuò)展至每一個(gè)元素,。這與ARM編碼中可能用到的算術(shù)移位相同。應(yīng)用到無(wú)符號(hào)向量的移位不會(huì)發(fā)生符號(hào)擴(kuò)展,。

移位與插入NEON也支持通過插入產(chǎn)生移位,,使兩個(gè)不同向量的位相結(jié)合。例如,,左移位與插入(VSLI)可使源向量的每一個(gè)元素均向左移位,。每個(gè)元素右側(cè)新插入的位就是目標(biāo)向量中的對(duì)應(yīng)位。

 

移位與計(jì)算最后,,NEON還支持向量元素向右移位,并將結(jié)果計(jì)入到另一個(gè)向量中,。這種方法對(duì)于先在高精度條件下進(jìn)行臨時(shí)計(jì)算,,然后再將結(jié)果與低精度計(jì)算器相結(jié)合的情況非常有用。

指令修改器每個(gè)移位指令都能擁有一個(gè)或多個(gè)修改器,。這些修改器并不改變移位運(yùn)算本身,,而是通過調(diào)整輸入值或輸出值,消除偏差或飽和狀況,,保持一定的范圍,。共有五種移位修改器:

 

  • 舍位修改器 (Rounding)以R前綴表示,,可以糾正右移時(shí)舍位導(dǎo)致的偏差,。
  • 窄修改器 (Narrow),以N后綴表示,,可以讓結(jié)果中每個(gè)元素的位數(shù)減半,。它代表Q(128位)源和D(64位)目標(biāo)寄存器。
  • 長(zhǎng)修改器 (Long),,以L后綴表示,,可以讓結(jié)果中每個(gè)元素的位數(shù)加倍,。它代表D源和Q目標(biāo)寄存器。 飽和修改器 (Saturating),,以Q前綴表示,,可以在最大和最小可表范圍內(nèi)設(shè)置每個(gè)結(jié)果元素,前提是結(jié)果未超出該范圍,。向量的位數(shù)和符號(hào)類型可用于確定飽和范圍,。
  • 無(wú)符號(hào)飽和修改器 (Unsigned Saturating),以Q前綴和U后綴表示,,與飽和修改器類似,,但在進(jìn)行帶符號(hào)或無(wú)符號(hào)輸入時(shí),結(jié)果將在無(wú)符號(hào)范圍內(nèi)表現(xiàn)為飽和,。

 

這些修改器的部分組合并未表現(xiàn)出有用的運(yùn)算,,因此NEON也沒有提供相應(yīng)指令。例如,,飽和右移位(應(yīng)稱為VQSHR)其實(shí)就毫無(wú)必要,,因?yàn)橛乙莆恢粫?huì)讓結(jié)果變得更小,因而值根本無(wú)法超出有效范圍,。

可用移位表NEON提供的所有移位指令均在下表中列出,。它們根據(jù)先前提到的修改器進(jìn)行排列。如果你還是不太確定修改器各個(gè)字母代表的含義,,請(qǐng)利用下表選擇需要的指令,。

 

示例:轉(zhuǎn)換顏色深度顏色深度之間的轉(zhuǎn)換是圖形處理中經(jīng)常需要的運(yùn)算。通常,,輸入或輸出數(shù)據(jù)都是RGB565 16位顏色格式,,但RGB888格式的數(shù)據(jù)處理起來(lái)更為方便。對(duì)于NEON而言尤其如此,,因?yàn)樗鼰o(wú)法為RGB565這樣的數(shù)據(jù)類型提供本機(jī)支持,。

 

但是,NEON仍然可以有效地處理RGB565數(shù)據(jù),,上文中介紹的向量移位便提供了處理方法,。

565888首先,我們來(lái)看如何將RGB565轉(zhuǎn)換為RGB888,。假設(shè)寄存器q0中有8個(gè)16位像素,,我們想要在d2、d3和d4這三個(gè)寄存器中將紅色,、綠色和藍(lán)色分離成8位的元素,。

 

每個(gè)指令的效果都在上面?zhèn)渥⒅凶隽嗣枋觯偠灾總€(gè)通道上執(zhí)行的運(yùn)算為:

 

  • 利用移位推掉元素任意一端的位數(shù),,清除相鄰?fù)ǖ赖念伾珨?shù)據(jù),。
  • 使用第二次移位將顏色數(shù)據(jù)放置到每個(gè)元素最重要的位上,并縮短位數(shù)將元素大小從16位減至8位,。

 

請(qǐng)注意在這個(gè)順序中使用元素大小來(lái)確定8位和16位元素的位置,,以進(jìn)行部分掩碼運(yùn)算。

一個(gè)小問題你可能會(huì)注意到,,如果使用上述代碼轉(zhuǎn)換到RGB888格式,,白色顯得不夠白。這是因?yàn)?,?duì)于每個(gè)通道而言,,最低的2或3位是零,而不是1,;白色在RGB565中表示為(0x1F, 0x3F, 0x1F),,而在RGB888中,卻變成了 (0xF8, 0xFC, 0xF8),。這可以通過移位來(lái)解決,,將部分最重要的位插入到低位。

888565現(xiàn)在,,我們來(lái)看反向運(yùn)算,,即從RGB888轉(zhuǎn)換為RGB565。這里,,我們假設(shè)RGB888數(shù)據(jù)為上述代碼產(chǎn)生的格式,;在d0、d1和d2這三個(gè)寄存器上,,每個(gè)寄存器均包含每種顏色的8個(gè)元素,。結(jié)果將存儲(chǔ)為q2格式的8個(gè)16位RGB565元素。



同樣,,每個(gè)指令的詳細(xì)說明在備注中列出,但總而言之,,對(duì)于每個(gè)通道而言:

 

  • 將每個(gè)元素的長(zhǎng)度擴(kuò)展至16位,,并將顏色數(shù)據(jù)移至最重要的位上。
  • 使用插入右移位,,將每個(gè)顏色通道放置到結(jié)果寄存器中,。

 

結(jié)論NEON提供的強(qiáng)大的移位指令范圍讓你能夠:

 

  • 利用舍入和飽和,通過二次冪快速進(jìn)行向量的除法和乘法運(yùn)算,。
  • 通過移位將一個(gè)向量位復(fù)制到另一個(gè)向量位,。
  • 在高精度條件下進(jìn)行臨時(shí)計(jì)算,并在低精度條件下計(jì)算結(jié)果。

 

Martyn是處理器領(lǐng)域的資深軟件工程師,,已在ARM工作了近10年,。他主要負(fù)責(zé)改善ARM平臺(tái)上軟件的性能和體驗(yàn)。他對(duì)使用匯編語(yǔ)言和SIMD實(shí)現(xiàn)軟件優(yōu)化非常感興趣,,尤其是在圖形和多媒體領(lǐng)域,。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。