網(wǎng)格環(huán)境下二叉樹(shù)后序遍歷的一種并行算法-AET-電子技術(shù)應(yīng)用

網(wǎng)格環(huán)境下二叉樹(shù)后序遍歷的一種并行算法

張飛1，2，華安1，2，曾國(guó)蓀1，2

1.同濟(jì)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)系，上海200092；2.國(guó)家高性能計(jì)算機(jī)工程技術(shù)中心同濟(jì)分中心，上海

摘要： 本文運(yùn)用網(wǎng)格環(huán)境下的并行計(jì)算模型G-PRAM來(lái)研究二叉樹(shù)的后序遍歷問(wèn)題，提出了二叉樹(shù)后序遍歷的一種并行算法，并給出示例和說(shuō)明。

關(guān)鍵詞： 網(wǎng)格環(huán)境二叉樹(shù) 后序遍歷并行算法

Abstract：

Key words :

摘要： 本文運(yùn)用網(wǎng)格環(huán)境下的并行計(jì)算模型G-PRAM來(lái)研究二叉樹(shù)的后序遍歷問(wèn)題，提出了二叉樹(shù)后序遍歷的一種并行算法，并給出示例和說(shuō)明。
關(guān)鍵詞： 網(wǎng)格環(huán)境二叉樹(shù) 后序遍歷并行算法

　　二叉樹(shù)[1]是一種重要的數(shù)據(jù)結(jié)構(gòu)，它是n(n≥0)個(gè)結(jié)點(diǎn)的有限集。它或者是空集（n=0），或者由一個(gè)根結(jié)點(diǎn)和兩棵互不相交的分別稱(chēng)為這個(gè)根的左、右子樹(shù)的二叉樹(shù)組成。二叉樹(shù)的遍歷可以分為三種：一種是先序遍歷，即先訪(fǎng)問(wèn)二叉樹(shù)的根結(jié)點(diǎn)，然后先序遍歷左子樹(shù)，最后先序遍歷右子樹(shù)；第二種是中序遍歷，即先中序遍歷左子樹(shù)，再訪(fǎng)問(wèn)二叉樹(shù)的根結(jié)點(diǎn)，最后中序遍歷右子樹(shù)；第三種是后序遍歷，即先后序遍歷左子樹(shù)，再后序遍歷右子樹(shù)，最后訪(fǎng)問(wèn)二叉樹(shù)的根結(jié)點(diǎn)。最常見(jiàn)的實(shí)現(xiàn)按照遍歷過(guò)程訪(fǎng)問(wèn)結(jié)點(diǎn)，讓每個(gè)結(jié)點(diǎn)被訪(fǎng)問(wèn)且僅被訪(fǎng)問(wèn)一次，這種方式稱(chēng)為串行算法。但是，可以換個(gè)角度來(lái)研究二叉樹(shù)的遍歷問(wèn)題，即從串行算法中以二叉樹(shù)的結(jié)點(diǎn)為重點(diǎn)考察對(duì)象轉(zhuǎn)變?yōu)橹攸c(diǎn)研究二叉樹(shù)的邊的遍歷問(wèn)題[2][4]。當(dāng)進(jìn)行二叉樹(shù)的一次遍歷時(shí)實(shí)際也遍歷了二叉樹(shù)的所有邊，而且每條邊遍歷了兩次。一次是從雙親結(jié)點(diǎn)到子結(jié)點(diǎn)，另一次則是從子結(jié)點(diǎn)到雙親結(jié)點(diǎn)。如果將每條邊變成兩條有向邊，一條有向邊對(duì)應(yīng)向下的遍歷，另一條有向邊對(duì)應(yīng)向上的遍歷，則遍歷二叉樹(shù)的結(jié)點(diǎn)問(wèn)題變成了一個(gè)遍歷二叉樹(shù)的邊的問(wèn)題。
　　因?yàn)榫W(wǎng)格環(huán)境具有一般的并行環(huán)境所不具有的強(qiáng)處理能力，所以可以給每條邊分配一個(gè)獨(dú)立的處理單元（單處理器的網(wǎng)格節(jié)點(diǎn)或者多處理器網(wǎng)格節(jié)點(diǎn)的一個(gè)處理器）進(jìn)行處理，利用多個(gè)處理單元同時(shí)對(duì)所有的邊進(jìn)行處理，從而并行實(shí)現(xiàn)網(wǎng)格環(huán)境下的二叉樹(shù)后序遍歷。
1 網(wǎng)格環(huán)境下的G-PRAM模型
　　由Fortune和Wyllie形式化的PRAM[5]模型是一個(gè)理想化的并行計(jì)算模型，被廣泛用來(lái)評(píng)估并行算法的理論性能。PRAM的思想是假設(shè)一個(gè)共享存儲(chǔ)多處理機(jī)系統(tǒng)是由一個(gè)具有無(wú)限存儲(chǔ)容量的共享存儲(chǔ)器以及可對(duì)它進(jìn)行訪(fǎng)問(wèn)的許多處理機(jī)所組成的系統(tǒng)。并行算法的設(shè)計(jì)者可以把處理器的能力看成是無(wú)限的。一個(gè)PRAM由一個(gè)控制單元、全局內(nèi)存和一組處理器集合組成。每個(gè)處理器有其自己的私有內(nèi)存，所有處理器執(zhí)行相同的指令，但每個(gè)處理器處理的數(shù)據(jù)不同。PRAM模型有四種，不同之處主要在于它們處理讀寫(xiě)沖突的方式有差異，包括：互斥讀互斥寫(xiě)(Exclusive Read，Exclusive Write，EREW PRAM)，并行讀互斥寫(xiě)(Concurrent Read，Exclusive Write，CREW PRAM），互斥讀并行寫(xiě)(Exclusive Read，Concurrent Write，ERCW PRAM)，并行讀并行寫(xiě)(Concurrent Read，Concurrent Write，CRCW PRAM)。網(wǎng)格環(huán)境往往由相當(dāng)多的網(wǎng)格結(jié)點(diǎn)組成，這些結(jié)點(diǎn)有的是多處理器的高性能計(jì)算結(jié)點(diǎn)，有的是高容量的數(shù)據(jù)結(jié)點(diǎn)，并且往往有一個(gè)性能不錯(cuò)且容量也很大的控制結(jié)點(diǎn)。因此提出相應(yīng)的G-PRAM模型。G-PRAM可以看作是一般PRAM的現(xiàn)實(shí)化。
　　定義1 一個(gè)G-PRAM由網(wǎng)格環(huán)境下的一個(gè)控制結(jié)點(diǎn)、一個(gè)全局?jǐn)?shù)據(jù)結(jié)點(diǎn)和一組計(jì)算結(jié)點(diǎn)集合組成。每個(gè)網(wǎng)格計(jì)算結(jié)點(diǎn)有其自己的私有內(nèi)存，所有網(wǎng)格計(jì)算結(jié)點(diǎn)的各個(gè)處理器執(zhí)行相同的指令，但每個(gè)處理器處理的數(shù)據(jù)不一樣。相應(yīng)的G-PRAM也有4種方式：EREW G-PRAM、CREW G-PRAM、ERCW G-PRAM、CRCW G-PRAM。
2 并行實(shí)現(xiàn)二叉樹(shù)的后序遍歷
2.1 算法過(guò)程說(shuō)明
　　這里的算法采用并行讀互斥寫(xiě)（CREW G-PRAM），算法在實(shí)現(xiàn)中對(duì)每個(gè)二叉樹(shù)結(jié)點(diǎn)保存結(jié)點(diǎn)的雙親、左孩子和右孩子，利用這三個(gè)參數(shù)來(lái)描述一個(gè)二叉樹(shù)結(jié)點(diǎn)在二叉樹(shù)中的相對(duì)位置。
對(duì)于如圖1所示的二叉樹(shù)，其數(shù)據(jù)結(jié)構(gòu)描述如表1所示。

　　下面分析本文中的算法步驟。
2.1.1 改造二叉樹(shù)并構(gòu)造單鏈表
　　首先可以將二叉樹(shù)改造成一個(gè)對(duì)應(yīng)的有向圖。方法是將二叉樹(shù)的每條無(wú)向邊改成一條向下和另一條向上的有向邊，結(jié)點(diǎn)不變。如圖1的二叉樹(shù)可以改造成如圖2的有向圖。

　　根據(jù)改造后的有向圖構(gòu)造單鏈表的過(guò)程就是在該有向圖中尋找后繼邊的過(guò)程，按照后序遍歷的思想，所有的處理器同時(shí)處理分配給它的一條邊的后繼邊的問(wèn)題，最終得到由全部有向邊構(gòu)成的一個(gè)單鏈表。單鏈表的每個(gè)元素對(duì)應(yīng)于改造后的有向圖中的一條有向邊。
　　設(shè)分配給處理器P[(i，j)]處理的有向邊是(i，j)，即該邊從結(jié)點(diǎn)i指向j，則尋找有向邊(i，j)后繼邊的問(wèn)題可以根據(jù)有向邊(i，j)的不同類(lèi)型分別處理。
　　(1)PARENT(i)=j，說(shuō)明邊(i，j)是一條向上邊，即從一個(gè)結(jié)點(diǎn)指向它的雙親結(jié)點(diǎn)。從數(shù)據(jù)結(jié)構(gòu)的概念中可以得到以下結(jié)論，一條向上的邊(i，j)在二叉樹(shù)中的相對(duì)位置可以有三種情況：①結(jié)點(diǎn)j有右孩子結(jié)點(diǎn)，如圖3(a)所示。則根據(jù)后序遍歷的思想可得邊(i，j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的右孩子結(jié)點(diǎn)構(gòu)成的邊；②結(jié)點(diǎn)i沒(méi)有右兄弟結(jié)點(diǎn)，而結(jié)點(diǎn)j有雙親結(jié)點(diǎn)，如圖3(b)所示。若根據(jù)后序遍歷的思想可得邊(i，j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的雙親結(jié)點(diǎn)(parent)構(gòu)成的邊；③結(jié)點(diǎn)i既沒(méi)有兄弟結(jié)點(diǎn)，同時(shí)也沒(méi)有雙親結(jié)點(diǎn)，如圖3(c)所示，說(shuō)明已經(jīng)回到了根結(jié)點(diǎn)處，邊(i，j)沒(méi)有后繼邊。但為了方便起見(jiàn)，假設(shè)存在一條后繼邊，從結(jié)點(diǎn)j到它自身。

　　(2)PARENT(i)≠j，也就是邊(i，j)是從雙親結(jié)點(diǎn)到它的孩子的向下的邊。
　　同理，從數(shù)據(jù)結(jié)構(gòu)的概念中可以得出這樣的結(jié)論，即一條向下的邊(i，j)在二叉樹(shù)中的位置可以有如下情況：①結(jié)點(diǎn)j有左孩子結(jié)點(diǎn)(不管有無(wú)右孩子結(jié)點(diǎn))，如圖4(a)所示。根據(jù)后序遍歷的思想可知，邊(i，j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的左孩子結(jié)點(diǎn)構(gòu)成的邊。②結(jié)點(diǎn)j沒(méi)有左孩子，但有右孩子，如圖4(b)所示。根據(jù)后序遍歷的思想可得，邊(i，j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的右孩子結(jié)點(diǎn)構(gòu)成的邊。③結(jié)點(diǎn)j沒(méi)有孩子結(jié)點(diǎn)，即結(jié)點(diǎn)j是葉子結(jié)點(diǎn)，如圖4(c)所示。則根據(jù)后序遍歷的思想可得，邊(i，j)的后繼邊是結(jié)點(diǎn)j指向結(jié)點(diǎn)i的向上邊。

2.1.2 給單鏈表中的每個(gè)元素賦權(quán)值0或1
　　此過(guò)程也是所有的處理器同時(shí)對(duì)分配給它的一個(gè)元素賦權(quán)值（前面構(gòu)造的單鏈表中的元素）。根據(jù)后序遍歷的思想，對(duì)于二叉樹(shù)的一個(gè)結(jié)點(diǎn)i（根結(jié)點(diǎn)例外，必須作不同處理），如果一條向下遍歷的邊(i，j)從結(jié)點(diǎn)i出發(fā)，則說(shuō)明正在尋找從該結(jié)點(diǎn)i出發(fā)的后繼邊，結(jié)點(diǎn)i沒(méi)有被訪(fǎng)問(wèn)；如果一條向上遍歷的邊(i，j)從結(jié)點(diǎn)i出發(fā)，則說(shuō)明剛訪(fǎng)問(wèn)完結(jié)點(diǎn)i。將單鏈表中對(duì)應(yīng)向上邊的元素賦權(quán)值1（表示遍歷向上邊時(shí)增加了一個(gè)被訪(fǎng)問(wèn)結(jié)點(diǎn)），對(duì)應(yīng)向下邊的元素賦權(quán)值0（表示遍歷向下邊時(shí)未增加被訪(fǎng)問(wèn)結(jié)點(diǎn)），對(duì)應(yīng)根結(jié)點(diǎn)的環(huán)形邊元素也賦權(quán)值0（特殊處理）。
2.1.3 計(jì)算單鏈表中各元素的位序
　　單鏈表中每個(gè)元素需要分配一個(gè)處理器去計(jì)算其位序。一棵有N個(gè)結(jié)點(diǎn)的二叉樹(shù)具有（N-1）條無(wú)向邊。由于我們將每條無(wú)向邊轉(zhuǎn)換成一條向上邊和一條向下邊，所以它共有2（N-1）條邊，這意味著單鏈表中有2（N-1）個(gè)元素。所以，需要2（N-1）個(gè)處理器來(lái)計(jì)算單鏈表中元素的位序。利用計(jì)算單鏈表位序的后綴和算法可以算出單鏈表中每個(gè)元素的位序[6]。
2.1.4 求權(quán)值為1的元素的相應(yīng)結(jié)點(diǎn)的遍歷順序號(hào)
　　由于權(quán)值為1（向上的邊）的元素所代表的邊都是向上的邊(不妨設(shè)該邊為(i，j))，即結(jié)點(diǎn)i在邊(i，j)遍歷時(shí)被訪(fǎng)問(wèn)，而結(jié)點(diǎn)j還未被訪(fǎng)問(wèn)。因此，用單鏈表中權(quán)值為1的元素的位序表示它所代表的邊(i，j)中結(jié)點(diǎn)i的位序，從而可以得到二叉樹(shù)中全部結(jié)點(diǎn)的位序。結(jié)點(diǎn)的位序是結(jié)點(diǎn)被訪(fǎng)問(wèn)的先后順序的逆序。只要用結(jié)點(diǎn)個(gè)數(shù)N減去每個(gè)結(jié)點(diǎn)的位序就可以得到每個(gè)結(jié)點(diǎn)的后序遍歷順序號(hào)。與前幾步一樣，這里也是一個(gè)處理器計(jì)算一個(gè)結(jié)點(diǎn)的順序號(hào)，多個(gè)處理器并行工作，最后，得到一棵二叉樹(shù)的后序遍歷的結(jié)點(diǎn)順序。
2.2 算法示意代碼
　　算法描述如下：
　　int n；    //二叉樹(shù)的結(jié)點(diǎn)個(gè)數(shù)
　　int parent[n]；   //父結(jié)點(diǎn)數(shù)組
　　int lchild[n]；   //左孩子結(jié)點(diǎn)數(shù)組
　　int rchild[n]；   //右孩子結(jié)點(diǎn)數(shù)組
　　int succ[(n，n)]；  //后繼邊數(shù)組
　　int position[(n，n)]；  //鏈表元素的位序數(shù)組
　　int postnode[n]；  //結(jié)點(diǎn)順序號(hào)數(shù)組
　　PostOrder(bitree *t)
　　　　　　　　//P[(i，j)]是處理對(duì)應(yīng)邊(i，j)的一個(gè)處理器，共2(n-1)個(gè)
　　{
　　forall P[(i，j)] do  //構(gòu)造單鏈表
　　{
    　　if(lchild[j]==i)
    　　{ if(rchild[j]!=null)
       　　　　succ[(i，j)]=(j，j.rchild)；
　　　  else     if(parent[j]!=null)
　　　　     succ[(i，j)]=(j,，j.parent)；
　　     else{
　　　　     succ[(i，j)]=(j，j)；
　　　　     postnode[j]=0；//j是根結(jié)點(diǎn)
　　　}//else
　　}//if
　　else       if(rchild[j]==i)
       　　{  　if(j.parent!=null)
      　　　　　　　　succ[(i，j)]=(j，j.parent)；
　　　　     else{
　　　　　　　　      succ[(i，j)]=(j，j)；
　　　　　　　　      postnode[j]=0；//j是根結(jié)點(diǎn)
　　　　     }//else
　　       }//if
　　　　　else     if(parent[j]==i)
　　       {  　if(lchild[j]!=null)
　　　　　　　　      succ[(i，j)]=(j，j.lchild)；
　　　　    else if(rchild[j]!=null)
　　　　　　　　       succ[(i，j)]=(j，j.rchild)；
　　　       else succ[(i，j)]=(j，i)；
　　       }//if
　　　　　　　    //給單鏈表中的每個(gè)元素賦權(quán)值
　　if(parent[i]==j)
　　　　　position[(i，j)]=1；
　　else
   　　　　 position[(i，j)]=0；
                                   //計(jì)算單鏈表中元素的位序
        where 0≤k<log(n-1)+1 do
        { position[(i，j)]=position[(i，j)]+position[succ[(i，j)]]；
       succ[(i，j)]=succ[succ[(i，j)]]；
    　}//for
     　if(parent[i]==j)     //求結(jié)點(diǎn)的后序遍歷順序號(hào)
  　　　　postnode[i]=postion[(i，j)]；
    　　　}//forall
　　}
3 結(jié)束語(yǔ)
　　以圖1所示的二叉樹(shù)為例，按照上述算法構(gòu)造的單鏈表（帶權(quán)值）如圖5所示。表2為二叉樹(shù)單鏈表的位序。

　　從表2中選出權(quán)值為1的邊(D，B)、(B，A)、(E，C)、(G，F(xiàn))、(F，C)、(C，A)，所以結(jié)點(diǎn)D、B、E、G、F、C、A的位序就是6、5、4、3、2、1、0。即后序遍歷順序號(hào)是：1、2、3、4、5、6、7，可得出后序遍歷的順序是D、B、E、G、F、C、A。

　　一棵有N個(gè)結(jié)點(diǎn)的二叉樹(shù)具有(N-1)條無(wú)向邊。由于要將每條無(wú)向邊轉(zhuǎn)換成一條向上邊和一條向下邊，所以它共有2(N-1)條有向邊。因此，該算法需要2(N-1)個(gè)網(wǎng)格處理單元（處理器），而網(wǎng)格計(jì)算技術(shù)的發(fā)展為并行算法的實(shí)現(xiàn)提供了環(huán)境的支持。在本算法中求單鏈表中元素的位序的計(jì)算時(shí)間復(fù)雜度為O(log_N)，而算法的其余部分的計(jì)算時(shí)間是常數(shù)，所以算法的復(fù)雜度為O(log_N)。
參考文獻(xiàn)
1   嚴(yán)蔚敏，吳偉民.數(shù)據(jù)結(jié)構(gòu)(C語(yǔ)言版).北京：清華大學(xué)出版社，1997
2   Tarjan R E，Vishkin U.An efficient parallel biconnectivity algorithm.SIAM Journal of Computer，1985；1(14)
3   Foster I.The Grid：A New Infrastructure for 21st Century Science.Physics Today，2002；55(2)
4   熊家軍，岳大為，李肯立.基于SIMD-SM模型的樹(shù)的后根遍歷并行算法.計(jì)算機(jī)工程與應(yīng)用，2002；38(06)
5   Wilkinson B，Allen M.Parallel programming: techniques and applications using networked workstation and parallel computers.Prentice Hall Inc，1999
6   Karp R M，Ramachandran V.Parallel Algorithms for Shared-Memory Machines.Handbook of Theoretical Computer Science，vol A，MIT Press，1990

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容