摘 要: 提出一種新的協(xié)議棧設(shè)計(jì)思路——基于驅(qū)動(dòng)程序的協(xié)議棧設(shè)計(jì),,在對(duì)比傳統(tǒng)的協(xié)議棧設(shè)計(jì)方式——基于任務(wù)的協(xié)議棧設(shè)計(jì)的基礎(chǔ)上,,說明了此種方法的優(yōu)勢(shì)所在,,并給出了協(xié)議棧設(shè)計(jì)的基本框架
關(guān)鍵詞: 設(shè)備驅(qū)動(dòng) 協(xié)議驅(qū)動(dòng) 操作任務(wù) 協(xié)議棧
基于驅(qū)動(dòng)程序的協(xié)議棧設(shè)計(jì),,相比于傳統(tǒng)的基于任務(wù)的協(xié)議棧設(shè)計(jì)來(lái)說有兩點(diǎn)好處:(1)效率更高,;(2)對(duì)于有多個(gè)協(xié)議棧的系統(tǒng)來(lái)說,,有更大的兼容性,。
1 基于任務(wù)的方式
在我們比較兩種設(shè)計(jì)方式的技術(shù)細(xì)節(jié)之前,我們必須了解它們,。傳統(tǒng)的設(shè)計(jì)方式包括將協(xié)議棧置于實(shí)時(shí)操作系統(tǒng)或內(nèi)核之上,,但是大多數(shù)實(shí)時(shí)操作系統(tǒng)不提供網(wǎng)絡(luò)互連的框架,。所以,協(xié)議棧的設(shè)計(jì)者們不得不利用實(shí)時(shí)操作系統(tǒng)提供的機(jī)制——Task,。圖1說明了如何利用任務(wù)來(lái)實(shí)現(xiàn)一個(gè)三層間通信的協(xié)議,。每一層被作為一個(gè)單獨(dú)的任務(wù),,外加任務(wù)間通信機(jī)制負(fù)責(zé)傳送數(shù)據(jù)和控制包上下通過協(xié)議棧,,程序設(shè)計(jì)者負(fù)責(zé)定義層與層之間的接口和一個(gè)應(yīng)用程序接口(API),以利于應(yīng)用程序員傳送和接收數(shù)據(jù),。
在這里存在幾個(gè)效率不高的來(lái)源:首先,,正如圖1中點(diǎn)線所說明的,當(dāng)包在應(yīng)用程序,、上層的通信協(xié)議,,以及網(wǎng)絡(luò)接口的設(shè)備驅(qū)動(dòng)程序之間交換時(shí),下層的操作系統(tǒng)正忙于上下文切換,,每一次實(shí)時(shí)操作系統(tǒng)掛起其中一個(gè)任務(wù),,恢復(fù)執(zhí)行另一個(gè)任務(wù),時(shí)間都浪費(fèi)在存取任務(wù)上下文中,,考慮到每一個(gè)包無(wú)論是發(fā)還是收,,都要通過協(xié)議棧的每一層,上下文切換的確造成了巨大的浪費(fèi),。另外,,當(dāng)數(shù)據(jù)和控制包在應(yīng)用程序任務(wù)和網(wǎng)絡(luò)接口之間流動(dòng)時(shí),包含此類信息的緩沖區(qū)必然重復(fù)在任務(wù)間通信隊(duì)列加入或刪除,。然而,,這個(gè)系統(tǒng)開銷是很大的,這本身是由于系統(tǒng)在隊(duì)列操作時(shí)必然包括需與中斷和上下文切換隔離的臨界區(qū),。因此,,不僅時(shí)間浪費(fèi)于隊(duì)列操作,而且整個(gè)系統(tǒng)對(duì)一些重要的事件例如中斷的響應(yīng)變得延遲,。
2 基于驅(qū)動(dòng)程序的方法
另外一種選擇是將協(xié)議棧各層置于實(shí)時(shí)操作系統(tǒng)之中,,圖2說明了基于此種方案,同樣的三層間通信協(xié)議是如何實(shí)施的,。兩者之間的顯著區(qū)別在于:各個(gè)協(xié)議層是作為驅(qū)動(dòng)程序模塊,,而不是任務(wù)來(lái)實(shí)現(xiàn)的。
另外一個(gè)改變?cè)谟冢簠f(xié)議棧之上還有一個(gè)網(wǎng)絡(luò)服務(wù)模塊,。加入這個(gè)模塊的目的在于將與協(xié)議無(wú)關(guān)的網(wǎng)絡(luò)特性抽象化,。也就是說,它將應(yīng)用程序設(shè)計(jì)者用來(lái)在協(xié)議棧間收發(fā)數(shù)據(jù)的應(yīng)用程序接口(API)標(biāo)準(zhǔn)化,,例如:你的嵌入式系統(tǒng)可能需要同時(shí)支持基于調(diào)制解調(diào)器接口的PPP連到一臺(tái)遠(yuǎn)程計(jì)算機(jī)和一個(gè)紅外接口用來(lái)與本地計(jì)算機(jī)通信,。然而程序設(shè)計(jì)者不必為兩個(gè)事件各自編程,,它只需用網(wǎng)絡(luò)服務(wù)模塊提供API與其它計(jì)算機(jī)進(jìn)行通信,唯一的區(qū)別在于通過哪個(gè)網(wǎng)絡(luò)接口而已,。
基于驅(qū)動(dòng)程序方式的一個(gè)顯著優(yōu)點(diǎn)就在于上下文切換的次數(shù)僅僅是基于控制臺(tái)應(yīng)用程序的函數(shù),,并不基于協(xié)議層的數(shù)量。這樣一來(lái)就可以減少實(shí)時(shí)操作系統(tǒng)保存和恢復(fù)任務(wù)上下文的次數(shù),,因而空出時(shí)間作更有意義的事,,例如執(zhí)行應(yīng)用程序代碼。
另一個(gè)好處在于,,數(shù)據(jù)和控制信息更簡(jiǎn)單的在層與層之間傳輸,,因?yàn)樗械膮f(xié)議層都處于同一個(gè)上下文中,所以相關(guān)的數(shù)據(jù)結(jié)構(gòu)自動(dòng)地為上下層所接受,,結(jié)果你不必把他們?cè)谌蝿?wù)間隊(duì)列中傳送,,由此產(chǎn)生的是,同時(shí)也避免了那些臨界區(qū)系統(tǒng)由此可改進(jìn)中斷和優(yōu)先級(jí)任務(wù)的響應(yīng)時(shí)間,。
3 緩沖區(qū)拷貝
緩沖區(qū)拷貝效率不高的第一個(gè)潛在因素在于:當(dāng)數(shù)據(jù)在層與層之間傳輸時(shí),,數(shù)據(jù)緩沖區(qū)的分配、拷貝和釋放,,這與協(xié)議棧的結(jié)構(gòu)無(wú)關(guān),,僅與緩沖區(qū)本身的結(jié)構(gòu)有關(guān)。
一般來(lái)說,,有兩種常用的方式用于協(xié)議棧層與層之間傳送數(shù)據(jù),,如圖3所示。然而,,這兩種方式均有缺陷,,我們假設(shè),應(yīng)用層有一些數(shù)據(jù)需要傳送,,通常我們把它稱作消息,,消息需被送至協(xié)議棧的最底層,因?yàn)樵诰彌_區(qū)中沒有多余的空間來(lái)存放頭尾信息,,而協(xié)議層必須給數(shù)據(jù)本身加上頭尾信息,,協(xié)議層或分配一個(gè)足夠大的緩沖區(qū)得以容納消息本身和頭尾信息,或分配兩個(gè)小緩沖區(qū),,一個(gè)用于頭信息,,一個(gè)用于尾信息,然后用指針將三個(gè)緩沖區(qū)鏈接起來(lái),。
眾所周知,,每一層加入自己的頭尾信息源于上一層傳來(lái)的信息。因此,,一個(gè)包在自上而下通過網(wǎng)絡(luò)時(shí),,必須重復(fù)這一個(gè)過程許多次,,時(shí)間被消耗于內(nèi)存的分配之中(而自下而上則好得多,因?yàn)橄聦拥念^尾信息可以被上層忽略),。這種拷貝方式同時(shí)伴隨著越來(lái)越大的消息,,釋放老緩沖區(qū)。鏈接方式雖然不涉及多余的拷貝,,但是卻將傳輸包的設(shè)備驅(qū)動(dòng)程序代碼復(fù)雜化,。
另一種替代的方式與基于設(shè)備驅(qū)動(dòng)程序的方式相當(dāng)吻合,如圖4所示,。每次當(dāng)協(xié)議棧創(chuàng)建或改變時(shí),,網(wǎng)絡(luò)服務(wù)模塊執(zhí)行一個(gè)查詢以確定整個(gè)協(xié)議棧的頭,、尾信息和最大傳輸單元要求,,這樣一來(lái)當(dāng)應(yīng)用程序向協(xié)議棧發(fā)消息時(shí),網(wǎng)絡(luò)服務(wù)模塊相應(yīng)地分配一些足夠大容納整個(gè)協(xié)議棧頭尾信息的緩沖區(qū),,每一層僅僅將頭尾信息填充至這些緩沖區(qū),,而不需內(nèi)存分配或拷貝,這一機(jī)制對(duì)于性能有顯著的改善,。
重傳緩沖區(qū)另一個(gè)效率不高的原因在于,,協(xié)議層提供確認(rèn)與重傳機(jī)制,一個(gè)可靠的協(xié)議層的實(shí)現(xiàn)通常包括為每個(gè)包分配一個(gè)重傳緩沖區(qū),,將包的內(nèi)容拷貝至重傳緩沖區(qū)中,。如果遠(yuǎn)程系統(tǒng)的同一層確認(rèn)了正確接收,重傳緩沖區(qū)將被釋放,,然而,,如果一個(gè)“NACK”發(fā)生,協(xié)議層重傳緩沖區(qū)的內(nèi)容,,同時(shí)再分配一個(gè)重傳緩沖區(qū),,拷貝內(nèi)容至重傳緩沖區(qū)。
如果已經(jīng)發(fā)出的包可以被協(xié)議層標(biāo)記為“Unmarked”或“Reserved”的話,,上述機(jī)制就可被取消,,這種情況僅保存一個(gè)指針而不拷貝。當(dāng)設(shè)備驅(qū)動(dòng)程序完成傳送包并試圖釋放緩沖區(qū),,緩沖區(qū)系統(tǒng)確認(rèn)此緩沖區(qū)保留,,并不釋放包,僅僅將它標(biāo)記為“已傳輸”,,當(dāng)相應(yīng)的協(xié)議層收到確認(rèn)(ACK)之后,,就把包去掉標(biāo)識(shí),并且釋放緩沖區(qū),,通過把這一特性固化至網(wǎng)絡(luò)服務(wù)模塊中,,整個(gè)協(xié)議棧的效率將大大提高,。
4 細(xì)節(jié)
任何合理的基于驅(qū)動(dòng)程序的協(xié)議棧都會(huì)包含相似的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)和控制原語(yǔ)及模塊函數(shù),。下面介紹一下細(xì)節(jié)數(shù)據(jù)結(jié)構(gòu),,以下是一些可能用到的數(shù)據(jù)結(jié)構(gòu)。
(1) 設(shè)備入口提供實(shí)時(shí)操作系統(tǒng)和某一特殊的協(xié)議模塊的管道,;
(2) 驅(qū)動(dòng)程序靜態(tài)變量對(duì)于每一協(xié)議層僅分配一次,,不管協(xié)議層下的網(wǎng)絡(luò)接口有多少,它是協(xié)議層的全局存儲(chǔ)區(qū)域,;
(3) 邏輯單位靜態(tài)變量?jī)H基于接口分配,,所以如果你有一個(gè)設(shè)備驅(qū)動(dòng)程序控制兩個(gè)接口,就應(yīng)有兩個(gè)邏輯單位靜態(tài)變量,,但是僅有一個(gè)驅(qū)動(dòng)程序變量和一個(gè)設(shè)備條目數(shù)據(jù)結(jié)構(gòu),;
(4) 路徑變量基于應(yīng)用程序?qū)f(xié)議的調(diào)用,僅分配一次,。
基于上述四種定義,,協(xié)議中的各種數(shù)據(jù)應(yīng)被定義為最合適的類型,被選定的數(shù)據(jù)結(jié)構(gòu)應(yīng)當(dāng)基于這個(gè)變量如何被使用:是被協(xié)議狀態(tài)機(jī)所使用,,還是接口或是應(yīng)用程序,,例如,一個(gè)特定的網(wǎng)絡(luò)接口芯片在內(nèi)存中的基址就應(yīng)定義為邏輯單位靜態(tài)變量,。
5 函數(shù)
如果你正開發(fā)不止一個(gè)協(xié)議棧,,編寫一系列通用的函數(shù)會(huì)有幫助,表1,、表2描述了一些基于驅(qū)動(dòng)程序的協(xié)議??蚣艿臄?shù)據(jù)和控制傳輸原語(yǔ)及參數(shù)。
參考文獻(xiàn)
1 Curt Schwaderer.A Driver-Based Approach to Protocol Stack Design. Embedded Systems Programming,1999;12 (9)
2 Bill Gatliff.An introduction to Protocol Stack Design.IEEE Software Design,1998;4