基于以太網(wǎng)PHY的高速可靠數(shù)據(jù)傳輸方法實(shí)現(xiàn)-AET-電子技術(shù)應(yīng)用

基于以太網(wǎng)PHY的高速可靠數(shù)據(jù)傳輸方法實(shí)現(xiàn)

來源：微型機(jī)與應(yīng)用2013年第17期

單杰，武杰，劉列峰

（中國科學(xué)技術(shù)大學(xué) 近代物理系核探測與核電子學(xué)國家重點(diǎn)實(shí)驗(yàn)室，安徽合肥 230026）

摘要： 介紹了一種在成熟以太網(wǎng)物理層技術(shù)的基礎(chǔ)上使用硬件協(xié)議實(shí)現(xiàn)的高速可靠數(shù)據(jù)傳輸方法。該方法不同于一般采用的TCP機(jī)制，它利用FPGA實(shí)現(xiàn)數(shù)據(jù)分組打包和差錯(cuò)控制，用硬件的方法在保證了數(shù)據(jù)可靠傳輸?shù)耐瑫r(shí)實(shí)現(xiàn)了軟件協(xié)議無法實(shí)現(xiàn)的高數(shù)據(jù)率。經(jīng)過測試證明，該方法相對于TCP協(xié)議具有帶寬利用率高、傳輸速度穩(wěn)定、CPU占用率低的優(yōu)點(diǎn)，適用于點(diǎn)到點(diǎn)的高速可靠數(shù)據(jù)傳輸，同時(shí)還支持網(wǎng)絡(luò)的擴(kuò)展應(yīng)用。

關(guān)鍵詞： FPGA 以太網(wǎng) PHY TCP 硬件協(xié)議高速可靠數(shù)據(jù)傳輸

Abstract：

Key words :

　在各種不同的場合中，人們需要將大批數(shù)據(jù)從一個(gè)設(shè)備無差錯(cuò)地傳輸?shù)搅硪粋€(gè)設(shè)備上。對于設(shè)備間距離較近的場合，可以選擇PCIE（典型距離是15～30 cm）或者USB（最長傳輸距離5 m）等接口。而對于距離較遠(yuǎn)的場合，可以選擇RS232、RS485、以太網(wǎng)等傳輸介質(zhì)，并在此基礎(chǔ)上，通過上層協(xié)議來保證數(shù)據(jù)的可靠性。上層協(xié)議通常用檢錯(cuò)重傳機(jī)制來實(shí)現(xiàn)數(shù)據(jù)的可靠傳輸，如TFTP、TCP/IP、SCTP以及可靠UDP等。這些協(xié)議都必須依靠較為復(fù)雜的CPU運(yùn)算和內(nèi)存拷貝來實(shí)現(xiàn)數(shù)據(jù)可靠傳輸?shù)墓δ堋１热缭贚inux下，TCP/IP協(xié)議每發(fā)送一個(gè)數(shù)據(jù)包，CPU需要執(zhí)行約14 000條指令[1]。因此CPU的工作頻率、內(nèi)存的讀寫速度、硬件I/O帶寬都會(huì)影響TCP/IP的速度。一些嵌入式系統(tǒng)上TCP性能測試如表1所示。

　CPU處理能力越強(qiáng)，TCP傳輸速度越高。與此同時(shí)，在最大傳輸單元為9 000 B時(shí)（即相對MTU1 500包長度增加6倍，包處理頻度下降6倍），則傳輸速度大幅提高。這也從側(cè)面說明了CPU處理能力對TCP傳輸速度的影響。
　在點(diǎn)對點(diǎn)傳輸和局域網(wǎng)傳輸中，往往不需要完善的路由機(jī)制和流量控制，但同樣需要一種可靠的數(shù)據(jù)傳輸手段。傳統(tǒng)的TCP協(xié)議依賴CPU運(yùn)算的特性，使得傳輸速度受到限制，并且受CPU負(fù)荷變化影響而速率不穩(wěn)定[2]。從提高傳輸效率和減輕對CPU的依賴兩方面考慮，提出一種基于硬件實(shí)現(xiàn)的高速可靠數(shù)據(jù)傳輸方法，將CPU從頻繁的協(xié)議運(yùn)算中解放出來。該方法可以在千兆以太網(wǎng)PHY所提供的物理層通信鏈路的基礎(chǔ)上，通過編寫FPGA邏輯，在硬件上實(shí)現(xiàn)可靠數(shù)據(jù)傳輸?shù)膮f(xié)議，然后使用如PCIE這樣的接口將數(shù)據(jù)提供給計(jì)算機(jī)系統(tǒng)。系統(tǒng)結(jié)構(gòu)如圖1所示。

1 選擇重發(fā)機(jī)制提供可靠數(shù)據(jù)傳輸
　保證數(shù)據(jù)傳輸過程中的可靠性有多種方式，如糾錯(cuò)碼、信息反饋和檢錯(cuò)重發(fā)機(jī)制。選擇重發(fā)是檢錯(cuò)重發(fā)的實(shí)現(xiàn)方法之一，相對于等待重發(fā)和退回重發(fā)，它具有高效率的特點(diǎn)，因而被廣泛采用。比如在TCP/IP網(wǎng)絡(luò)中，就是用檢錯(cuò)重發(fā)機(jī)制的原理。但TCP協(xié)議中包括較為復(fù)雜的流量控制機(jī)制和擁塞控制機(jī)制，它們被設(shè)計(jì)來應(yīng)對異構(gòu)的、大范圍的復(fù)雜網(wǎng)絡(luò)環(huán)境。
而在點(diǎn)對點(diǎn)傳輸?shù)膽?yīng)用中，或者在任務(wù)明確、拓?fù)浜唵蔚木钟蚓W(wǎng)中，不需要復(fù)雜的路由機(jī)制和流量控制，因而可以簡化被廣泛使用的檢錯(cuò)重傳機(jī)制，使得可靠性協(xié)議可以通過硬件實(shí)現(xiàn)。
　如圖2所示，將數(shù)據(jù)可靠傳輸?shù)倪^程概括如下：

　（1）待發(fā)送的數(shù)據(jù)在發(fā)送端打包，加上必要的識別信息和校驗(yàn)信息，存入發(fā)送端的緩存；
　（2）待以太網(wǎng)信道可用之后將數(shù)據(jù)包通過千兆以太網(wǎng)發(fā)送給接收方；
　（3）接收方收到數(shù)據(jù)包之后對內(nèi)容進(jìn)行校驗(yàn)，確認(rèn)數(shù)據(jù)無誤之后將識別信息通過ACK數(shù)據(jù)包反饋給發(fā)送方；
　（4）發(fā)送方的緩存接收識別信息后確認(rèn)數(shù)據(jù)已安全抵達(dá)接收方，清空緩存等待發(fā)送下一個(gè)數(shù)據(jù)包；
　（5）發(fā)送方在設(shè)定的時(shí)間內(nèi)沒有接收到帶有相應(yīng)識別信息的ACK反饋，則進(jìn)行重新發(fā)送，重發(fā)超過一定次數(shù)則報(bào)錯(cuò)。
　校驗(yàn)信息選擇使用和以太網(wǎng)兼容的CRC32，編碼冗余度較低（為0.26%）。可以預(yù)見，在一般的誤碼率情況下（1×10-10），該方法可以實(shí)現(xiàn)高速的可靠傳輸[4]。
2 可靠數(shù)據(jù)傳輸?shù)挠布?shí)現(xiàn)
　用硬件的方式實(shí)現(xiàn)所述的可靠傳輸，將會(huì)極大地降低對發(fā)送方和接收方在協(xié)議運(yùn)算上對CPU資源的依賴，這點(diǎn)與TCP協(xié)議大為不同。
　如圖3所示，相較于TCP協(xié)議，硬件協(xié)議在接收數(shù)據(jù)時(shí)數(shù)據(jù)流大大簡化。

　TCP協(xié)議的數(shù)據(jù)流：
　（1）網(wǎng)卡接收以太網(wǎng)數(shù)據(jù)通過PCIE以DMA的方式寫入上位機(jī)內(nèi)存，并觸發(fā)中斷；
　（2）網(wǎng)絡(luò)包內(nèi)存拷貝進(jìn)入OS協(xié)議層；
　（3）對網(wǎng)絡(luò)包的協(xié)議運(yùn)算，檢查包頭信息和CRC校驗(yàn)等；
　（4）確定無誤后發(fā)送ACK包；
　（5）將有效數(shù)據(jù)提供給上層用戶。
硬件協(xié)議的數(shù)據(jù)流：
　（1）設(shè)備卡FPGA檢驗(yàn)數(shù)據(jù)正確性自發(fā)產(chǎn)生ACK回應(yīng)包，將有效數(shù)據(jù)通過PCIE以DMA的方式寫入上位機(jī)內(nèi)存，可選擇觸發(fā)中斷或輪詢；
　（2）驅(qū)動(dòng)層直接將數(shù)據(jù)提供給用戶。
　發(fā)送過程與接收過程相反，情況類似，不再贅述。可見，利用FPGA實(shí)現(xiàn)的硬件協(xié)議省去了上位機(jī)軟件協(xié)議運(yùn)算和內(nèi)存拷貝，直接將有效數(shù)據(jù)提供給上層用戶，提高了數(shù)據(jù)傳輸?shù)男屎退俣龋瑯O大地減輕了CPU運(yùn)算負(fù)荷，省去了對CPU的頻繁中斷，從而獲得不依賴于CPU性能的穩(wěn)定高速的可靠數(shù)據(jù)傳輸。這點(diǎn)是軟件協(xié)議優(yōu)化難以實(shí)現(xiàn)的。
2.1 硬件平臺(tái)
　設(shè)計(jì)PCIE接口設(shè)備卡，搭載Xilinx Spartan 6 FPGA和Broadcom千兆以太網(wǎng)PHY芯片。FPGA是設(shè)備的核心。在FPGA上部署PCIE接口模塊和Ethernet接口模塊，并設(shè)計(jì)內(nèi)部邏輯實(shí)現(xiàn)數(shù)據(jù)的可靠傳輸。
2.2 FPGA邏輯模塊的設(shè)計(jì)
　FPGA的邏輯設(shè)計(jì)需要保證數(shù)據(jù)流的順暢，各個(gè)模塊的互聯(lián)。采用硬件算法，實(shí)現(xiàn)對數(shù)據(jù)的分組打包和節(jié)點(diǎn)間的應(yīng)答握手機(jī)制，保證每個(gè)數(shù)據(jù)包正確無誤地抵達(dá)目標(biāo)設(shè)備。FPGA內(nèi)部的邏輯結(jié)構(gòu)如圖4所示，其中對于數(shù)據(jù)的可靠傳輸是在Tx和Rx模塊中的狀態(tài)機(jī)控制下實(shí)現(xiàn)的，Ethernet模塊為Xilinx的TriMode Ethernet MAC Core，提供了對各種速率（10/100/1 000 M）的以太網(wǎng)PHY的支持。位于邏輯核心區(qū)域的InterConnect模塊為多個(gè)端口之間提供了可動(dòng)態(tài)配置的互聯(lián)，因而為可能的網(wǎng)絡(luò)拓?fù)涮峁┲С帧CIE模塊為上位機(jī)提供了訪問FPGA 的數(shù)據(jù)和命令通道。

　FPGA各個(gè)模塊的說明：
　（1）PCIE，使用Xilinx的s6_pcie：2.4 Logic Core[5]。開辟兩個(gè)用戶地址空間，一個(gè)用于訪問內(nèi)部狀態(tài)控制寄存器，另一個(gè)用于訪問FPGA數(shù)據(jù)。
　（2）InterConnect，在內(nèi)部寄存器的控制下，將各個(gè)Ethernet端口和上位機(jī)數(shù)據(jù)端口按照一定的規(guī)則互聯(lián)起來，可以做到指定端口之間的轉(zhuǎn)發(fā)和特定端口的收發(fā)操作。并且在verilog編碼中采用參數(shù)化的風(fēng)格，方便多端口的擴(kuò)展。這樣，在上位機(jī)控制軟件的配合下，可以實(shí)現(xiàn)多個(gè)端口之間的靈活轉(zhuǎn)發(fā)，因而可以方便地組建數(shù)據(jù)傳輸網(wǎng)絡(luò)。InterConnect數(shù)據(jù)位寬可靈活配置，對于千兆網(wǎng)應(yīng)用可配置為16位寬。該模塊包括FPGA內(nèi)部其他模塊，時(shí)鐘頻率為75 MHz。
　（3）Tx模塊，其他端口的轉(zhuǎn)發(fā)數(shù)據(jù)或者上位機(jī)的發(fā)送數(shù)據(jù)經(jīng)由InterConnect傳送到Tx模塊中，在Tx模塊的邏輯調(diào)度下以數(shù)據(jù)包為單位暫存在某一個(gè)Buffer中。每個(gè)Buffer都有獨(dú)立的狀態(tài)機(jī)控制。數(shù)據(jù)包在Buffer中準(zhǔn)備好之后會(huì)在Tx模塊的邏輯調(diào)度下發(fā)送至Ethernet模塊，相應(yīng)的Buffer狀態(tài)機(jī)處于等待ACK的狀態(tài)。在計(jì)數(shù)器超時(shí)后觸發(fā)重傳，重傳一定次數(shù)依然沒有正確ACK回應(yīng)則報(bào)錯(cuò)。每個(gè)Tx模塊中可以參數(shù)化地配置多個(gè)Buffer，通過多個(gè)Buffer的協(xié)作可以極大地提高信道利用效率。
　（4）Rx模塊，內(nèi)部邏輯維護(hù)一個(gè)類似FIFO的存儲(chǔ)結(jié)構(gòu)。每當(dāng)接收一個(gè)數(shù)據(jù)幀時(shí)，通過累加寫指針將數(shù)據(jù)暫存入RAM中，并在狀態(tài)機(jī)控制下記錄當(dāng)前幀的目的/源地址、幀類型，序號等信息。如果是ACK幀則把相應(yīng)的幀識別信息傳遞給Tx模塊；如果是需要接收的幀則在幀接收完后指示存儲(chǔ)器數(shù)據(jù)有效，數(shù)據(jù)有效信號將促使待轉(zhuǎn)發(fā)模塊或者CPU接收FIFO讀取該幀。Rx和Tx的以太網(wǎng)端口數(shù)據(jù)位寬為8位，接口時(shí)鐘頻率為125 MHz。
　（5）Ethernet模塊，使用Xilinx的tri_mode_eth_mac：4.6 Logic Core[6]。該模塊提供CRC32編碼和校驗(yàn)功能，提供對不同速率以太網(wǎng)的支持，并且對內(nèi)部邏輯提供統(tǒng)一的數(shù)據(jù)接口。
3 系統(tǒng)性能測試
　為了盡可能完善地測試系統(tǒng)性能，從邏輯仿真和實(shí)測兩方面進(jìn)行測試。
3.1 邏輯仿真測試
　邏輯仿真是利用Xilinx ISim仿真器對FPGA邏輯的行為進(jìn)行仿真預(yù)測。仿真測試的優(yōu)點(diǎn)是測試準(zhǔn)備簡單，測試方法靈活；缺點(diǎn)是只能仿真FPGA邏輯部分，無法仿真其他硬件。考慮到本數(shù)據(jù)傳輸系統(tǒng)的核心在FGPA上，并通過與實(shí)測數(shù)據(jù)比對，邏輯仿真可以在很大程度上真實(shí)反映系統(tǒng)性能。測試的是兩個(gè)節(jié)點(diǎn)之間的點(diǎn)對點(diǎn)傳輸。
　（1）固定幀長1 024 B測試結(jié)果：帶寬利用效率為96.4%，數(shù)據(jù)傳輸速度為120.5 MB/s。
　（2）隨機(jī)幀長測試結(jié)果：數(shù)據(jù)傳輸速度為99.4 MB/s，帶寬利用效率為79.5%。
　仿真波形如圖5所示，rgmii_txen_A信號表明在這種情況下信道利用出現(xiàn)間隙。這是由于幀長度突然變長，需要等待內(nèi)部數(shù)據(jù)寫入Buffer。這種特殊情況可以通過增加Tx_buffer的數(shù)量來解決。

　（3）人為添加誤碼測試結(jié)果：數(shù)據(jù)傳輸速度為106.7 MB/s，帶寬利用效率為85.3%。
　測試幀長度為1 024 B，設(shè)定FPGA在發(fā)送端口隨機(jī)添加誤碼，測試添加誤碼率為0.000 76%。一般情況下誤碼率很低（平均一個(gè)誤碼造成一個(gè)數(shù)據(jù)包重傳）。單次誤碼造成的等待和重傳開銷是一定的，因而傳輸速度的變化值與誤碼率的關(guān)系可以近似看成正比關(guān)系（?駐x：傳輸速率比變化；?駐e：誤碼率）：?駐x=k?駐e。
　測試時(shí)，人為添加誤碼率?駐e=0.000 76%，?駐x=-13.8 MB/s，求得k=-1.82×106 MB/s。由此估計(jì)，在一般情況下（即誤碼率為1×10-10），傳輸速度變化?駐x=-1.82 106 MB/s×10-10，為-18.2 KB/s，傳輸帶寬仍接近120.5 MB/s。
3.2實(shí)際傳輸測試
　測試兩個(gè)節(jié)點(diǎn)間點(diǎn)對點(diǎn)傳輸，需要兩個(gè)數(shù)據(jù)節(jié)點(diǎn)。節(jié)點(diǎn)A產(chǎn)生測試數(shù)據(jù)，節(jié)點(diǎn)B接收、校驗(yàn)測試數(shù)據(jù)，并通過PCIE以DMA方式發(fā)送到PC端。通過PC端軟件檢查并統(tǒng)計(jì)100 s傳輸數(shù)據(jù)，接收11 742 592幀，共計(jì)12.024 GB數(shù)據(jù)。
測試結(jié)果：數(shù)據(jù)傳輸速度為120.2 MB/s；帶寬利用效率為96.2%，與仿真結(jié)果（96.4%）基本持平。
3.3 結(jié)論
　根據(jù)測試結(jié)果，該硬件協(xié)議可以有效地進(jìn)行可靠數(shù)據(jù)傳輸。在實(shí)際測試情況和可以預(yù)計(jì)的誤碼率情況下，順序傳輸大塊數(shù)據(jù)的傳輸速度可達(dá)到千兆以太網(wǎng)極限帶寬125 MB/s的96%，即120 MB/s。這個(gè)數(shù)據(jù)與TCP協(xié)議在MTU 9 000超長幀設(shè)定下的PowerPC405系統(tǒng)上的表現(xiàn)基本持平（平均考慮收和發(fā)），而遠(yuǎn)高于MTU 1 500設(shè)定下的表現(xiàn)。TCP協(xié)議在低處理頻度下可換來更高的速度，這說明軟件協(xié)議的傳輸速度受CPU運(yùn)算影響大，易產(chǎn)生波動(dòng)。穩(wěn)定的高數(shù)據(jù)率則是硬件協(xié)議的優(yōu)點(diǎn)所在。
　數(shù)據(jù)的可靠傳輸是一個(gè)具有普遍意義的話題。本文所闡述的在現(xiàn)有成熟以太網(wǎng)技術(shù)基礎(chǔ)上，利用FPGA硬件實(shí)現(xiàn)數(shù)據(jù)的高速、可靠的傳輸。相較于復(fù)雜的TCP軟件協(xié)議，使用硬件協(xié)議能夠有效降低CPU負(fù)荷，并因此得到穩(wěn)定的高速數(shù)據(jù)傳輸速率。本文所述的硬件平臺(tái)支持多個(gè)以太網(wǎng)端口的擴(kuò)展。節(jié)點(diǎn)內(nèi)端口之間的可配置轉(zhuǎn)發(fā)功能在板載MCU的控制下可實(shí)現(xiàn)靈活路由。這樣多個(gè)節(jié)點(diǎn)可以組成數(shù)據(jù)傳輸網(wǎng)絡(luò)，因而為諸如高速數(shù)據(jù)采集網(wǎng)絡(luò)、局域網(wǎng)傳輸?shù)染W(wǎng)絡(luò)應(yīng)用提供了可行方案。
參考文獻(xiàn)
[1] 馬毅超.大規(guī)模陸上地震儀器中高速可靠數(shù)據(jù)傳輸方法的研究[D].合肥：中國科學(xué)技術(shù)大學(xué)，2011.
[2] DOUG GIBBS. Measuring treck TCP/IP performance using the XPS LocalLink TEMAC in an embedded processor system[J]. XAPP1043，www.xilinx.com，2008.
[3] 王圣，蘇金樹.TCP加速技術(shù)研究綜述[J].軟件學(xué)報(bào)，2004，15（11）：1689-1697.
[4] 王新梅.糾錯(cuò)碼與差錯(cuò)控制[M].北京：人民郵電出版社，1989.
[5] PCI express base specification revision 1.1， www.pcisig.com[Z]. 2005.
[6] XILINX. LogiCORE IP Tri-Mode Ethernet MAC v4.5 User Guide[Z]. 2011.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容