文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2015)06-0066-03
0 引言
在現(xiàn)代數(shù)據(jù)通信與傳輸領(lǐng)域,,系統(tǒng)芯片(System-on-a-Chip,SoC)與不同外設(shè)間的數(shù)據(jù)交換越來越頻繁,,交換的數(shù)據(jù)量越來越大,,而且不同外設(shè)采用的數(shù)據(jù)通信協(xié)議和接口形式也各不相同,。SoC與外設(shè)間連接的要求越來越高,主要表現(xiàn)在:(1)高帶寬,,要求通信傳輸速度越來越高,;(2)通用性,要求接口具有對(duì)多種標(biāo)準(zhǔn)通信協(xié)議有一定的廣適性,;(3)可再配置,,要求通信系統(tǒng)具有用戶根據(jù)實(shí)際需要進(jìn)行二次配置的特性。
另一方面,,外設(shè)接口往往采用一定的協(xié)議或標(biāo)準(zhǔn),,典型的有UART接口、IIC接口,、SPI接口等,。芯片實(shí)現(xiàn)時(shí),通常將外設(shè)接口的邏輯功能固化在芯片內(nèi)部,,但由于芯片資源有限,,不可能把所有的協(xié)議都集成在片上[1]。為了實(shí)現(xiàn)可編程的外設(shè)接口,,傳統(tǒng)的方法是利用通用輸入輸出(General Purpose Input/Output,,GPIO),通過編程方式設(shè)置GPIO寄存器的高/低電平,,從而控制數(shù)據(jù)的讀寫和時(shí)鐘的生成,。但是,GPIO模塊采用CPU內(nèi)核直接控制,,模擬外設(shè)接口的讀寫過程會(huì)占用大量CPU運(yùn)行周期,,影響系統(tǒng)中其他任務(wù)的實(shí)現(xiàn),所以一般只用于低速協(xié)議或接口的實(shí)現(xiàn)[2],。
本文針對(duì)SoC與外圍設(shè)備多種接口的連接問題,,設(shè)計(jì)了一種通用可編程接口IP核,實(shí)現(xiàn)了SoC與外圍設(shè)備接口間的可編程特性,,并以增強(qiáng)型8051內(nèi)核為基礎(chǔ)構(gòu)建了仿真驗(yàn)證平臺(tái),,驗(yàn)證了設(shè)計(jì)的正確性和有效性。
1 通用可編程接口IP的原理
通用可編程接口的工作方式采用主控方式,,可通過配置CPU實(shí)現(xiàn)對(duì)外設(shè)接口讀寫波形的編程,,從而完成外設(shè)接口的讀寫。
為了使數(shù)據(jù)在與外圍設(shè)備交換過程中不需要CPU的控制,,利用通用可編程接口的高速帶寬設(shè)計(jì)了一套FIFO緩存架構(gòu),,其工作機(jī)制使得數(shù)據(jù)以包的形式被提交到端點(diǎn)FIFO,而不是每次一個(gè)字節(jié),并可設(shè)置多級(jí)緩存[3-4],。
通用可編程接口IP的本質(zhì)是一個(gè)可編程狀態(tài)機(jī),,用戶通過編寫波形描述符控制狀態(tài)機(jī)。通用可編程接口可生成4個(gè)用戶定義波形描述符,,每個(gè)波形描述符最多可定義7個(gè)狀態(tài),,這7個(gè)狀態(tài)通常情況下用于批量讀、批量寫,、單字讀,、單字寫。
2 通用可編程接口IP核設(shè)計(jì)
2.1 通用可編程接口IP架構(gòu)
通用可編程接口模塊的內(nèi)部結(jié)構(gòu)如圖1所示,,主要由4個(gè)模塊組成,。
(1)端點(diǎn)控制模塊
端點(diǎn)控制模塊(CONTROL)產(chǎn)生控制信號(hào)(CTL)控制外部設(shè)備,CTL信號(hào)可通過編程組合使用,,實(shí)現(xiàn)復(fù)雜的邏輯功能,;接收外部準(zhǔn)備信號(hào)(RDY)觸發(fā)事件;接收/發(fā)送時(shí)鐘信號(hào)(IFCLK),;輸出狀態(tài)信號(hào)(STATE),,顯示狀態(tài)機(jī)目前工作狀態(tài)。時(shí)鐘信號(hào)可選內(nèi)部產(chǎn)生或外部輸入,,其他控制信號(hào)也可設(shè)置為高有效或低有效,。
(2)端點(diǎn)緩存模塊
端點(diǎn)緩存模塊由4個(gè)相互重疊的FIFO端點(diǎn)緩存組成,存儲(chǔ)與外設(shè)通信過程中接收/發(fā)送的數(shù)據(jù),。其讀信號(hào)(RD),、寫信號(hào)(WR)、輸出使能信號(hào)(OE)及時(shí)鐘信號(hào)(CLK)控制數(shù)據(jù)總線(FD[15:0])的讀寫,,并輸出空信號(hào)(EF),、滿信號(hào)(FF)。
(3)波形存儲(chǔ)器模塊
波形存儲(chǔ)器用于存儲(chǔ)用戶設(shè)計(jì)的波形描述符,。通用可編程接口通過波形描述符控制數(shù)據(jù)的輸入輸出,,最多可存儲(chǔ)4個(gè)波形描述符,分別為WF0,、WF1,、WF3、WF4,。
(4)地址生成模塊
地址生成器(ADDR_GEN)用于輸出地址總線(GPIFADR[8:0]),,由控制模塊控制。
2.2 波形描述符設(shè)計(jì)
波形描述符是通用可編程接口的核心,,用于描述數(shù)據(jù)傳輸的時(shí)序。通用可編程接口可以存儲(chǔ)4個(gè)波形描述符:(1)單字讀:從外設(shè)中讀取1字節(jié)/字的數(shù)據(jù);(2)單字寫:向外設(shè)中寫入1字節(jié)/字的數(shù)據(jù),;(3)批量讀:從外設(shè)中讀取一個(gè)長數(shù)據(jù)流,;(4)批量寫,往外設(shè)中寫入一個(gè)長數(shù)據(jù)流,。這些描述符可以動(dòng)態(tài)地配置給任何一個(gè)端點(diǎn)FIFO,。配置后,通用可編程接口將依據(jù)波形描述符產(chǎn)生相應(yīng)的控制邏輯和握手信號(hào)給外界接口,,滿足向FIFO讀寫數(shù)據(jù)的需要,。
圖2為一種批量寫模式下的波形描述符狀態(tài)轉(zhuǎn)移圖。批量寫狀態(tài)機(jī)共定義了5個(gè)狀態(tài),,分別是IDLE,、State1、State2,、State3,、State4,每個(gè)狀態(tài)的意義描述如下,。
(1)IDLE:當(dāng)寫事件發(fā)生,,轉(zhuǎn)移到State(1);
(2)State1:將SRAM寫信號(hào)和使能信號(hào)置為有效(=0,,=0),,觸發(fā)寫事件,轉(zhuǎn)移到State(2),;
(3)State2:若外部SRAM模型的“滿”標(biāo)志為真(FF=1),,則停留在State(2),否則轉(zhuǎn)移到State(3),;
(4)State3:通用可編程接口采樣數(shù)據(jù)線,,將內(nèi)部端點(diǎn)FIFO數(shù)據(jù)寫入外部SRAM模型,轉(zhuǎn)移到State(4),;
(5)State4:如有更多數(shù)據(jù)需要傳輸,,則轉(zhuǎn)移到State(2),否則轉(zhuǎn)移到步驟(1),。
2.3 端點(diǎn)FIFO緩存設(shè)計(jì)
通用可編程接口內(nèi)部包含4重端點(diǎn)FIFO緩存,,對(duì)內(nèi)部總線端來說,只要有1個(gè)FIFO為“半滿”,,就可以繼續(xù)發(fā)送數(shù)據(jù),。當(dāng)前操作的FIFO寫“滿”時(shí),自動(dòng)將其轉(zhuǎn)換到外部接口端,,排隊(duì)等候讀?。徊㈥?duì)列中下一個(gè)為“空”的FIFO轉(zhuǎn)移到SoC內(nèi)部總線接口上,供其繼續(xù)寫數(shù)據(jù),。圖3為FIFO緩存架構(gòu)的傳輸原理圖,,此時(shí)通用可編程接口內(nèi)部總線接口執(zhí)行OUT傳輸,F(xiàn)IFO端點(diǎn)被設(shè)置為512 B四重緩存,。
3 仿真平臺(tái)設(shè)計(jì)
為驗(yàn)證設(shè)計(jì)的接口IP核,,構(gòu)建了一個(gè)以8051 CPU為內(nèi)核的SoC仿真平臺(tái),利用設(shè)計(jì)的接口IP核訪問外部設(shè)備,。為了充分利用通用可編程接口地址總線,、數(shù)據(jù)總線及控制信號(hào),外設(shè)采用SRAM芯片的Verilog模型,,并加以改進(jìn),,添加握手信號(hào),使通用可編程接口能讀取該信號(hào)并控制數(shù)據(jù)傳輸,。通過設(shè)計(jì)波形描述符,,SoC控制接口IP向外部存儲(chǔ)器執(zhí)行寫/讀操作,仿真平臺(tái)對(duì)兩次的數(shù)據(jù)進(jìn)行比較并報(bào)告設(shè)計(jì)的正確性,。
該仿真平臺(tái)在Linux操作系統(tǒng)下開發(fā),,平臺(tái)系統(tǒng)結(jié)構(gòu)如圖4所示。仿真器采用Synopsys公司的VCS仿真器,。組成系統(tǒng)的各個(gè)模塊可以按照需要加入仿真環(huán)境中,,仿真結(jié)果由環(huán)境產(chǎn)生、檢查并輸出到指定目錄結(jié)構(gòu)下的文件中,。
仿真平臺(tái)包括Verilog編寫的Testbench,、SoC模型、外部程序存儲(chǔ)器(EXT PROGRAM ROM),、SRAM Verilog模型,。SRAM包括地址線(A8~A0)、數(shù)據(jù)線(I/O15~I(xiàn)/O0),、芯片使能(),、輸出使能()、寫使能(),、握手信號(hào)E_RDY(“1”表示SRAM未寫入數(shù)據(jù),,“0”代表已寫入數(shù)據(jù))、F_RDY(“1”表示SRAM存滿數(shù)據(jù),,“0”代表未滿),。
仿真平臺(tái)工作時(shí),由Testbench產(chǎn)生時(shí)鐘(CLK)和通用可編程接口IP時(shí)鐘(IFCLK),。
4 仿真結(jié)果分析
通用可編程接口單字節(jié)寫的仿真結(jié)果如圖5所示,,其中IFCLK為內(nèi)部48 MHz時(shí)鐘,,數(shù)據(jù)寬度為8 bit。當(dāng)CTL3()拉低時(shí),,外部SRAM有效,;當(dāng)CTL5 ()有效,且RDY1(F_RDY)為低時(shí),,數(shù)據(jù)(5A)被放入數(shù)據(jù)總線,并經(jīng)數(shù)據(jù)總線寫入外部SRAM,。狀態(tài)總線STATE(PE[2:0])顯示通用可編程接口引擎在每一操作期間循環(huán)經(jīng)過的狀態(tài),。
通用可編程接口單字讀模式與單字寫模式類似,仿真結(jié)果如圖6所示,。
圖7為通用可編程接口批量寫傳輸?shù)姆抡娼Y(jié)果,,數(shù)據(jù)寬度為16 bit。當(dāng),、被拉低,,且F_RDY為低時(shí),接口開始執(zhí)行批量寫程序,,從內(nèi)部的FIFO緩存向外部SRAM寫入512 B(00-FF,,F(xiàn)F-00)。
通用可編程接口批量讀傳輸?shù)姆抡娼Y(jié)果與批量寫類似,,仿真結(jié)果如圖8所示,。
由上述仿真波形可看出,通用可編程接口讀寫數(shù)據(jù)時(shí),,時(shí)鐘周期為20.8 ns,,數(shù)據(jù)總線寬度為16 bit,對(duì)應(yīng)數(shù)據(jù)傳輸速率為96 Mb/s,。相比之下,,UART的傳輸速率為1.5 Mb/s,IIC總線為400 Kb/s~3.4 Mb/s,,SPI總線為18 Mb/s,,GPIO總線的傳輸速率最高為50 Mb/s[5]??梢?,通用可編程接口的傳輸速率最快,更適合當(dāng)前大容量存儲(chǔ)器之間的數(shù)據(jù)傳輸要求,。
5 結(jié)束語
本方案實(shí)現(xiàn)了通用可編程接口與外圍設(shè)備接口連接的可配性,,并通過設(shè)計(jì)驗(yàn)證了該方案的可行性與準(zhǔn)確性。在數(shù)據(jù)傳輸過程中,,通用可編程接口無需CPU的干預(yù),,只需對(duì)其進(jìn)行正確設(shè)置就可以正常工作,。通用可編程接口的強(qiáng)大功能使其不僅可以與外部SRAM連接,還可以與更復(fù)雜的接口(例如ATA接口)實(shí)現(xiàn)無縫連接,,加快了產(chǎn)品的開發(fā)速度,,降低了開發(fā)成本和提高了產(chǎn)品的可靠性。
參考文獻(xiàn)
[1] 王占領(lǐng),,張登福,,李云杰,等.便攜式ARINC429總線通信接口的設(shè)計(jì)與實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),,2013,,30(7):133-136.
[2] HASAMNIS M A,LIMAYE S S.Custom hardware interface using NIOS II processor through GPIO[C].The 7th Conference on Industrial Electronics and Applications(ICIEA′12).Singapore,,2012:1381-1385.
[3] 劉志華,,郭付才,彭新偉,,等.基于CY7C68013A的FPGA配置和通信接口設(shè)計(jì)[J].電子技術(shù)應(yīng)用,,2013,39(2):18-21.
[4] 趙林,,孟令軍,,于磊,等.基于CY7C68013A的USB2.0高速接口設(shè)計(jì)[J].電子技術(shù)應(yīng)用,,2014,,40(1):131-133.
[5] STMicroelectronics.RM0008 Reference manual[EB/OL].http://www.st.com/,2014.