1.DMA概述
DMA是外設(shè)與主存之間的一種數(shù)據(jù)傳輸機(jī)制,。一般來說,外設(shè)與主存之間存在兩種數(shù)據(jù)傳輸方法:(1)Pragrammed I/O(PIO)方法,,也即由CPU通過內(nèi)存讀寫指令或I/O指令來持續(xù)地讀寫外設(shè)的內(nèi)存單元(8位,、16位或32位),,直到整個(gè)數(shù)據(jù)傳輸過程完成,。(2)DMA,即由DMA控制器(DMA Controller,,簡(jiǎn)稱DMAC)來完成整個(gè)數(shù)據(jù)傳輸過程,。在此期間,CPU可以并發(fā)地執(zhí)行其他任務(wù),,當(dāng)DMA結(jié)束后,,DMAC通過中斷通知CPU數(shù)據(jù)傳輸已經(jīng)結(jié)束,然后由CPU執(zhí)行相應(yīng)的ISR進(jìn)行后處理,。
DMA技術(shù)產(chǎn)生時(shí)正是ISA總線在PC中流行的時(shí)侯,。因此,ISA卡的DMA數(shù)據(jù)傳輸是通過ISA總線控制芯片組中的兩個(gè)級(jí)聯(lián)8237 DMAC來實(shí)現(xiàn)的,。這種DMA機(jī)制也稱為“標(biāo)準(zhǔn)DMA”(standard DMA),。標(biāo)準(zhǔn)DMA有時(shí)也稱為“第三方DMA”(third-party DMA),這是因?yàn)椋合到y(tǒng)DMAC完成實(shí)際的傳輸過程,,所以它相對(duì)于傳輸過程的“前兩方”(傳輸?shù)陌l(fā)送者和接收者)來說是“第三方”,。
標(biāo)準(zhǔn)DMA技術(shù)主要有兩個(gè)缺點(diǎn):(1)8237 DMAC的數(shù)據(jù)傳輸速度太慢,不能與更高速的總線(如PCI)配合使用,。(2)兩個(gè)8237 DMAC一起只提供了8個(gè)DMA通道,,這也成為了限制系統(tǒng)I/O吞吐率提升的瓶頸。
鑒于上述兩個(gè)原因,,PCI總線體系結(jié)構(gòu)設(shè)計(jì)一種成為“第一方DMA”(first-party DMA)的DMA機(jī)制,,也稱為“Bus Mastering”(總線主控)。在這種情況下,,進(jìn)行傳輸?shù)腜CI卡必須取得系統(tǒng)總線的主控權(quán)后才能進(jìn)行數(shù)據(jù)傳輸,。實(shí)際的傳輸也不借助慢速的ISA DMAC來進(jìn)行,而是由內(nèi)嵌在PCI卡中的DMA電路(比傳統(tǒng)的ISA DMAC要快)來完成,。Bus Mastering方式的DMA可以讓PCI外設(shè)得到它們想要的傳輸帶寬,,因此它比標(biāo)準(zhǔn)DMA功能滿足現(xiàn)代高性能外設(shè)的要求。
隨著計(jì)算機(jī)外設(shè)技術(shù)的不斷發(fā)展,現(xiàn)代能提供更快傳輸速率的Ultra DMA(UDMA)也已經(jīng)被廣泛使用了,。本為隨后的篇幅只討論ISA總線的標(biāo)準(zhǔn)DMA技術(shù)在Linux中的實(shí)現(xiàn),。記住:ISA卡幾乎不使用Bus Mastering模式的DMA;而PCI卡只使用Bus Mastering模式的DMA,,它從不使用標(biāo)準(zhǔn)DMA,。
2.Intel 8237 DMAC
最初的IBM PC/XT中只有一個(gè)8237 DMAC,它提供了4個(gè)8位的DMA通道(DMA channel 0-3),。從IBM AT開始,,又增加了一個(gè)8237 DMAC(提供4個(gè)16位的DMA通道,DMA channel 4-7),。兩個(gè)8237 DMAC一起為系統(tǒng)提供8個(gè)DMA通道,。與中斷控制器8259的級(jí)聯(lián)方式相反,第一個(gè)DMAC被級(jí)聯(lián)到第二個(gè)DMAC上,,通道4被用于DMAC級(jí)聯(lián),,因此它對(duì)外設(shè)來說是不可用的。第一個(gè)DMAC也稱為“slave DAMC”,,第二個(gè)DMAC也稱為“Master DMAC”,。
下面我們來詳細(xì)敘述一下Intel 8237這個(gè)DMAC的結(jié)構(gòu)。
每個(gè)8237 DMAC都提供4個(gè)DMA通道,,每個(gè)DMA通道都有各自的寄存器,,而8237本身也有一組控制寄存器,用以控制它所提供的所有DMA通道,。
2.1 DMA通道的寄存器
8237 DMAC中的每個(gè)DMA通道都有5個(gè)寄存器,,分別是:當(dāng)前地址寄存器、當(dāng)前計(jì)數(shù)寄存器,、地址寄存器(也稱為偏移寄存器),、計(jì)數(shù)寄存器和頁(yè)寄存器。其中,,前兩個(gè)是8237的內(nèi)部寄存器,,對(duì)外部是不可見的。
(1)當(dāng)前地址寄存器(Current Address Register):每個(gè)DMA通道都有一個(gè)16位的當(dāng)前地址寄存器,,表示一個(gè)DMA傳輸事務(wù)(Transfer Transaction)期間當(dāng)前DMA傳輸操作的DMA物理內(nèi)存地址,。在每個(gè)DMA傳輸開始前,8237都會(huì)自動(dòng)地用該通道的Address Register中的值來初始化這個(gè)寄存器;在傳輸事務(wù)期間的每次DMA傳輸操作之后該寄存器的值都會(huì)被自動(dòng)地增加或減小,。
(2)當(dāng)前計(jì)數(shù)寄存器(Current Count Register):每個(gè)每個(gè)DMA通道都有一個(gè)16位的當(dāng)前計(jì)數(shù)寄存器,,表示當(dāng)前DMA傳輸事務(wù)還剩下多少未傳輸?shù)臄?shù)據(jù)。在每個(gè)DMA傳輸事務(wù)開始之前,,8237都會(huì)自動(dòng)地用該通道的Count Register中的值來初始化這個(gè)寄存器,。在傳輸事務(wù)期間的每次DMA傳輸操作之后該寄存器的值都會(huì)被自動(dòng)地增加或減小(步長(zhǎng)為1)。
(3)地址寄存器(Address Register)或偏移寄存器(Offset Register):每個(gè)DMA通道都有一個(gè)16位的地址寄存器,表示系統(tǒng)RAM中的DMA緩沖區(qū)的起始位置在頁(yè)內(nèi)的偏移,。
(4)計(jì)數(shù)寄存器(Count Register):每個(gè)DMA通道都有一個(gè)16位的計(jì)數(shù)寄存器,,表示DMA緩沖區(qū)的大小。
(5)頁(yè)寄存器(Page Register):該寄存器定義了DMA緩沖區(qū)的起始位置所在物理頁(yè)的基地址,,即頁(yè)號(hào),。頁(yè)寄存器有點(diǎn)類似于PC中的段基址寄存器。
2.2 8237 DAMC的控制寄存器
(1)命令寄存器(Command Register)
這個(gè)8位的寄存器用來控制8237芯片的操作,。其各位的定義如下圖所示:
(2)模式寄存器(Mode Register)
用于控制各DMA通道的傳輸模式,,如下所示:
(3)請(qǐng)求寄存器(Request Register)
用于向各DMA通道發(fā)出DMA請(qǐng)求。各位的定義如下:
(4)屏蔽寄存器(Mask Register)用來屏蔽
某個(gè)DMA通道,。當(dāng)一個(gè)DMA通道被屏蔽后,,它就不能在服務(wù)于DMA請(qǐng)求,直到通道的屏蔽碼被清除,。各位的定義如下:
上述屏蔽寄存器也稱為“單通道屏蔽寄存器”(Single Channel Mask Register),,因?yàn)樗淮沃荒芷帘我粋€(gè)通道,。此外含有一個(gè)屏蔽寄存器,,可以實(shí)現(xiàn)一次屏蔽所有4個(gè)DMA通道,如下:
(5)狀態(tài)寄存器(Status Register)
一個(gè)只讀的8位寄存器,,表示各DMA通道的當(dāng)前狀態(tài),。比如:DMA通道是否正服務(wù)于一個(gè)DMA請(qǐng)求,或者某個(gè)DMA通道上的DMA傳輸事務(wù)已經(jīng)完成,。
2.3 8237 DMAC的I/O端口地址
主,、從8237 DMAC的各個(gè)寄存器都是編址在I/O端口空間的。而且其中有些I/O端口地址對(duì)于I/O讀,、寫操作有不同的表示含義,。如下表示所示:
Slave DMAC’s I/O port Master DMAC’sI/O port read write
0x000 0x0c0 Channel 0/4 的Address Register
0x001 0x0c1 Channel 0/4的Count Register
0x002 0x0c2 Channel 1/5 的Address Register
0x003 0x0c3 Channel 1/5的Count Register
0x004 0x0c4 Channel 2/6的Address Register
0x005 0x0c5 Channel 2/6的Count Register
0x006 0x0c6 Channel 3/7的Address Register
0x007 0x0c7 Channel 3/7的Count Register
0x008 0x0d0 Status Register Command Register
0x009 0x0d2 Request Register
0x00a 0x0d4 Single Channel Mask Register
0x00b 0x0d6 Mode Register
0x00c 0x0d8 Clear Flip-Flop Register
0x00d 0x0da Temporary Register Reset DMA controller
0x00e 0x0dc Reset all channel masks
0x00f 0x0de all-channels Mask Register
各DMA通道的Page Register在I/O端口空間中的地址如下:
DMA channel Page Register’sI/O port address
0 0x087
1 0x083
2 0x081
3 0x082
4 0x08f
5 0x08b
6 0x089
7 0x08a
注意兩點(diǎn):
1. 各DMA通道的Address Register是一個(gè)16位的寄存器,但其對(duì)應(yīng)的I/O端口是8位寬,,因此對(duì)這個(gè)寄存器的讀寫就需要兩次連續(xù)的I/O端口讀寫操作,,低8位首先被發(fā)送,然后緊接著發(fā)送高8位,。
2. 各DMA通道的Count Register:這也是一個(gè)16位寬的寄存器(無(wú)論對(duì)于8位DMA還是16位DMA),,但相對(duì)應(yīng)的I/O端口也是8位寬,因此讀寫這個(gè)寄存器同樣需要兩次連續(xù)的I/O端口讀寫操作,,而且同樣是先發(fā)送低8位,,再發(fā)送高8位。往這個(gè)寄存器中寫入的值應(yīng)該是實(shí)際要傳輸?shù)臄?shù)據(jù)長(zhǎng)度減1后的值,。在DMA傳輸事務(wù)期間,,這個(gè)寄存器中的值在每次DMA傳輸操作后都會(huì)被減1,因此讀取這個(gè)寄存器所得到的值將是當(dāng)前DMA事務(wù)所剩余的未傳輸數(shù)據(jù)長(zhǎng)度減1后的值。當(dāng)DMA傳輸事務(wù)結(jié)束時(shí),,該寄存器中的值應(yīng)該被置為0,。
2.4 DMA通道的典型使用
在一個(gè)典型的PC機(jī)中,某些DMA通道通常被固定地用于一些PC機(jī)中的標(biāo)準(zhǔn)外設(shè),,如下所示:
Channel Size Usage
0 8-bit Memory Refresh
1 8-bit Free
2 8-bit Floppy Disk Controller
3 8-bit Free
4 16-bit Cascading
5 16-bit Fr
ee
6 16-bit Free
7 16-bit Free
2.5 啟動(dòng)一個(gè)DMA傳輸事務(wù)的步驟
要啟動(dòng)一個(gè)DMA傳輸事務(wù)必須對(duì)8237進(jìn)行編程,,其典型步驟如下:
1.通過CLI指令關(guān)閉中斷。
2.Disable那個(gè)將被用于此次DMA傳輸事務(wù)的DMA通道,。
3.向Flip-Flop寄存器中寫入0值,,以重置它。
4.設(shè)置Mode Register,。
5.設(shè)置Page Register,。
6.設(shè)置Address Register。
7.設(shè)置Count Register,。
8.Enable那個(gè)將被用于此次DMA傳輸事務(wù)的DMA通道,。
9.用STI指令開中斷。
3.3 對(duì)DMAC的保護(hù)
DMAC是一種全局的共享資源,,為了保證設(shè)備驅(qū)動(dòng)程序?qū)λ莫?dú)占訪問,,Linux在kernel/dma.c文件中定義了自旋鎖dma_spin_lock來保護(hù)它(實(shí)際上是保護(hù)DMAC的I/O端口資源)。任何想要訪問DMAC的設(shè)備驅(qū)動(dòng)程序都首先必須先持有自旋鎖dma_spin_lock,。如下:
static __inline__ unsigned long claim_dma_lock(void)
{
unsigned long flags;
spin_lock_irqsave(&dma_spin_lock, flags); /* 關(guān)中斷,,加鎖*/
return flags;
}
static __inline__ void release_dma_lock(unsigned long flags)
{
spin_unlock_irqrestore(&dma_spin_lock, flags);/* 開中斷,開鎖*/
}4 Linux對(duì)ISA DMA通道資源的管理
DMA通道是一種系統(tǒng)全局資源,。任何ISA外設(shè)想要進(jìn)行DMA傳輸,,首先都必須取得某個(gè)DMA通道資源的使用權(quán),并在傳輸結(jié)束后釋放所使用DMA通道資源,。從這個(gè)角度看,,DMA通道資源是一種共享的獨(dú)占型資源。
Linux在kernel/Dma.c文件中實(shí)現(xiàn)了對(duì)DMA通道資源的管理,。
4.1 對(duì)DMA通道資源的描述
Linux在kernel/Dma.c文件中定義了數(shù)據(jù)結(jié)構(gòu)dma_chan來描述DMA通道資源,。該結(jié)構(gòu)類型的定義如下:
struct dma_chan {
int lock;
const char *device_id;
};
其中,如果成員lock!=0則表示DMA通道正被某個(gè)設(shè)備所使用;否則該DMA通道就處于free狀態(tài),。而成員device_id就指向使用該DMA通道的設(shè)備名字字符串,。
基于上述結(jié)構(gòu)類型dma_chan,Linux定義了全局?jǐn)?shù)組dma_chan_busy[],,以分別描述8個(gè)DMA通道資源各自的使用狀態(tài),。如下:
static struct dma_chan dma_chan_busy[MAX_DMA_CHANNELS] = {
{ 0, 0 },
{ 0, 0 },
{ 0, 0 },
{ 0, 0 },
{ 1, "cascade" },
{ 0, 0 },
{ 0, 0 },
{ 0, 0 }
};
顯然,在初始狀態(tài)時(shí)除了DMA通道4外,,其余DMA通道皆處于free狀態(tài),。
4.2 DMA通道資源的申請(qǐng)
任何ISA卡在使用某個(gè)DMA通道進(jìn)行DMA傳輸之前,,其設(shè)備驅(qū)動(dòng)程序都必須向內(nèi)核提出DMA通道資源的申請(qǐng)。只有申請(qǐng)獲得成功后才能使用相應(yīng)的DMA通道,。否則就會(huì)發(fā)生資源沖突,。
函數(shù)request_dma()實(shí)現(xiàn)DMA通道資源的申請(qǐng)。其源碼如下:
int request_dma(unsigned int dmanr, const char * device_id)
{
if (dmanr >= MAX_DMA_CHANNELS)
return -EINVAL;
if (xchg(&dma_chan_busy[dmanr].lock, 1) != 0)
return -EBUSY;
dma_chan_busy[dmanr].device_id = device_id;
/* old flag was 0, now contains 1 to indicate busy */
return 0;
}
上述函數(shù)的核心實(shí)現(xiàn)就是用原子操作xchg()讓成員變量dma_chan_busy[dmanr].lock和值1進(jìn)行交換操作,,xchg()將返回lock成員在交換操作之前的值,。因此:如果xchg()返回非0值,這說明dmanr所指定的DMA通道已被其他設(shè)備所占用,,所以request_dma()函數(shù)返回錯(cuò)誤值-EBUSY表示指定DMA通道正忙;否則,,如果xchg()返回0值,說明dmanr所指定的DMA通道正處于free狀態(tài),,于是xchg()將其lock成員設(shè)置為1,,取得資源的使用權(quán)。
4.3 釋放DMA通道資源
DMA傳輸事務(wù)完成后,,設(shè)備驅(qū)動(dòng)程序一定要記得釋放所占用的DMA通道資源,。否則別的外設(shè)將一直無(wú)法使用該DMA通道。
函數(shù)free_dma()釋放指定的DMA通道資源,。如下:
void free_dma(unsigned int dmanr)
{
if (dmanr >= MAX_DMA_CHANNELS) {
printk("Trying to free DMA%d
", dmanr);
return;
}
if (xchg(&dma_chan_busy[dmanr].lock, 0) == 0) {
printk("Trying to free free DMA%d
", dmanr);
return;
}
} /* free_dma */
顯然,,上述函數(shù)的核心實(shí)現(xiàn)就是用原子操作xchg()將lock成員清零。
4.4 對(duì)/proc/dma文件的實(shí)現(xiàn)
文件/proc/dma將列出當(dāng)前8個(gè)DMA通道的使用狀況,。Linux在kernel/Dma.c文件中實(shí)現(xiàn)了函數(shù)個(gè)get_dma_list()函數(shù)來至此/proc/dma文件的實(shí)現(xiàn),。函數(shù)get_dma_list()的實(shí)現(xiàn)比較簡(jiǎn)單。主要就是遍歷數(shù)組dma_chan_busy[],,并將那些lock成員為非零值的數(shù)組元素輸出到列表中即可。如下:
int get_dma_list(char *buf)
{
int i, len = 0;
for (i = 0 ; i < MAX_DMA_CHANNELS ; i++) {
if (dma_chan_busy.lock) {
len += sprintf(buf+len, "%2d: %s
",
i,
dma_chan_busy.device_id);
}
}
return len;
} /* get_dma_list */
5 使用DMA的ISA設(shè)備驅(qū)動(dòng)程序
DMA雖然是一種硬件機(jī)制,,但它離不開軟件(尤其是設(shè)備驅(qū)動(dòng)程序)的配合,。任何使用DMA進(jìn)行數(shù)據(jù)傳輸?shù)腎SA設(shè)備驅(qū)動(dòng)程序都必須遵循一定的框架。5.1 DMA通道資源的申請(qǐng)與釋放
同I/O端口資源類似,,設(shè)備驅(qū)動(dòng)程序必須在一開始就調(diào)用request_dma()函數(shù)來向內(nèi)核申請(qǐng)DMA通道資源的使用權(quán),。而且,最好在設(shè)備驅(qū)動(dòng)程序的open()方法中完成這個(gè)操作,,而不是在模塊的初始化例程中調(diào)用這個(gè)函數(shù),。因?yàn)檫@在一定程度上可以讓多個(gè)設(shè)備共享DMA通道資源(只要多個(gè)設(shè)備不同時(shí)使用一個(gè)DMA通道)。這種共享有點(diǎn)類似于進(jìn)程對(duì)CPU的分時(shí)共享,。
設(shè)備使用完DMA通道后,,其驅(qū)動(dòng)程序應(yīng)該記得調(diào)用free_dma()函數(shù)來釋放所占用的DMA通道資源。通常,,最好再驅(qū)動(dòng)程序的release()方法中調(diào)用該函數(shù),,而不是在模塊的卸載例程中進(jìn)行調(diào)用,。
還需要注意的一個(gè)問題是:資源的申請(qǐng)順序。為了避免死鎖(deadlock),,驅(qū)動(dòng)程序一定要在申請(qǐng)了中斷號(hào)資源后才申請(qǐng)DMA通道資源,。釋放時(shí)則要先釋放DMA通道,然后再釋放中斷號(hào)資源,。
使用DMA的ISA設(shè)備驅(qū)動(dòng)程序的open()方法的如下:
int xxx_open(struct inode * inode, struct file * filp)
{
┆
if((err = request_irq(irq,xxx_ISR,SA_INTERRUPT,”YourDeviceName”,NULL))
return err;
if((err = request_dma(dmanr, “YourDeviceName”)){
free_irq(irq, NULL);
return err;
}
┆
return 0;
}
release()方法的范例代碼如下:
void xxx_release(struct inode * inode, struct file * filp)
{
┆
free_dma(dmanr);
free_irq(irq,NULL);
┆
}
5.2 申請(qǐng)DMA緩沖區(qū)
由于8237 DMAC只能尋址系統(tǒng)RAM中低16MB物理內(nèi)存,,因此:ISA設(shè)備驅(qū)動(dòng)程序在申請(qǐng)DMA緩沖區(qū)時(shí),一定要以GFP_DMA標(biāo)志來調(diào)用kmalloc()函數(shù)或get_free_pages()函數(shù),,以便在系統(tǒng)內(nèi)存的DMA區(qū)中分配物理內(nèi)存,。
5.3 編程DMAC
設(shè)備驅(qū)動(dòng)程序可以在他的read()方法、write()方法或ISR中對(duì)DMAC進(jìn)行編程,,以便準(zhǔn)備啟動(dòng)一個(gè)DMA傳輸事務(wù),。一個(gè)DMA傳輸事務(wù)有兩種典型的過程:(1)用戶請(qǐng)求設(shè)備進(jìn)行DMA傳輸;(2)硬件異步地將外部數(shù)據(jù)寫道系統(tǒng)中。
用戶通過I/O請(qǐng)求觸發(fā)設(shè)備進(jìn)行DMA傳輸?shù)牟襟E如下:
1.用戶進(jìn)程通過系統(tǒng)調(diào)用read()/write()來調(diào)用設(shè)備驅(qū)動(dòng)程序的read()方法或write()方法,,然后由設(shè)備驅(qū)動(dòng)程序read/write方法負(fù)責(zé)申請(qǐng)DMA緩沖區(qū),,對(duì)DMAC進(jìn)行編程,以準(zhǔn)備啟動(dòng)一個(gè)DMA傳輸事務(wù),,最后正確地設(shè)置設(shè)備(setup device),,并將用戶進(jìn)程投入睡眠。
2.DMAC負(fù)責(zé)在DMA緩沖區(qū)和I/O外設(shè)之間進(jìn)行數(shù)據(jù)傳輸,,并在結(jié)束后觸發(fā)一個(gè)中斷,。
3.設(shè)備的ISR檢查DMA傳輸事務(wù)是否成功地結(jié)束,并將數(shù)據(jù)從DMA緩沖區(qū)中拷貝到驅(qū)動(dòng)程序的其他內(nèi)核緩沖區(qū)中(對(duì)于I/O device to memory的情況),。然后喚醒睡眠的用戶進(jìn)程,。
硬件異步地將外部數(shù)據(jù)寫到系統(tǒng)中的步驟如下:
1.外設(shè)觸發(fā)一個(gè)中斷通知系統(tǒng)有新數(shù)據(jù)到達(dá)。
2.ISR申請(qǐng)一個(gè)DMA緩沖區(qū),,并對(duì)DMAC進(jìn)行編程,,以準(zhǔn)備啟動(dòng)一個(gè)DMA傳輸事務(wù),最后正確地設(shè)置好外設(shè),。
3.硬件將外部數(shù)據(jù)寫到DMA緩沖區(qū)中,,DMA傳輸事務(wù)結(jié)束后,觸發(fā)一個(gè)中斷,。
4. ISR檢查DMA傳輸事務(wù)是否成功地結(jié)束,,然后將DMA緩沖區(qū)中的數(shù)據(jù)拷貝驅(qū)動(dòng)程序的其他內(nèi)核緩沖區(qū)中,最后喚醒相關(guān)的等待進(jìn)程,。
網(wǎng)卡就是上述過程的一個(gè)典型例子,。
為準(zhǔn)備一個(gè)DMA傳輸事務(wù)而對(duì)DMAC進(jìn)行編程的典型代碼段如下:
unsigned long flags;
flags = claim_dma_lock();
disable_dma(dmanr);
clear_dma_ff(dmanr);
set_dma_mode(dmanr,mode);
set_dma_addr(dmanr, virt_to_bus(buf));
set_dma_count(dmanr, count);
enable_dma(dmanr);
release_dma_lock(flags);
檢查一個(gè)DMA傳輸事務(wù)是否成功地結(jié)束的代碼段如下:
int residue;
unsigned long flags = claim_dma_lock();
residue = get_dma_residue(dmanr);
release_dma_lock(flags);
ASSERT(residue == 0);