O 引言
Flash是一種存儲(chǔ)器" title="非易失存儲(chǔ)器">非易失存儲(chǔ)器,它在掉電條件下仍然能夠長(zhǎng)期保持?jǐn)?shù)據(jù),。由于它具有容量大,、速度快、功耗低,、抗震性能好等優(yōu)點(diǎn),,近幾年在U盤,、SD卡,、SSD硬盤等各種移動(dòng)存儲(chǔ)設(shè)備" title="存儲(chǔ)設(shè)備">存儲(chǔ)設(shè)備中得到了廣泛的應(yīng)用。本文給出了一款性能優(yōu)異,、成本低廉可用于SD卡的NAND flash控制芯片的設(shè)計(jì)方法,。(本方法也同樣適用于其他存儲(chǔ)設(shè)備。文中集中探討了一種高效管理物理塊的算法,,包括邏輯物理地址映射" title="地址映射">地址映射以及spare區(qū)的定義,,另外,還有雙緩沖器優(yōu)化讀寫的方法等,。
1 Flash簡(jiǎn)介
1.1 SLC flash與MLC flash的比較
從架構(gòu)上,,flash可以分為SLC(Single-Level-Cell) flash和MLC(Multi-Level-Cell)flash兩種。和SLC Flash相比較,,MLC flash的優(yōu)點(diǎn)是面積小,、成本低:缺點(diǎn)是出錯(cuò)率高,壽命短(SLC的每個(gè)block能夠擦寫100,,000次,,而MLC能夠擦寫10,000次),。由于MLC flash具有成本低的優(yōu)勢(shì),,而其出錯(cuò)率高的缺陷又可以通過(guò)ECC(Error Correction Code)糾錯(cuò)來(lái)有效解決,壽命短的問(wèn)題也可以通過(guò)磨損均衡來(lái)彌補(bǔ),,因此,,MLC flash的應(yīng)用更加廣泛,但在一些高端應(yīng)用仍然會(huì)使SLCflash,。本設(shè)計(jì)就是針對(duì)MLC flash,,但是,本方法對(duì)SLC flash也能夠處理,。
1.2 NAND flash結(jié)構(gòu)
不同廠商不同型號(hào)的flash的結(jié)構(gòu)都大同小異,,圖l所示是三星K9G8G08UOA型號(hào)的flash結(jié)構(gòu)圖,,圖l中的1個(gè)flash芯片包含4096個(gè)物理塊(block),每個(gè)物理塊含有128個(gè)頁(yè)(page),,每個(gè)頁(yè)包含2112(2048+64)字節(jié)其中多出的64字節(jié)用于存放糾錯(cuò)碼及其他信息用,。
1.3 NAND flash的特點(diǎn)
Flash可支持讀(Read)操作、寫(Program)操作和擦除(Erase)操作,。其中讀操作和寫操作的基本單位是頁(yè),,擦除操作的基本單位是塊。對(duì)flash的寫入操作只能在尚未寫入的空閑頁(yè)上進(jìn)行,,并且只能按照從低地址頁(yè)到高地址頁(yè)的順序進(jìn)行操作,,而不能寫了高地址頁(yè)之后,再寫低地址頁(yè),。如果想要修改某個(gè)已經(jīng)寫過(guò)的頁(yè),,只能先對(duì)整個(gè)物理塊進(jìn)行擦除,然后才能正確寫入,。
2 Flash管理算法
2.1 邏輯物理地址映射
由于flash具有上述特點(diǎn),,因此,如果不采用邏輯物理地址映射,,將會(huì)存在兩個(gè)問(wèn)題:其一是Flash中難免會(huì)有壞塊,,因而某些地址空間將是不可用的;其二,,F(xiàn)lash讀寫的基本單位是頁(yè),,擦除的基本單位是塊,故在同一個(gè)頁(yè)的兩次寫之間,,就必須要進(jìn)行一次擦除操作,,而擦除會(huì)擦除掉整個(gè)塊,這樣,,為了避免其他頁(yè)的數(shù)據(jù)丟失,,就得先把這些頁(yè)中的數(shù)據(jù)暫存到其他地方備份起來(lái),之后再和新數(shù)據(jù)一起重新寫回到該塊中,,因此,,整個(gè)過(guò)程會(huì)比較復(fù)雜,而且會(huì)造成速度降低,。這樣,,一般都需要對(duì)flash加入邏輯物理地址映射管理算法,該算法的邏輯地址和物理地址的對(duì)應(yīng)關(guān)系是變動(dòng)的,。
2.2 兩級(jí)地址映射
為了減少更新數(shù)據(jù)時(shí)原有數(shù)據(jù)的搬移,,提高寫操作的速度,本文提出了采用兩級(jí)地址映射的機(jī)制,,也就是在塊級(jí)別邏輯物理地址映射的基礎(chǔ)上引入頁(yè)級(jí)別上的邏輯物理地址映射,。一個(gè)邏輯塊對(duì)應(yīng)一個(gè)或兩個(gè)物理塊(稱為母塊和子塊),,邏輯塊中的邏輯頁(yè)對(duì)應(yīng)一或兩個(gè)物理塊中的某個(gè)面。圖2所示是其地址解析" title="地址解析">地址解析示意圖,。
在讀寫時(shí),,首先應(yīng)將邏輯地址分為邏輯塊地址和邏輯頁(yè)地址,再根據(jù)塊映射表將邏輯塊地址映射到物理塊地址,,然后讀取母塊和子塊中的sDare區(qū),,并據(jù)此建立頁(yè)映射表,再根據(jù)邏輯頁(yè)地址映射到物理頁(yè)地址,,從而完成從邏輯地址到物理地址的轉(zhuǎn)換,。其數(shù)據(jù)更新示意圖如圖3所示。
當(dāng)需要更新數(shù)據(jù)時(shí),,寫入的策略可分為兩種情況,。首先,當(dāng)子塊仍然有空閑頁(yè)時(shí),,可直接將數(shù)據(jù)寫到子塊中的下一個(gè)空閑頁(yè)中,,并在spare區(qū)中記錄該塊對(duì)應(yīng)的子塊,、該物理塊對(duì)應(yīng)的邏輯塊以及該物理頁(yè)對(duì)應(yīng)的邏輯頁(yè),,這樣,當(dāng)重新上電時(shí),,就可以建立邏輯物理映射關(guān)系,。其次,當(dāng)母塊和子塊都寫滿時(shí),,需要從空塊池中取出一個(gè)新的子塊,。如果允許一個(gè)邏輯塊對(duì)應(yīng)三個(gè)或更多的物理塊,一方面管理起來(lái)比較復(fù)雜,,另外也會(huì)造成空物理塊緊缺,,因此,可以考慮將母塊或者子塊釋放掉,,這樣,,母塊或者子塊中原有的有效數(shù)據(jù)就需要搬移到新子塊中并將該母塊或子塊擦除再釋放到空塊池。出于速度的考慮,,選擇母塊和子塊有效頁(yè)數(shù)較少的塊進(jìn)行數(shù)據(jù)轉(zhuǎn)移并釋放,。
實(shí)踐證明,這樣操作對(duì)寫文件速度有明顯提高,,特別是寫小文件時(shí),,其速度提升可達(dá)9.2倍。
2.3 SPARE區(qū)和ECC校驗(yàn)
Flash中每個(gè)頁(yè)里的每個(gè)字節(jié)都是沒有任何差別的,,物理上并沒有data區(qū)和spare區(qū)的區(qū)別,,具體怎樣劃分data區(qū)和spare區(qū),,可由用戶自己決定。本設(shè)計(jì)采用的劃分辦法如圖4所示,,這樣,,每個(gè)扇區(qū)和一個(gè)spare區(qū)相連,故可方便連續(xù)讀出,,并進(jìn)行校驗(yàn)糾錯(cuò),。
圖4中同時(shí)給出了Spare的區(qū)定義,其中兩字節(jié)用于標(biāo)識(shí)本物理塊所對(duì)應(yīng)的母塊,;兩字節(jié)用于標(biāo)識(shí)本物理塊對(duì)應(yīng)的邏輯塊,;一字節(jié)用于標(biāo)識(shí)本物理頁(yè)對(duì)應(yīng)的邏輯頁(yè),一字節(jié)用于標(biāo)識(shí)連續(xù)邏輯頁(yè)數(shù)(表示上面連續(xù)邏輯頁(yè)的個(gè)數(shù),,此域可以輔助加快建立頁(yè)映射表的時(shí)間),,余下的10字節(jié)用于存放ECC,這樣可以達(dá)到4字節(jié)錯(cuò)誤的糾錯(cuò)能力,。一般情況下,,前面的4個(gè)字節(jié)是建立塊地址映射表的關(guān)鍵,其次,,后面兩個(gè)字節(jié)則是建立頁(yè)地址映射表的關(guān)鍵,。
2.4 頁(yè)映射表建立時(shí)間的優(yōu)化
因?yàn)榻㈨?yè)映射表需要讀取母塊和子塊中各物理頁(yè)spare區(qū)以判定該物理頁(yè)對(duì)應(yīng)的邏輯頁(yè),而每個(gè)物理頁(yè)的讀取都要花費(fèi)大約50μs的時(shí)間,。因此,,如果對(duì)每個(gè)物理頁(yè)都讀取,建立頁(yè)映射表就會(huì)比較費(fèi)時(shí),。為了加快建立頁(yè)映射表的速度,,一般只希望能讀取一個(gè)物理頁(yè),而免于讀取其他若干頁(yè),,以便加快建表速度,。因?yàn)楹芏鄷r(shí)候都是連續(xù)寫,而連續(xù)的幾個(gè)物理頁(yè)在邏輯上也是連續(xù)的,,因此可以考慮在spare區(qū)加入連續(xù)邏輯頁(yè)號(hào),,這樣,重新建表時(shí),,就可根據(jù)連續(xù)頁(yè)號(hào)知道連續(xù)幾個(gè)物理頁(yè)對(duì)應(yīng)的邏輯頁(yè),,從而加快建表的速度。對(duì)于最佳情形,,有時(shí)只需要讀一個(gè)頁(yè)就可以建立整個(gè)邏輯塊的頁(yè)映射表,。圖5所示是一種加快建表的示意圖。
2.5 分區(qū)
不同的flash,,塊數(shù)是不同的,,其塊映射表需要的RAM空間也不一樣,。對(duì)于當(dāng)前主流flash,有的具有8192個(gè)塊,,如果對(duì)整個(gè)flash建表,,需要的RAM空間將多達(dá)32KB,這樣芯片成本就會(huì)比較高,。一個(gè)可行的解決辦法是對(duì)flash分區(qū),,比如1024個(gè)塊為一個(gè)分區(qū),每次只對(duì)一個(gè)分區(qū)進(jìn)行建表,,這樣,,RAM空間就可以降低到4KB。這樣,,隨著將來(lái)flash容量的增加,,塊數(shù)即使再多,也能夠用同樣的方法處理,,而不用增大RAM,。
3 結(jié)束語(yǔ)
本文介紹了一種針對(duì)MLC flash的優(yōu)異管理算法及軟件實(shí)現(xiàn)方法,并且已在SD卡上大規(guī)模商用,。該算法只需簡(jiǎn)單配置就能支持市場(chǎng)上的各種flash,,而且也兼容各種SD設(shè)備。同時(shí)RAM空間需求小,,成本低,,壽命長(zhǎng),兼容性好,,擴(kuò)展性強(qiáng),flash空間利用率高,,具有很高的商用價(jià)值,。