基于浮柵器件的低位寬卷積神經(jīng)網(wǎng)絡(luò)研究
所屬分類(lèi):技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>450 K
標(biāo)簽: 卷積神經(jīng)網(wǎng)絡(luò) 量化 存算一體
所需積分:0分積分不夠怎么辦?
文檔介紹:浮柵器件(Flash)能夠?qū)⒋鎯?chǔ)和計(jì)算的特性相結(jié)合,,實(shí)現(xiàn)存算一體化,,但是單個(gè)浮柵單元最多只能存儲(chǔ)位寬為4 bit的數(shù)據(jù),。面向Nor Flash,,研究了卷積神經(jīng)網(wǎng)絡(luò)參數(shù)的低位寬量化,,對(duì)經(jīng)典的AlexNet、VGGNet以及ResNet通過(guò)量化感知訓(xùn)練,。采用非對(duì)稱(chēng)量化,,將模型參數(shù)從32位浮點(diǎn)數(shù)量化至4位定點(diǎn)數(shù),模型大小變?yōu)樵瓉?lái)的1/8,,針對(duì)Cifar10數(shù)據(jù)集,4位量化模型的準(zhǔn)確率相對(duì)于全精度網(wǎng)絡(luò)僅下降不到2%,。最后將量化完成的卷積神經(jīng)網(wǎng)絡(luò)模型使用Nor Flash陣列加速,。Hspice仿真結(jié)果表明,相對(duì)于全精度模型,,部署在Nor Flash陣列中的量化模型精度僅下降2.25%,,驗(yàn)證了卷積神經(jīng)網(wǎng)絡(luò)部署在Nor Flash上的可行性。
現(xiàn)在下載
VIP會(huì)員,,AET專(zhuān)家下載不扣分,;重復(fù)下載不扣分,本人上傳資源不扣分,。