摘 要: 自適應(yīng)變異粒子群算法具備了基本粒子群算法和遺傳算法優(yōu)點(diǎn),,用此算法尋找BP網(wǎng)絡(luò)較好的網(wǎng)絡(luò)權(quán)值和閾值,,使得BP網(wǎng)絡(luò)的全局誤差最小化,不僅可以克服基本BP算法收斂速度慢和易陷入局部極值的局限,, 而且模型的精度高,。仿真實(shí)驗(yàn)結(jié)果表明,本算法與傳統(tǒng)的分類方法相比,,具有更高的正確率,,驗(yàn)證了自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)是一種有效的分類方法。
關(guān)鍵詞: 音樂分類,;神經(jīng)網(wǎng)絡(luò),;粒子群優(yōu)化算法;交叉算子
音頻分類識(shí)別技術(shù)是利用計(jì)算機(jī)對(duì)音頻信號(hào)進(jìn)行分析,,從而實(shí)現(xiàn)對(duì)聲音自動(dòng)理解的一門學(xué)科,。音頻分類識(shí)別技術(shù)己經(jīng)成為信息科學(xué)中一個(gè)十分活躍的研究領(lǐng)域。作為一門交叉學(xué)科,,它正逐步成為信息技術(shù)中人機(jī)交互的關(guān)鍵技術(shù),。音頻分類識(shí)別是一個(gè)復(fù)雜的非線性過程,本質(zhì)上是一個(gè)模式識(shí)別的問題,,很多研究者在這個(gè)領(lǐng)域做了大量的工作,,但均存在需要改進(jìn)之處。如基于規(guī)則的音頻分類方法難于滿足復(fù)雜的,、多特征的音樂分類應(yīng)用[1],;模式匹配法計(jì)算量大,分類精度低[2],;隱馬爾可夫模型(HMM)算法分類決策能力差,,需要語音識(shí)別的先驗(yàn)統(tǒng)計(jì)知識(shí)等缺陷[3]。
人工神經(jīng)網(wǎng)絡(luò)是一種分布式并行信息處理系統(tǒng),,它的自適應(yīng),、自組織及自學(xué)習(xí)等特征使其特別適合于音頻識(shí)別中的分類問題,為解決音頻分類識(shí)別這樣的一個(gè)復(fù)雜的模式分類問題提供了新的途徑,。眾多神經(jīng)網(wǎng)絡(luò)中,,BP神經(jīng)網(wǎng)絡(luò)因其結(jié)構(gòu)簡(jiǎn)單、算法成熟并能精確尋優(yōu)而被廣泛地應(yīng)用于音頻分類識(shí)別領(lǐng)域,。但是,,由于BP算法是一種基于梯度下降的算法,因而不可避免地存在收斂速度慢,、易陷入局部極小點(diǎn)等缺點(diǎn),。近年來,人們圍繞如何加速傳統(tǒng)BP網(wǎng)絡(luò)的收斂速度及盡量避免陷入局部最優(yōu)解等問題做了大量的工作,,并提出了許多改進(jìn)方案[4-5],。
本文借鑒了遺傳算法中的變異思想,提出了基于遺傳交叉算子的自適應(yīng)變異粒子群算法,,它具備了基本粒子群算法和遺傳算法優(yōu)點(diǎn),,使粒子能夠跳出先前搜索到的局部最優(yōu)解,在更大的空間中開展搜索,,同時(shí)保持了種群多樣性,,提高算法尋找到更優(yōu)解的可能性。因此可以充分利用BP神經(jīng)網(wǎng)絡(luò)與自適應(yīng)變異粒子群算法的優(yōu)點(diǎn),,把兩者結(jié)合起來,,優(yōu)勢(shì)互補(bǔ),在全局搜索的同時(shí)利用梯度法加速尋優(yōu),,從而能改善整個(gè)網(wǎng)絡(luò)的學(xué)習(xí)性能和收斂性能,,最終提高整個(gè)系統(tǒng)的識(shí)別率。
1 BP神經(jīng)網(wǎng)絡(luò)
誤差反向傳播神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱BP神經(jīng)網(wǎng)絡(luò)),,它是一種單向傳播的多層前向網(wǎng)絡(luò),,網(wǎng)絡(luò)中除了輸入輸出節(jié)點(diǎn)外,還有一層或多層的隱含層節(jié)點(diǎn),,且同層節(jié)點(diǎn)間沒有任何禍合,。輸入信號(hào)從輸入層節(jié)點(diǎn)依次傳過各隱含層節(jié)點(diǎn),,然后傳到輸出層節(jié)點(diǎn),每一層節(jié)點(diǎn)的輸出只影響下一層節(jié)點(diǎn)的輸出,。
經(jīng)過上述計(jì)算,,由父代粒子形成的超立方體中隨機(jī)產(chǎn)生了兩個(gè)新的位置,其中在速率的交叉處將兩個(gè)父代個(gè)體的速率之和的長(zhǎng)度進(jìn)行了規(guī)格化,。因此,,只有粒子的方向受到影響,數(shù)量卻不會(huì)改變,。
3 自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)
自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)分為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定,、自適應(yīng)變異粒子群算法優(yōu)化和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)三部分。其中BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定部分是根據(jù)應(yīng)用的輸入輸出參數(shù)個(gè)數(shù)確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),,進(jìn)而確定粒子群算法個(gè)體的長(zhǎng)度,。自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,種群中的每個(gè)個(gè)體都包含了一個(gè)網(wǎng)絡(luò)所有權(quán)值和閾值,,個(gè)體通過適度函數(shù)計(jì)算個(gè)體適應(yīng)度值,,然后更新個(gè)體極值和群體極值來尋找到最優(yōu)適應(yīng)值對(duì)應(yīng)個(gè)體。BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)用自適應(yīng)變異粒子群算法得到的最優(yōu)個(gè)體對(duì)網(wǎng)絡(luò)初始權(quán)值和閾值賦值,,網(wǎng)絡(luò)經(jīng)訓(xùn)練后預(yù)測(cè)結(jié)果,。
自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法流程如圖2所示。
4 實(shí)驗(yàn)仿真與結(jié)果討論
4.1 網(wǎng)絡(luò)訓(xùn)練與識(shí)別
本文選取了民歌,、古箏,、搖滾和流行四類不同音樂,每段音樂都用倒譜法提取500組24維語音特征信號(hào),,共有2 000組語音特征信號(hào),。由于語音特征輸入信號(hào)有24維,待分類的語音信號(hào)共有4類,,所以BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為24-25-4,,即輸入層有24個(gè)節(jié)點(diǎn),隱含層有25個(gè)節(jié)點(diǎn),,輸出層有4個(gè)節(jié)點(diǎn),。
從語音特征信號(hào)數(shù)據(jù)中隨機(jī)選擇1 500組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)用來訓(xùn)練網(wǎng)絡(luò)。根據(jù)語音特征信號(hào)的特性并參考經(jīng)典PSO參數(shù)集,,本文設(shè)置算法的基本參數(shù)如下:(1)粒子規(guī)模數(shù)n=30,;(2)粒子維數(shù)D=729;(3)最大速度vmax=1,;(4)最大迭代次數(shù)設(shè)為100次,;(5)終止條件,循環(huán)達(dá)到終止迭代次數(shù)或最優(yōu)適度值連續(xù)迭代50次,,計(jì)算結(jié)果差值小于0.000 5,;(6)粒子群節(jié)點(diǎn)適應(yīng)度函數(shù)使用BP算法的MSE(Mean Squared Error)定義,。
用PSO得出的最優(yōu)解確定BP網(wǎng)絡(luò)的權(quán)值和閾值,從2 000組語音特征信號(hào)中隨機(jī)選擇1 500組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)用來訓(xùn)練網(wǎng)絡(luò),,500組數(shù)據(jù)作為測(cè)試數(shù)據(jù)用來測(cè)試網(wǎng)絡(luò)的分類能力,。將這個(gè)分類號(hào)與輸入自帶的分類號(hào)進(jìn)行比較,相等則識(shí)別正確,;反之,識(shí)別錯(cuò)誤,。最后將識(shí)別正確的個(gè)數(shù)與所有待識(shí)別數(shù)作比值即可得到最終的識(shí)別率,。
4.2 結(jié)果與分析
用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)分類語音特征信號(hào)測(cè)試數(shù)據(jù),圖3 所示是BP神經(jīng)網(wǎng)絡(luò)分類誤差,,圖4所示是預(yù)測(cè)結(jié)果,。
為了驗(yàn)證自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)基于遺傳交叉算子的改進(jìn)粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(HPSOBPNN)的有效性,同時(shí)用其他模型(GABPNN,、PSOBPNN,、BPNN、模式匹配法,、HMM)進(jìn)行了的實(shí)驗(yàn),,結(jié)果如表1所示。從表1可知,,HPSOBPNN分類正確率比其他模型方法有了明顯的提高,。
音頻的自動(dòng)分類,尤其是語音和音樂的分類,,作為提取音頻內(nèi)容語義和結(jié)構(gòu)的重要手段之一,,其研究也日益地引起關(guān)注。本文采用倒譜系數(shù)法提取音樂特征,,利用自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)對(duì)音樂類型進(jìn)行分類,,與其他方法相比,其分類正確率有了明顯的提高,。仿真實(shí)驗(yàn)結(jié)果表明,,該方法分類性能較好,具有一定的現(xiàn)實(shí)意義與參考價(jià)值,。
參考文獻(xiàn)
[1] Tian Lan,, Lu Xiaoshan,Bai Shuzhong. Speaker-independent speech recognition based on a fast algorithm[J]. Control and Decision,, 2002,,17(1):65-68.
[2] DOWNIE T R, SILVERMAN B W. The discrete multiple wavelet transform and thresholding methods[J]. IEEE Trans on Signal Processing,,1998,,46(9):2558-256.
[3] TZANETAKIS G,, COOK P. Musical genre classification of audio signals[J]. IEEE Trans. on Speech and Audio Processing, 2002,,10(5):293-302.
[4] MANIEZZO V. Genetic evolution of the topology and weight distribution of neural networks[J]. IEEE Trans on Neural Networks,, 1994,5(1):39-53.
[5] HAGAN M T,, MENHAJ M B. Trainning feed forward networks with the marquardt algorithm[J]. IEEE Trans on Neural Networks,, 1994, 5(6):989-993.
[6] EBERHART R C,, KENNEDY J. A new optimizer using particle swarm theory[C]. Proc. of the 6th Int’1 Symp. on Micro Machine and Human Science. Nagoya,, Japan:[s. n.], 1995.
[7] CLERC M. The swarm and the queen: Towards a deterministic and adaptive particle swarm optimization [C].Proc. 1999 Congress on Evolutionary Computation. Washington,, DC: [s. n.],, 1999:1951-1957.