《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 基于改進神經(jīng)網(wǎng)絡(luò)的農(nóng)作物產(chǎn)量預(yù)測方法
基于改進神經(jīng)網(wǎng)絡(luò)的農(nóng)作物產(chǎn)量預(yù)測方法
2019年電子技術(shù)應(yīng)用第10期
劉 鵬1,鄭 勇2,,楊紅軍3
1.山東麥港數(shù)據(jù)系統(tǒng)有限公司,,山東 濟南250100,; 2.山東省農(nóng)業(yè)信息中心,山東 濟南250100,;3.濟南市農(nóng)業(yè)信息中心,,山東 濟南250002
摘要: 農(nóng)作物產(chǎn)量預(yù)測對政府規(guī)劃國民經(jīng)濟的發(fā)展具有決定性作用,對于合理統(tǒng)籌種植策略以及減少水肥的浪費有著重要意義,。影響農(nóng)作物產(chǎn)量的因素眾多,,準(zhǔn)確預(yù)測農(nóng)作物產(chǎn)量具有非常重要的意義。氣候是影響農(nóng)作物產(chǎn)量的重要因素,。以氣候因素為依據(jù),,提出了一種基于改進長短期記憶神經(jīng)網(wǎng)絡(luò)的農(nóng)作物產(chǎn)量時間序列預(yù)測的方法,,將歷史產(chǎn)量和氣候因素相結(jié)合,以固定年份為單位對下一年農(nóng)作物產(chǎn)量進行預(yù)測,。實驗結(jié)果表明,,與長短期記憶神經(jīng)網(wǎng)絡(luò)、支持向量機方法進行對比,,本方法在農(nóng)作物產(chǎn)量時間序列預(yù)測中有較高的準(zhǔn)確性,。
中圖分類號: TP391
文獻標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.190537
中文引用格式: 劉鵬,鄭勇,,楊紅軍. 基于改進神經(jīng)網(wǎng)絡(luò)的農(nóng)作物產(chǎn)量預(yù)測方法[J].電子技術(shù)應(yīng)用,,2019,45(10):88-91,,99.
英文引用格式: Liu Peng,,Zheng Yong,Yang Hongjun. Crop yield prediction method based on an improved neural network[J]. Application of Electronic Technique,,2019,,45(10):88-91,99.
Crop yield prediction method based on an improved neural network
Liu Peng1,,Zheng Yong2,,Yang Hongjun3
1.Shandong MGdaas Systems Co.,Ltd.,,Jinan 250100,,China; 2.Shandong Agricultural Information Center,,Jinan 250100,,China;3.Jinan Agricultural Information Center,,Jinan 250002,,China
Abstract: Crop yield forecasting plays a decisive role in the development of national economy planned by the government. It is of great significance to rationally plan planting strategies and reduce the waste of water and fertilizer. There are many factors affecting crop yield, and accurate prediction of crop growth means a lot. Climate is an important factor affecting crop yield. Based on climatic factors, this paper proposes a time series prediction method based on the long short-term memory(LSTM) for crop yield prediction. The method combines historical yields with climatic factors to forecast the crop yield of the next period by years. Experimental results show that compared with LSTM and support vector machine methods, the proposed method achieves higher accuracy in crop yield prediction.
Key words : crop yield prediction;long short-term memory,;deep learning,;recurrent neural network;climate factor

0 引言

    農(nóng)業(yè)是國民經(jīng)濟組成的重要部分,,農(nóng)作物生產(chǎn)對于社會的穩(wěn)定具有重要作用,。農(nóng)作物產(chǎn)量是政府部門進行農(nóng)業(yè)決策和宏觀調(diào)控的重要依據(jù),預(yù)估農(nóng)作物產(chǎn)量具有重要的意義,。影響農(nóng)作物產(chǎn)量的因素眾多,,農(nóng)作物產(chǎn)量的形成通常具有非線性的特點,準(zhǔn)確地預(yù)估農(nóng)作物產(chǎn)量一直是農(nóng)業(yè)發(fā)展中的一個難題,。

    現(xiàn)有的估產(chǎn)辦法主要包括統(tǒng)計方法,、遙感術(shù)[1],、水肥測量[2]、一元或多元回歸分析[3]等方法,。這些方法通常存在成本高,、周期長、精確度不夠高等缺點,。同時只使用產(chǎn)量信息的預(yù)測方法無法得到更加準(zhǔn)確的預(yù)測結(jié)果,。隨著現(xiàn)代農(nóng)業(yè)和大數(shù)據(jù)時代的發(fā)展,能夠獲得大量影響農(nóng)作物生長因素的信息,,其中氣候因素對農(nóng)作物的產(chǎn)量影響重大[4],。

    近十多年來神經(jīng)網(wǎng)絡(luò)快速發(fā)展,它模擬人腦的神經(jīng)系統(tǒng)對復(fù)雜信息的處理機制,,具有高度的非線性特點[5],。不同于多元回歸只能對線性關(guān)系建模,神經(jīng)網(wǎng)絡(luò)對線性關(guān)系和非線性關(guān)系都能建模,,而且不需要預(yù)處理,,也不需要對輸入輸出關(guān)系做任何假設(shè)。遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,,RNN)能夠更靈活,、準(zhǔn)確地對農(nóng)作物產(chǎn)量做出預(yù)測。但是標(biāo)準(zhǔn)的遞歸神經(jīng)網(wǎng)絡(luò)由于梯度消失比較難捕獲長期依賴關(guān)系[6],,HOCHREITER S等人[7]提出一種特殊的RNN結(jié)構(gòu)類型——長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM),,它可以處理長期信息依賴,,所以適合于處理和預(yù)測時間序列中間隔和延遲相對較長的重要事件[8-9]

    然而,,僅用單一的LSTM模型無法充分考慮其他影響產(chǎn)量的因素,。在農(nóng)作物產(chǎn)量預(yù)測中,溫度,、降水量等是重要的決定因素,。針對此問題,本文提出一種基于LSTM,,同時使用影響產(chǎn)量的氣候因素的ELSTM模型,,對農(nóng)作物的產(chǎn)量進行更加準(zhǔn)確的預(yù)測。實驗表明ELSTM模型比LSTM模型具有更高的準(zhǔn)確性,。

1 相關(guān)工作

    許多學(xué)者對預(yù)測問題做了深入的研究,,特別是神經(jīng)網(wǎng)絡(luò)可以快速有效地解決復(fù)雜問題,近年來在眾多領(lǐng)域得到了廣泛的應(yīng)用,。

    MISHRA S等人[10]提出一種新型的RNN結(jié)構(gòu)來處理短期預(yù)測問題,,時間關(guān)系由神經(jīng)元提供,,可以根據(jù)具體情況使用不同類型的激活函數(shù)和不同數(shù)量的神經(jīng)元來提高準(zhǔn)確性。該模型只適用于短期預(yù)測,,不適用于本文要解決的問題,。

    Guo Tao等人[11]使用LSTM模型來處理預(yù)測問題,LSTM最多增加4個層來改進重復(fù)模塊,,方便實現(xiàn)和控制長期記憶,,在準(zhǔn)確性方面得到令人滿意的預(yù)測。

    Hu Haiqing等人[12]綜合了灰色預(yù)測模型和三角模型的優(yōu)點,,建立TGM模型來預(yù)測中國糧食的產(chǎn)量,。但是該模型只使用了產(chǎn)量信息,沒有考慮其他的條件,,不符合本文要解決的問題,。

    HOSSAIN M A等人[13]考慮氣候?qū)r(nóng)作物產(chǎn)量的影響,利用神經(jīng)網(wǎng)絡(luò)(NN)建立天氣參數(shù)預(yù)測模型,,然后將預(yù)測天氣以及當(dāng)前的農(nóng)業(yè)數(shù)據(jù)作為支持向量機(SVM)的輸入對水稻產(chǎn)量進行預(yù)測,。但是SVM適用于分類問題,產(chǎn)量預(yù)測準(zhǔn)確性不是很高,。

    綜上,,當(dāng)前用于處理預(yù)測問題的方法無法很好地解決本文所述問題,而且僅用單一的LSTM預(yù)測模型無法進行準(zhǔn)確預(yù)測,,其他方法也沒有充分利用影響產(chǎn)量的氣候因素,。基于這個問題,,本文考慮在使用LSTM預(yù)測的基礎(chǔ)上同時優(yōu)化LSTM,,在預(yù)測模型中考慮氣候因素對產(chǎn)量的影響以使預(yù)測更加準(zhǔn)確,提出了使用氣候因素進行產(chǎn)量預(yù)測的ELSTM模型,。

2 數(shù)據(jù)預(yù)處理和ELSTM模型

    隨著現(xiàn)代農(nóng)業(yè)和精準(zhǔn)農(nóng)業(yè)的發(fā)展,,對農(nóng)作物的產(chǎn)量和氣候因素有準(zhǔn)確的記錄。農(nóng)作物的產(chǎn)量預(yù)測模型主要根據(jù)歷史產(chǎn)量來建模學(xué)習(xí)和預(yù)測當(dāng)前年份的產(chǎn)量,,同時在模型中加入歷史年份的氣候因素,,以更加準(zhǔn)確地給出當(dāng)前年份的產(chǎn)量的預(yù)測。

2.1 數(shù)據(jù)預(yù)處理

    基于農(nóng)作物生長的自然規(guī)律,,氣候條件對產(chǎn)量的影響是產(chǎn)量預(yù)測中必須注意的一個要點,。氣候中最重要的兩個因素是氣溫和降水[14]。對初始數(shù)據(jù)進行下述處理可以獲得適用于本模型的數(shù)據(jù)集:

    定義 s為預(yù)測的目標(biāo)年份,,使用前i年的信息進行預(yù)測,,則Xs={xs-i,…,,xs-2,,xs-1}為預(yù)測s年產(chǎn)量的歷史產(chǎn)量數(shù)據(jù),;Es={es-i,…,,es-2,,es-1}為預(yù)測s年產(chǎn)量的氣候因素數(shù)據(jù)。例如預(yù)測2010年的產(chǎn)量,,使用前3年數(shù)據(jù)進行預(yù)測,,則產(chǎn)量是數(shù)據(jù)為X2010={x2007,x2008,,x2009},,氣候因素數(shù)據(jù)為E2010={e2007,e2008,,e2009},。

    本模型主要利用前s-i年所有產(chǎn)量數(shù)據(jù)和氣候數(shù)據(jù)對接下來s年產(chǎn)量進行預(yù)測。

2.2 LSTM

    RNN是一種節(jié)點定向連接成環(huán)的人工神經(jīng)網(wǎng)絡(luò),,可以利用它內(nèi)部的記憶來處理任意時序的輸入序列,。然而BENGIO Y等人[15]觀察到由于梯度消失問題,RNN無法處理長距離依賴的問題,。LSTM是RNN的變體,,但是單一的產(chǎn)量數(shù)據(jù)進行預(yù)測結(jié)果不夠準(zhǔn)確。因此,,本文提出了在LSTM基礎(chǔ)上增加了考慮氣候因素的ELSTM模型,。

2.3 ELSTM模型

    不同年份農(nóng)作物生長期內(nèi)溫度、降水情況對產(chǎn)量有重要影響,。結(jié)合歷史年份氣候條件和預(yù)測年份氣候條件相似性可以進一步挖掘產(chǎn)量中的內(nèi)部聯(lián)系,,這對提高預(yù)測性能是重要的。

    ELSTM模型整體架構(gòu)如圖1所示,,模型在標(biāo)準(zhǔn)LSTM架構(gòu)的結(jié)果上加入氣候因素權(quán)重,以便能夠捕捉氣候條件對農(nóng)作物產(chǎn)量的影響,。

jsj3-t1.gif

    ELSTM模型共分為LSTM層,、權(quán)重層和預(yù)測層。模型需要兩個輸入,,即歷史產(chǎn)量Xs和氣候條件Es,。Xs經(jīng)過LSTM層得到每年產(chǎn)量的向量表示Hs={hs-i,…,,hs-2,,hs-1},Es經(jīng)過權(quán)重層得到每年生長條件對應(yīng)的As={jsj3-t1-x1.gifs-i,,…,,jsj3-t1-x1.gifs-2,,jsj3-t1-x1.gifs-1}。Hs和As經(jīng)過預(yù)測層得到預(yù)測產(chǎn)量,。

    首先是LSTM層,,如圖2所示歷史產(chǎn)量Xs經(jīng)過LSTM層得到對應(yīng)的產(chǎn)量向量表示Hs

jsj3-t2.gif

    LSTM在普通RNN基礎(chǔ)上,,在隱藏層各神經(jīng)單元中增加記憶單元,,從而使時間序列上的記憶信息可控。一個LSTM單元有3個門:遺忘門,、輸入門,、輸出門。LSTM單元結(jié)構(gòu)如圖3所示,。

jsj3-t3.gif

    (1)遺忘門:遺忘門是以上一單元的輸出ht-1和本單元的輸入xt為輸入的sigmoid函數(shù),,{Wf,Uf,,bf}是遺忘門的參數(shù),。

jsj3-gs1-6.gif

    由于一個年份對應(yīng)一個LSTM單元,因此取每個單元的輸出向量表示當(dāng)前年份的產(chǎn)量信息,。離被預(yù)測年份越近的年份受之前年份的產(chǎn)量影響越大,。

    在權(quán)重層得到s-i年氣候因素所對應(yīng)的權(quán)重。

    首先將s-i年與s年的氣候因素做差,,氣候條件與s年越相似的年份,,差值越小。將每年的差值歸一化并組合成一條信息,,具體計算如下:

jsj3-gs7-12.gif

jsj3-gs13.gif

    訓(xùn)練過程如下:

    (1)LSTM層,。產(chǎn)量信息Xs作為LSTM層的輸入。按年份順序?qū)a(chǎn)量信息輸入不同LSTM單元中,,在每個LSTM單元得到包含所有歷史產(chǎn)量信息Hs,。

    (2)權(quán)重層。將生長條件信息作為權(quán)重層的輸入,經(jīng)過計算得到每個年份的權(quán)重As,。

    (3)預(yù)測層,。將Hs和As作為最終預(yù)測層的輸入,經(jīng)過預(yù)測層的運算即可得到歷史產(chǎn)量向量,,然后得到預(yù)測值,。

    (4)通過有監(jiān)督的訓(xùn)練調(diào)整模型。按照損失函數(shù)計算預(yù)測值與真實值之間的差別,,使用BP算法調(diào)整模型每層的參數(shù),。

    參數(shù)調(diào)整后重復(fù)這一過程,直到得到一組最優(yōu)的參數(shù)并保留下來。

3 實驗

    用于建模分析的數(shù)據(jù)是2000年~2016年山東省17個市農(nóng)作物產(chǎn)量和氣候情況,。其中農(nóng)作物選擇的是小麥,、玉米這兩種代表性的農(nóng)作物。為了避免因為種植面積變化帶來的產(chǎn)量變化,,本文使用每公頃產(chǎn)量作為農(nóng)作物的產(chǎn)量的單位,。氣候因素是兩種農(nóng)作物對應(yīng)生長期每天的降水量和溫度,小麥的氣候因素數(shù)據(jù)是每年9月份到下年5月份每天的降水量和溫度,,玉米的氣候因素數(shù)據(jù)是每年6月份~9月份每天的降水量和溫度,。

3.1 實驗設(shè)置說明

    本節(jié)將通過實驗評估所提出的ELSTM模型。實驗環(huán)境為:INTELCorei5 CPU,,3.20 GHz,;8 GB內(nèi)存。每個對比實驗情況均運行10遍,,取平均值,。主要設(shè)置3個對比模型:

    (1)ELSTM模型:本文提出的ELSTM模型,利用產(chǎn)量和生長條件信息進行預(yù)測,。

    (2)LSTM模型:標(biāo)準(zhǔn)的LSTM模型,,只使用歷年產(chǎn)量信息進行預(yù)測。

    (3)SVM模型:使用支持向量機(SVM)對歷年產(chǎn)量信息進行預(yù)測,。

3.2 模擬比較實驗

    本節(jié)使用ELSTM,、LSTM和SVM 3種模型進行實驗。將過去2~6年的歷史產(chǎn)量和氣候條件作為模型輸入,。

    使用偏差率(Deviation rate)來計算預(yù)測值同真實值之間的偏差占真實值的百分比,,偏差率值越小,模型的準(zhǔn)確率越高,。使用以下公式計算:

    jsj3-gs14.gif

    使用決定系數(shù)(R2)來判斷模型擬合的程度,,擬合程度越高,R2越接近1,。使用如下公式計算:

jsj3-gs15.gif

    小麥誤差率實驗結(jié)果如表1所示,。玉米誤差率實驗結(jié)果如表2所示。

jsj3-b1.gif

jsj3-b2.gif

    從實驗結(jié)果中可以看出,,在3個模型中,,ELSTM模型預(yù)測結(jié)果最好。同時根據(jù)誤差率的分布,,可以得出使用過去4年的產(chǎn)量預(yù)測下一年產(chǎn)量預(yù)測結(jié)果更準(zhǔn)確。

    將過去4年小麥的產(chǎn)量和氣候條件作為輸入進行計算,,得到實驗結(jié)果如表3所示,。

jsj3-b3.gif

    從實驗結(jié)果中可以看出,ELSTM模型的決定系數(shù)最大,,擬合程度優(yōu)于其他模型,。

    通過以上實驗可以看出,,ELSTM模型的預(yù)測結(jié)果準(zhǔn)確率更高,擬合程度更好,。針對此問題,,ELSTM是一個很好的預(yù)測模型。

4 結(jié)論

    預(yù)測農(nóng)作物產(chǎn)量是農(nóng)業(yè)生產(chǎn)中的一個重要問題,。由于農(nóng)作物生長受多方面因素影響,,準(zhǔn)確預(yù)測農(nóng)作物產(chǎn)量非常重要。

    本文針對農(nóng)作物產(chǎn)量預(yù)測問題設(shè)計了一個基于LSTM的改進模型進行求解,。在求解過程中,,將農(nóng)作物歷史產(chǎn)量數(shù)據(jù)與生長條件數(shù)據(jù)相結(jié)合,作為輸入對模型進行訓(xùn)練,,可對當(dāng)年農(nóng)作物產(chǎn)量進行精準(zhǔn)預(yù)測,。實驗表明,與其他預(yù)測方法相比,,本模型有更理想的預(yù)測結(jié)果,。

    在未來的工作中,計劃將所提出的方法應(yīng)用于其他具有相同特征的預(yù)測問題,,以觀察該模型在不同問題上的預(yù)測精確度和通用性,。

參考文獻

[1] GUERIF M,LAUNAY M,,DUKE C.Remote sensing as a tool enabling the spatial use of crop models for crop diagnosis and yield prediction[C].IEEE International Geoscience and Remote Sensing Symposium,,2000:1477-1479.

[2] Jin Chuan,Qin Qiming,,Zhu Lin,,et al.TVDI basedcrop yield prediction model for stressed surfaces[C].IEEE International Geoscience and Remote Sensing Symposium,2007:4656-4658.

[3] KERDILES H,,REMBOLD F,,LEO O,et al.CST,,a freeware for predicting crop yield from remote sensing orcrop model indicators:illustration with RSA and Ethiopia[C].International Conference on Agro-Geoinformatic,,2017:1-6.

[4] Zhuo Zhihong,Gao Chaochao,,Liu Yonghong.Regional grain yield response to climate change in China: a statistic modeling approach[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,,2014,7(11):4472-4479.

[5] Wang Anhong,,Zhang Xueying,,Sun Zhiyi,et al.A nonlinear prediction speech coding ADPCM algorithm based on RNN[C].International Conference on Machine Learning and Cybernetics,2002:1353-1357.

[6] PASCANU R,,MIKOLOV T,,BENGIO Y.On the difficulty of training recurrent neural networks[J].Computer Science,2013,,28(1):337-345.

[7] HOCHREITER S,,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,,9(8):1735-1780.

[8] 涂小萌,,陳強國.基于ARIMA-LSSVM混合模型的犯罪時間序列預(yù)測[J].電子技術(shù)應(yīng)用,2015,,41(2):160-162,,166.

[9] 楊爍,孫欽斐,,朱潔,,等.基于大數(shù)據(jù)平臺的電采暖用電量預(yù)測分析[J].電子技術(shù)應(yīng)用,2018,,44(11):67-69.

[10] MISHRA S,,PATRA S K.Short term load forecasting using a novel recurrent neural network[C].IEEE Region 10 Conference,2008:1-6.

[11] Guo Tao,,Liu Rui,,Yang Heng,et al.Predict atmosphere electric field value with the LSTM neural network[C].International Conference on Computer Systems,,Electronics and Control,,2017:263-266.

[12] Hu Haiqing,Zhang Dan,,Qiu Ping.Application of trigonometric grey prediction approach to forecasting China grain yield[C].IEEE International Conference on Grey Systems and Intelligent Services,,2009:538-542.

[13] HOSSAIN M A,UDDIN M N,,HOSSAIN M A,,et al.Predicting rice yield for Bangladesh by exploiting weather conditions[C].International Conference on Information and Communication Technology Convergence,2017:589-594.

[14] Huang Youxin,,Liu Xiuguo,,Shen Yonglin,et al.Assessment of agricultural drought indicators impact on soybean crop yield:a case study in Iowa,,USA[C].The Third International Conference on Agro-Geoinformatics,,2014:1-6.

[15] BENGIO Y,F(xiàn)RASCONI P,,SIMARD P.The problem of learning long-term dependencies in recurrent networks[C].IEEE International Conference on Neural Networks.San Francisco,,USA,,1993(3):1183-1188.



作者信息:

劉  鵬1,鄭  勇2,,楊紅軍3

(1.山東麥港數(shù)據(jù)系統(tǒng)有限公司,山東 濟南250100,;

2.山東省農(nóng)業(yè)信息中心,,山東 濟南250100;3.濟南市農(nóng)業(yè)信息中心,,山東 濟南250002)

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。