神經網絡隱含層數的確定范文
時間:2024-04-02 18:03:41
導語:如何才能寫好一篇神經網絡隱含層數的確定,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
1.1區位因素
區位因素是高校周轉房房租市場化價格影響因素中較為宏觀卻具有重要地位的影響因素。區位能夠反映房屋在城鎮中所處的位置,反映房屋與商服、學校、醫院等生產生活不可或缺的重要設施之間的空間關系。
1.2鄰里因素
鄰里因素反映了房屋所處的小區級范圍內各類生產、生活要素的情況,相對于區位因素而言,鄰里因素更加注重諸如容積率、物業管理、車位等更加微觀、具體的因素。
1.3個別因素
個別因素是從出租房屋本身的面積、戶型、樓層、裝修、建筑年代、建筑結構、評估時點等情況考慮,反映房屋自身情況與租金之間關系的要素。
2 高校周轉房房租市場化價格評估指標體系的建立
2.1指標的確定
遵循指標體系構建原則,結合高校周轉房房租市場化定價的實際情況,確定指標體系,具體如表1所示。
3 基于神經網絡的高校周轉房租金市場化價格評估模型構建
3.1樣本的選取與預處理
BP神經網絡能夠通過對一定數量網絡輸入輸出樣本數據學習、訓練,確定網絡輸入輸出的映射關系。為保證其準確性和高效性,需運用一定的方法對樣本進行選取和預處理。基于神經網絡的高校周?D房租金市場化價格評估模型的構建,應當選取正常市場條件下,與評估對象相似或相近的樣本數據,并對數據不完整或某指標存在明顯異常值的樣本進行甄別和剔除,對指標數據進行無量綱化處理,以避免不同指標數據的實際單位對評估模型的收斂速度和準確性造成的影響。
3.2神經網絡的建立與學習
3.2.1神經網絡層數的確定
神經網絡一般包括輸入層、隱含層、輸出層。神經網絡的層數越多,神經網絡的結構越復雜,其數據學習和處理能力就越強,但神經網絡的學習時間也相應的越長。根據已有的相關研究,輸入層、隱含層、輸出層各為一層的三層神經網絡能夠對閉合區間內任意連續函數進行無限逼近,考慮到基于神經網絡的高校青年教師周轉公寓租金市場化定價模型并不復雜,確定其輸入層、隱含層、輸出層各為一層。
3.2.2神經網絡節點數的確定
根據已構建的高校周轉房房租市場化價格評估指標體系中三級評估指標的個數,確定神經網絡輸入層的節點個數為15個。基于神經網絡的高校青年教師周轉公寓租金市場化定價模型的最終結果為待估對象的房租價格,因此,確定神經網絡的輸出層節點個數為1個。隱含層節點個數的確定需要運用經驗公式和試驗調整確定。
3.2.3激活函數的確定
激活函數是網絡輸入轉換為網絡輸出的關鍵,常用的激活函數有線性激活函數、對數S型激活函數、階躍型激活函數等。高校青年教師周轉公寓房租價格評估指標與房租價格之間并非線性關系或離散關系,對數型激活函數連續可微,計算簡便,在神經網絡建模中運用較為普遍,因此,本文選取對數S型函數作為激活函數。
篇2
關鍵詞:BP神經網絡、圖像分割、特征提取
Abstract: the image recognition process including the image preprocessing, feature extraction, image understanding and analysis. Which BP artificial neural network in the image segmentation using better; In the feature extraction phase BP neural network is also very good find application, and obtain the better feature extraction results; In the image understanding and the analysis phase using neural network classifier design, can get accurate classification results.
Keywords: BP neural network, image segmentation, feature extraction
中圖分類號:TP183 文獻標識碼:A文章編號:
引言
BP人工神經網絡算法是現今應用較為廣泛的多層前向反饋式神經網絡算法,BP人工神經網絡有較好的容錯能力、魯棒性、并行協同處理能力和自適應能力,受到了國內外眾多領域學者的關注。由于神經網絡高效率的集體計算能力和較強的魯棒性,它在圖像分割方面的應用已經很廣泛,Jain和Karu采用了多通道濾波與前向神經網絡相結合的方法實現圖像紋理分割算法。神經網絡算法在特征提取階段,壓縮特征數量,以提高分類速度和精度。在圖像識別領域中神經網絡作為分類器的研究也得到了很大的進展,尤其是其學習能力和容錯性對于模式識別是非常有利的,在一定程度上提高了訓練速度和識別率。Le Cun等人提出了多層特征選擇(Multilayer Selection Procedure)方法用于字符識別,每一層神經網絡處理較低層次的特征,獲取該層特征信息并傳給上一層。
BP神經網絡的基本原理
人工神經網絡的研究起源于對生物神經系統的研究,它將若干處理單元(即神經元)通過一定的互連模型連結成一個網絡,這個網絡通過一定的機制可以模仿人的神經系統的動作過程,以達到識別分類的目的。人工神經網絡區別于其他識別方法的最大特點是它對待識別的對象不要求有太多的分析與了解,具有一定的智能化處理的特點。神經網絡的學習過程實際上就是不斷地調整權值和閾值的過程。根據有無訓練樣本的指導可以將神經網絡的學習方式分為兩種:監督學習方式和非監督學習方式,也稱為有導師指導學習方式和無導師指導學習方式。監督學習方式,是在給定固定的輸入輸出樣本集的情況下,由網絡根據一定的學習規則進行訓練學習,每一次學習完成后,通過對比實際的輸出和期望的輸出,以此決定網絡是否需要再學習,如果還沒有達到期望的誤差,則將實際誤差反饋到網絡,進行權值和閾值的調整,使實際的誤差隨著學習的反復進行而逐步減小,直至達到所要求的性能指標為止。非監督學習方式,是在沒有外界的指導下進行的學習方式,在學習過程中,調整網絡的權重不受外來教師的影響,但在網絡內部會對其性能進行自適應調節。
BP神經網絡分類器的設計
BP神經網絡是基于誤差反向傳播算法(Back Propagation Algorithm,BPA)的多層前向神經網絡,由輸入層、輸出層、一個或多個隱含層所組成。BP神經網絡結構確定之后,通過對輸出和輸入樣本集進行訓練,反復修正網絡的權值和閾值,達到學習訓練的期望誤差,以使網絡能夠實現給定的輸入輸出映射關系。BP人工神經網絡的學習過程分為兩個階段,第一階段是輸入己知的學習樣本數據,給定網絡的結構和初始連接權值和閾值,從輸入層逐層向后計算各神經元的輸出;第二階段是對權值和閾值進行修改,即根據網絡誤差從最后一層向前反饋計算各層權值和閾值的增減量,來逐層修正各層權值和閾值。以上正反兩個階段反復交替,直到網絡收斂。具體實現步驟如下:
(1) 網絡的初始化:首先對輸入的學習訓練樣本進行歸一化處理,對權值矩陣W和閾值向量賦初值,將網絡計數器和訓練次數計數器置為1,網絡誤差置為0。
(2) 輸入訓練樣本,計算輸入層,隱含層以及輸出層的實際輸出。
(3) 計算網絡輸出誤差。將實際的輸出和期望的輸出值進行對比,采用均方根誤差指標作為網絡的誤差性能函數。
(4) 若誤差還沒達到期望標準,則根據誤差信號,逐層調整權值矩陣和閾值向量。
(5) 若最終調整之后的網絡輸出達到了誤差范圍之內,則進行下一組訓練樣本繼續訓練網絡。
(6) 若全部的訓練樣本訓練完畢,并且達到了期望的誤差,則訓練結束,輸出最終的網絡聯接權值和閾值。
BP神經網絡可以逼近任意連續函數,具有很強的非線性映射能力,而且BP神經網絡中間層數、各層神經元數及網絡學習速率等參數均可以根據具體情況設定,靈活性較強,所以BP神經網絡在許多領域中廣泛應用。一般來說,神經網絡方法應同傳統的人工智能方法相聯系的。神經網絡本身結構及性能上的特點使其對問題的處理更富有彈性,更加穩健。神經網絡的基本特點是采用自下而上的設計思路,使其容易確定具體的目標分割或識別算法,在增加了不確定因素的同時也產生了網絡最優化的問題,這就是所謂的偽狀態(pseudo-trap)。盡管在實踐中并非所有的偽狀態對應完全失敗的結果,但是畢竟這不符合對之完美的或者說合理的期望。人工智能則一般采用自上而下的方法,偏重于邏輯推理建立系統模型。因此將神經網絡同人工智能結合起來,相當于賦予神經網絡高層指導的知識及邏輯推理的能力,具有潛在的優勢。
輸入層中間層 輸出層
圖1 BP人工神經網絡結構
BP神經網絡的訓練
4.1 BP神經網絡的設計
BP神經網絡的設計主要包括兩方面內容:一是神經網絡結構的確定,特別是隱含層層數及隱含層單元數目的確定;二是高精度收斂問題,隱含層和隱含層單元數過多,將導致訓練時間過長并出現過度擬和的問題,隱含層單元數過少又導致網絡收斂速度慢甚至不收斂,達不到誤差精度要求。在確定隱含層層數以及隱含層單元數目時,沒有一個嚴格的理論依據指導,需要根據特定的問題,結合經驗公式確定大致范圍來進行逐步試算比較得到。
4.2 數據預處理
為了加快網絡的訓練速度,通常在網絡訓練前進行神經網絡輸入和輸出數據預處理,即將每組數據都歸一化變為[-1,1]之間的數值的處理過程。
4.3 神經網絡的訓練
%當前輸入層權值和閾值
inputWeights=net.IW{1,1}
inputbias=net.b{1}
%當前網絡層權值和閾值
layerWeights=net.LW{2,1}
layerbias=net.b{2}
%設置訓練參數
net.trainParam.show = 1000;%限時訓練迭代過程
net.trainParam.lr = 0.1; %學習率,缺省為0.01
net.trainParam.epochs = 100000; %最大訓練次數,缺省為100
net.trainParam.goal = 0.001; %訓練要求精度,缺省為0
[net,tr]=train(net,P,T);%調用 TRAINGDM 算法訓練 BP 網絡
A = sim(net,P) %對 BP 網絡進行仿真
E = T - A;%計算仿真誤差
MSE=mse(E)
結束語
BP網絡因為具有較強的學習性、自適應型和容錯性,在很多領域均已經大量運用。本文將BP人工神經網絡運用于圖像的識別,探索人工神經網絡在圖像識別領域中的重要的現實意義。研究表明,BP人工神經網絡應用于圖像識別在一定程度上提高了識別的效率和準確率。但是,BP神經網絡算法還存在以下幾點不足之處:(1)權的調整方法存在局限性,容易陷入局部最優;(2)網絡的結構需要提前指定或者在訓練過程中不斷的修正;(3)過分依賴學習樣本,由于學習樣本是有限的或者學習樣本質量不高,那么會導致訓練達不到效果;(4)對于規模較大的模式映射問題,存在收斂速度慢、容易陷入局部極小點、判斷不準確等缺陷。總之,如何解決以上問題,如何進一步提高識別精度,擴大識別范圍,使之更具有更好的工程實用性,是有待進一步研究的內容。
參考文獻:
[1] WE Blanz,S L Gish.A Connectionist Classifier Architecture Applied to Image Segmentation.Proc.10th ICPR,1990,272-277.
[2] Y Le Cun,L D Jackel,B Boser,J S Denker,H P Graf,I Guyon,D Henderson,R E Howard,and W Hubbard,Handwriten Digit Recognition:Applications of Neural Network Chips and Automatic Learning,IEEE Comm.Magazine.Nov.1989.
[3] A K Jain and K Karu,Automatic Filter Design for Texture Discrimination,Proc.12th Int’l Conf.NeuralNetworks,Orlando,Oct.1994,454-458.
[4] 邊肇其,張學工.模式識別(第二版)[M].清華大學出版社,北京.1999,12.
[5] 陳書海,傅錄祥.實用數字圖像處理[M].科學出版社,北京.2005.
[6] 萬來毅,陳建勛.基于BP神經網絡的圖像識別研究[J].武漢科技大學學報(自然科學版).2006,6.
[7] 叢爽.面向MATLAB工具箱的神經網絡理論與應用(第2版)[M].北京:中國科學技術出版社,2003.
[8] 王娟,慈林林等.特征方法綜述[J].計算機工程與科學.2005.27(12).68-71.
[9] 賈花萍.基于神經網絡的特征選擇與提取方法研究[J].網絡安全.2008,7.33-35.
[10] 龔聲榮,劉純平等編著.數字圖像處理與分析[M].清華大學出版社,北京.2006.7.
篇3
關鍵詞:農田有效灌溉面積;BP神經網絡;支持向量機;預測
中圖分類號:S279.2;TP183 文獻標識碼:A 文章編號:0439-8114(2013)09-2157-04
農田有效灌溉面積指有固定水源、灌溉工程設施配套、土地平整、在一般年景下能夠進行正常灌溉的耕地面積,包括機灌面積、電灌面積、自流灌溉面積和噴灌面積[1]。它是反映農田水利建設和水利化的重要指標,也是我國各地區制定水利發展規劃的重要指標之一。對農田有效灌溉面積進行預測可以為了解未來農村水利基礎設施的建設狀況提供有價值的參考信息,同時也可為相關部門合理制定行業發展規劃提供理論支持。
1 預測方案的確定與預測方法的選擇
1.1 預測方案的確定
農田有效灌溉面積的變化受多方面因素的影響,比如政策、中央財政資金投入、地方財政資金投入、農民收入狀況等。這些因素并不是孤立地對農田有效灌溉面積產生影響,而是耦合在一起以非線性的方式影響農田有效灌溉面積的變化。
農田有效灌溉面積的預測有兩大類方案:一種為結構式的預測方法,就是通過一定的方式建立起各主要影響因素與農田有效灌溉面積之間的關系,然后根據未來各影響因素的變化去預測相對應的農田有效灌溉面積;另一種為數據序列預測法,就是將各年度的農田有效灌溉面積數值作為連續的時間序列看待,可以認為農田有效灌溉面積的變化規律已經蘊含在數據序列之中,再采用合適的方法對該序列在未來的取值進行預測。
在第一種方案中,首先需要確定具體影響農田有效灌溉面積變化的因素種類及其影響規律,另外還需要對各因素的未來變化進行預測。準確地確定影響農田有效灌溉面積變化的各種因素本身就很有難度,各因素對有效灌溉面積影響規律的辨識也同樣是一個比較復雜的問題,而預測各因素未來的變化更是一個幾乎和預測農田有效灌溉面積難度相當的問題。在第二種方案中,首先需要建立起能夠充分反映農田有效灌溉面積變化規律的預測模型,然后通過求取該預測模型在未來的輸出值即可實現預測。兩種方案相比,顯然第二種方案更容易實現。因此,在以下研究中采用數據序列預測方案。
1.2 預測方法的選擇
在數據序列的預測中,目前廣泛采用的方法有移動平均法、指數平滑法、線性回歸法、灰色預測法、神經網絡法和支持向量機方法等。這些方法中神經網絡法和支持向量機方法從本質上來說更為適合應用于非線性預測問題。而農田有效灌溉面積所構成的數據序列是一個典型的非線性序列。顯然在該研究中采用神經網絡法和支持向量機方法較為合適。為了充分研究這兩種方法的適用性,以下對這兩種方法進行對比分析。
2 兩種預測方法的理論基礎及特性分析
2.1 BP神經網絡預測的理論基礎及特性分析
在各類神經網絡中,BP神經網絡堪稱最經典、使用最為廣泛的一種神經網絡[2,3]。
BP神經網絡是誤差反向傳播(Back error propagation,簡稱BP)神經網絡的簡稱。BP神經網絡通常由1個輸入層、若干隱含層和1個輸出層組成,在每層中可以包括若干個神經元。各相鄰層神經元之間多為全連接方式,而同層神經元之間則無連接[4]。各神經元間的連接傳遞相應的權值,隱含層及輸出層各神經元都有自己的閾值。BP神經網絡作為一種前饋網絡,具有前饋網絡的共性。研究表明,三層前饋網絡就能夠以任意精度逼近任意連續函數及其各階導數[5]。對序列進行建模,從本質上來說就是獲得序列的變化泛函,BP神經網絡的函數逼近功能正好可以實現此過程。
但BP神經網絡也存在若干缺陷,其中比較突出的是網絡結構的不易確定、易限于局部收斂和收斂速度慢。其中網絡結構的不易確定是指在確定網絡結構參數的過程中沒有準確的依據可以遵循。而局部收斂則對BP神經網絡的函數逼近功能影響較大。
2.2 支持向量機預測的理論基礎及特性分析
3 預測模型的建立
3.1 樣本數據的準備
從河南統計年鑒中收集了1986-2010年河南省農田有效灌溉面積的統計數據[10]。為了降低預測模型的復雜程度,采用峰值法對這些數據進行了歸一化處理。將歸一化后的1986-2009年數據作為訓練樣本,2010年數據作為檢驗樣本。
確定預測模型每次的輸入樣本中包含6個數據,即用連續6年的數據預測第七年的數據。據此可建立訓練時的輸入樣本矩陣(6×18)和輸出樣本向量(1×18)。
3.2 預測模型基本參數的確定與訓練
1)BP神經網絡基本參數的確定與訓練。確定BP神經網絡的隱含層數為1,輸入層神經元數為6,輸出層神經元數為1,隱含層神經元數為11。隱含層和輸出層的激勵函數分別采用正切型Sigmoid函數和對數型Sigmoid函數。為了提高收斂速度,訓練時采用了Levenberg-Marquardt數值優化算法。
2)支持向量機基本參數的確定與訓練。采用Epsilon型支持向量機回歸算法,經過多次試驗,確定拉格朗日乘子上界為5,不敏感函數取值為0.000 01,核函數采用高斯型,高斯核函數的寬度取0.15。
4 預測與分析
4.1 兩種模型預測能力對比
利用訓練完畢的兩種預測模型仿真預測1992-2009年的河南省農田有效灌溉面積并進行反歸一化處理。反歸一化后的各預測值、預測誤差的絕對值和預測相對誤差的絕對值見表1。從表1可以看出,支持向量機的各預測值與實際值更為接近,其預測誤差的絕對平均值、預測相對誤差的絕對平均值都遠小于BP神經網絡預測結果的對應參數。圖1中的各預測數據也全部經過了歸一化處理,從圖1中1992-2009部分也可以看出,支持向量機的預測值基本和實際值重合在一起,而BP神經網絡的預測值在一些地方則與實際值相差較大,說明基于支持向量機的預測模型泛化能力更強。
利用這兩種預測模型分別預測作為檢驗樣本的2010年河南省農田有效灌溉面積,反歸一化后的預測結果如表2和圖1所示。從表2和圖1可以看出,基于支持向量機的預測模型在檢驗樣本處的實際預測精度也遠高于BP神經網絡,其預測誤差僅為BP神經網絡預測誤差的11.8%。
4.2 河南省“十二五”期間農田有效灌溉面積的預測與分析
實際上,預測結果是在現有條件的基礎上從數據序列的角度進行的預測,如果在“十二五”期間,政府大幅增加水利行業的資金投入,最終的發展情況將會比該預測結果更好。
5 小結
在對農田有效灌溉面積進行預測時,數據序列預測法比結構式預測法更為簡單易行。在各種數據序列預測方法中,神經網絡預測方法和基于支持向量機的預測方法更為適合農田有效灌溉面積的非線性變化規律。
研究針對BP神經網絡和支持向量機兩種預測方法進行了對比分析。理論研究表明,基于支持向量機的預測方法可以克服BP神經網絡的諸多缺陷,具有優越性。
以河南省1986-2010年的農田有效灌溉面積統計數據為基礎,詳細闡述了利用兩種預測方法建立預測模型的過程,并進行了應用驗證。驗證結果表明,基于支持向量機的預測方法具有更好的泛化能力,預測精度更高。最后獲得了河南省“十二五”期間農田有效灌溉面積的預測數據并指出了其發展趨勢。
參考文獻:
[1] 鄭家亨.統計大辭典[M]. 北京:中國統計出版社,1995.
[2] 卞鳳蘭,黃曉明,劉 睿.城鎮化進程中公路網用地的BP神經網絡預測模型[J].東南大學學報(自然科學版),2010,40(5):1073-1076.
[3] 尹健康,陳昌華,邢小軍,等. 基于BP神經網絡的煙田土壤水分預測[J]. 電子科技大學學報,2010,39(6):891-895.
[4] 陳 明. 神經網絡模型[M]. 大連:大連理工大學出版社,1995.
[5] 柳小桐. BP神經網絡輸入層數據歸一化研究[J].機械工程與自動化,2010(3):122-123,126.
[6] 張 華,曾 杰.基于支持向量機的風速預測模型研究[J]. 太陽能學報,2010,31(7):928-932.
[7] CHEN B J,CHANG M W,LIN C J. Load forecasting using support vector machines:A study on EUNITE competition 2001[J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.
[8] VAPNIK V N. The Nature of Statistical Learning Theory[M].New York:Springer,1995.
篇4
關鍵詞: 設施蔬菜病害; 預警; LVQ神經網絡; BP神經網絡; 黑星病
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)10-0189-03
Abstract: In order to make better in early warning of facilities vegetable diseases, two kinds of algorithms of LVQ neural network and BP neural network are used to construct static early-warning models of facilities vegetable diseases. In order to test the feasibility and applicability of two models, this paper takes cucumber scab for example and makes comparation of the two models. The result shows that two kinds of models are both able to better and accurately realize the forecasting of cucumber scab. It turns out that BP neural network model, which costs less time, is more effective in practice.
Key words: facilities vegetable diseases; early warning; LVQ neural network; BP neural network; cucumber scab
預警是一個軍事術語,指用來對付突然襲擊的防范措施,是組織的一種信息反饋機制,后來逐步引申到現代政治、經濟、技術、醫療、災變、生態、治安等自然和社會領域[1]。當下,預警在重大氣象災害方面起到重要作用。而創新地把預警應用于設施蔬菜病害方面,利用數據挖掘方法,探尋設施環境條件與病害的關聯關系,把以診治為主的設施蔬菜病害防控模式轉變為以預防為主,降低了病害防控成本,減少了農藥污染,大幅度地提高蔬菜產量和質量,在農業科技和食品安全方面發揮重要作用[2]。文中以棚室黃瓜為例,構建黃瓜病害靜態預警模型。通過實時地對溫度,濕度,土壤酸堿度等自然條件的測量,對病蟲害的發生進行預測,再根據預測結果調整當前環境,從而達到黃瓜病害預警的目的。運用LVQ神經網絡、BP神經網絡兩種算法建立黃瓜黑星病靜態預警模型并比較兩種模型的優劣。結果表明,在以黃瓜黑星病為例的蔬菜病害靜態預警實驗中,運用BP神經網絡算法所構建的模型優于LVQ神經網絡,在實際的蔬菜病害靜態預警的應用中更有參考價值。
1 模型的構建及分析
以黃瓜黑星病為例,分別使用LVQ神經網絡、BP神經網絡兩種算法構建黃瓜黑星病靜態預警模型,并從時間、空間復雜度和模型預測的確診率三個方面對兩種模型的適用性和可行性進行比較分析。
1.1 樣本指標的選取與數據收集
構建基于LVQ神經網絡和BP神經網絡算法的黃瓜黑星病靜態預警模型,其基礎的工作是進行黃瓜黑星病樣本指標的選取和對所選取的樣本指標進行數據收集。這兩項工作為模型的構建提供數據支持。
1.1.1 樣本指標的選取
黃瓜是一種常見的蔬菜,甘甜爽口,清淡香脆,是城鎮居民常備的家常菜之一。黃瓜在生長過程中容易發生各種病害而導致減產,如霜霉病、白粉病、黑星病等等。因此,在黃瓜的生長過程中,可通過對當前溫度,光照,土壤ph值等環境條件的測量,預測黃瓜得病的可能性而調整當前環境。文中以黃瓜黑星病為例測試模型的性能。此病的病因為瓜瘡痂枝孢菌,病菌以菌絲體附著在病株殘體上,在田間、土壤、棚架中越冬,成為翌年侵染源,也可以分生孢子附在種子表面或以菌絲體潛伏在種皮內越冬,成為近距離傳播的主要來源。病菌在棚室內的潛育期一般3~10天。整個生育期均可侵染發病,幼瓜和成瓜均可發病。幼瓜受害,病斑處組織生長受抑制,引起瓜條彎曲、畸形。該病菌在低溫高濕等一系列復合條件下容易發生和流行。一般在2月中下旬就開始發病,到5月份以后氣溫高時病害依然發生[3-4]。文中選用容易感染此種病害的品種津研四號進行試驗[5-6]。經查閱資料可知:黃瓜黑星病發病的因素有土壤ph值,空氣相對濕度,溫度,光照,黃瓜栽培品種等等。其中土壤ph值,空氣相對濕度,溫度這三個因素在黃瓜發病過程中起主要作用。致使黃瓜黑星病發病的各因素范圍如下:ph值:2.5-7 ; 空氣相對濕度:>=90;溫度:15℃-25℃。
1.1.2 數據收集
黃瓜黑星病的發病是一個過程,是多個發病因素相互交叉、共同作用的產物。根據黃瓜病害書籍資料,搜集所需的數據。共330組數據,290組數據作為訓練集,40組數據作為測試集。290組訓練集作為樣本數,每個樣本數中有三個輸入特征數據,即土壤ph,空氣相對濕度,溫度等三類,所有樣本數共分為2個類別,即正常與異常。分別用LVQ神經網絡、BP神經網絡兩種算法測試模型的可行性并對其進行比較分析,為預測模型的選擇提供參考。
1.2 LVQ神經網絡預警模型
構建基于LVQ神經網絡的黃瓜黑星病靜態預警模型,測試模型的可行性,并對模型進行優化,進而比較優化前、后的黃瓜黑星病預警模型,分析模型的適用性。
1.2.1 LVQ神經網絡思想
LVQ神經網絡[7-8](Learning Vector Quantization)是在有“導師”狀態下對競爭層進行訓練的一種學習算法,屬于前向有監督神經網絡類型,在模式識別和優化領域有著廣泛的應用。LVQ神經網絡由三層組成,即輸入層、隱含層和輸出層,網絡在輸入層與隱含層間為完全連接,而在隱含層與輸出層間為部分連接,每個輸出層神經元與隱含層神經元的不同組相連接。隱含層和輸出層神經元之間的連接權值固定為1。在網絡訓練過程中,這些權值被修改。隱含層神經元和輸出神經元都具有二進制輸出值。當某個輸入模式被送至網絡時,參考矢量最接近輸入模式的隱含神經元因獲得激發而贏得競爭,因而允許它產生一個“1”,而其他隱含層神經元都被迫產生“0”。與包含獲勝神經元的隱含層神經元組相連接的輸出神經元也發出“1”,而其他輸出神經元均發出“0” 。網絡結構如圖1:
1.2.2 網絡創建及測試
在Matlab R2012b的平臺上進行預測。建立一個3層的向量量化神經網絡函數,隱含層神經元首次嘗試設置為15個,學習速率設置為默認值0.01,權值學習函數也設置為默認函數:net=newlvq(minmax(P_train),15,[rate_B rate_M],0.01,‘learnlv1’)。
利用LVQ神經網絡算法開始模型訓練,訓練結束后將會生成相應的神經網絡,再通過相關驗證數據的輸入將計算出的預測值與期望輸出進行比較分析,得出相關的結論。40組數據作為測試集進行10次預測,測試結果如表1:
經計算,當隱含層神經元為15個時,正常、異常黃瓜的平均確診率分別為91.508%、91.05%,平均確診率高達90%,此設定準確率較高。經過多次運行,運行時間數量級皆為1級。表明LVQ神經網絡用于模式識別是有效的,在黃瓜黑星病的預警中具有很大的參考價值和指導意義。
1.2.3 隱含層神經元個數優化
在LVQ神經網絡算法基礎上,為了得到可靠穩定的模型,提高正確率,可使用帶有交叉驗證功能的LVQ神經網絡程序進行預測。此功能可確定最佳的隱含層神經元個數。常見的交叉驗證形式之一為K-fold cross-validation。K次交叉驗證,初始采樣分割成K個子樣本,一個單獨的子樣本被保留作為驗證模型的數據,其他K-1個樣本用來訓練。交叉驗證重復K次,每個子樣本驗證一次,平均K次的結果或者使用其他結合方式,最終得到一個單一估測。這個方法的優勢在于,同時重復運用隨機產生的子樣本進行訓練和驗證,每次的結果驗證一次。在此采用常用的5折交叉驗證法進行訓練。
每一次網絡的訓練都會產生不同的最佳隱含層神經元個數,這是由于每次訓練集和測試集是由計算機隨機產生,且每次訓練過程都不相同造成的。經過多次實驗,發現隱含層神經元個數在11~20范圍內較為適宜。運行一次帶有交叉驗證功能的LVQ算法程序需要的時間數量級是3級。運行時間較長,但在確診率上沒有明顯的改善。因此,帶有交叉驗證功能的LVQ神經網絡模型在確定無交叉驗證功能的LVQ神經網絡模型隱含層神經元個數范圍方面起重要的借鑒作用,但由于其所需預測時間較長,不適用于實際預測的應用。
1.3 BP神經網絡預警模型
構建基于BP神經網絡的黃瓜黑星病靜態預警模型,調整網絡參數進行仿真訓練,并分析模型的適用性。
1.3.1 BP神經網絡思想
BP神經網絡[8-10] (Back Propagation)是一種采用誤差反向傳播算法的多層前向神經網絡,其主要特點是信息正向傳播,誤差反向傳播。在傳遞過程中,輸入信號經過輸入層、隱含層的逐層處理,直至輸出層,若在輸出層得不到期望值,則反向傳播,根據預測誤差調整權值和閾值,使BP神經網絡的輸出不斷逼近預測輸出值。網絡結構如圖2:
1.3.2 網絡創建及測試
同樣在matlab R2012b的平臺上進行預測。在該三層網絡中,第一層傳遞函數默認為‘tansig’, 第二層傳遞函數設置為‘purelin’,訓練函數設置為‘trainlm',隱含層神經元個數設置為10個,輸出層神經元為1個。創建該網絡,進行訓練,仿真并測試返回結果。相關程序為:
net=newff(minmax(P_train),[10 1],{‘tansig’,‘purelin’},‘trainlm’)
net.trainParam.epochs=1000;
net.trainParam.show=10;
net.trainParam.lr=0.1;
net.trainParam.goal=0.1;
net=train(net,P_train,Tc_train);
T_sim=sim(net,P_test);
for i=1:length(T_sim)
if T_sim(i)
T_sim(i)=1;
else
T_sim(i)=2;
end
end
對于多層前饋網絡來說,隱層節點數的確定是成敗的關鍵。若數量太少,則網絡所能獲取的用以解決問題的信息太少;若數量太多,不僅增加訓練時間,更重要的是隱層節點過多還可能出現所謂“過渡吻合”問題,即測試誤差增大導致泛化能力下降,因此合理選擇隱層節點數非常重要。關于隱層數及其節點數的選擇比較復雜,一般原則是:在能正確反映輸入輸出關系的基礎上,應選用較少的隱層節點數,以使網絡結構盡量簡單。隱含層神經元個數選擇是一個較為復雜的問題,往往需要設計者多次試驗來決定,因而不存在一個理想的解析式來表示。確定隱含層神經元個數方法可參考公式[n2=log2n1]和[n2=2×n1+1](是輸入層神經元數,是隱含層神經元數)[11]。對黃瓜黑星病預測實驗而言,=3,則網絡訓練需要從隱含層神經元個數為=1訓練到個數為=7。理論上最佳隱含層神經元個數在1~7個左右,但仍需要多次測試來確定。適當增加隱含層神經元個數可以減少訓練誤差。經驗證,當隱含層神經元個數設為7時,進行10次預測,模型測試確診率較高。如此既保證正確率,又能較節省時間。預測結果如表2:
如表2,經計算,在10次預測中,正常黃瓜平均確診率為91.511%,異常黃瓜平均確診率為94.542%。運行時間數量級為0級,速度更快。經多次運行、測試總結可得,BP神經網絡模型在準確率上不次于LVQ神經網絡模型,在時間上也遠快于LVQ神經網絡模型。由此看出,BP神經網絡算法在黃瓜黑星病的預測過程中,效果更好,參考價值更高。
1.4 兩種模型比較分析
算法,是預測黃瓜黑星病的核心。在評價哪種算法更適用于黑星病的預警時,應兼顧時間、空復雜度和確診率。這兩種模型空間復雜度基本相同。相比空間需求,實際操作中,我們更關注程序運行的時間和確診率。兩種神經網絡算法在訓練預測過程中各有利弊,但預測結果的準確性都高達90%左右。因此,時間開銷便成了兩種模型適用性的最重要因素。分別運行兩種模型20次,得到程序運行的時間開銷折線圖如圖3。由圖3可知,運用BP神經網絡可快速得到預測結果,在實際運用過程中實時性更突出。
2 總結
本文研究發現兩種模型均可用于黃瓜黑星病的預警,模型預測的準確率相差無幾高達90%左右。這進一步表明了數據的準確性、指標建立的合理性和模型建立的可行性。也證明把預警應用于設施蔬菜病害方面,利用數據挖掘方法,探尋設施環境條件與病害的關聯關系這一構想的合理性和可操作性。
若結合結果的準確率和時間開銷,BP神經網絡模型在實際的黃瓜黑星病及其他病害的預測過程中比LVQ神經網絡模型更勝一籌,具有更高的時效性。
參考文獻:
[1] 霍松濤.旅游目的地旅游預警系統研究[D].開封:河南大學,2006.
[2] 邵峰晶,于忠清.數據挖掘原理與算法[M].北京:電子工業出版社,2003.
[3] 王生榮,楊升炯.黃瓜黑星病菌生物學特性及流行規律研究[J].甘肅科學學報,1999,11(3):83-86.
[4] 易齊,王蔚,王傳英,等.黃瓜黑星病及其蔓延為害現狀[J].植物保護,1987,13(6):40-41.
[5] 許勇,朱其杰.黃瓜黑星病抗病性離體子葉接種鑒定方法[J].北京農業大學學報,1994(1):31-34.
[6] 朱建蘭,陳秀蓉.黃瓜品種對黑星病的抗性鑒定結果[J].甘肅農業科技,1998(7):32-33.
[7] 段明秀,何迎生.基于LVQ神經網絡的手寫字母識別[J].吉首大學學報,2010,31(2):41-43.
[8] 史忠植.神經網絡[M].北京: 高等教育出版社,2009.
[9] 王文劍.BP神經網絡模型的優化[J].計算機工程與設計,2000,21(6):8-10.
篇5
關鍵詞:人工神經 網絡之下 建筑施工 安全評價
前言
建筑施工,在整個城市發展過程當中占據著非常重要的地位的,并且也是推動一個國家城市化的重要基礎,但與此同時,建筑施工領域本身也是具有較強的危險性,并且,自身還具有生產流動性大以及產品形式光,施工技術比較復雜等等特點,所以,定期定時的對建筑施工采取合理有效的安全評價,不光是能夠在很大程度上提升了建筑施工作業的全面管理水平,還是能夠為整個建筑施工的安全性,打下結實的基礎保障。
一、訓練人工神經網絡
訓練人工神經網絡,其實主要是就通過使用BP算法的神經網絡,也是當前被我國各個領域所廣泛使用到的一種神經網絡,主要是由眾多的神經元所組合而成的,包括了輸入、隱含、輸出等層,其在實際工作運行的過程當中,主要是分成以下步驟:1.學習期。對于此狀態下的各個計算單元自身的狀態值是不發生任何改變的,但是,在對其網絡的連接權進行修改的過程當中,也使得系統的輸入、輸出之間的呈現出一種映射的關系,也即為函數關系,其主要的目的也是為了能夠在最大限度上保證,整個系統實際的輸出則是為期望輸出。2.工作期,此時各個連接權是被固定的,然后計算單元狀態變化以求達到穩定[1]。
在整個模型的輸入層單元數即是對安全評價指標數目,則是根據前面分析的建筑施工現場自身的安全評級指標,在其的輸入層當中的節點數則是設定在了20,那么對于中間層則是要確認為隱含層,其層數與之所相對應的節點數的選取則是為一個非常具有復雜性的問題,這里主要是因為,在采用不同的內部表象的過程當中,其所需要的內部單元數上,是完全不相同的,所以,這也就意味著,綜合評價結果對應的是很安全、較安全、合格、較危險、危險等幾種不同的程度的,這里對于輸出層的節點數則設定在5,那么其標準的輸出模式則是分別在了(1,0,0,0,0)、(0,1,0,0,0)、(0,0,1,0,0)、(0,0,0,1,0)、(0,0,0,0,1)[2]。
二、實力分析
依照于我國某個建筑施工的安全評價指標體系,所選取出二級指標的16個指標,作為整建筑施工事故可能會發生的一些潛在患,然后在對其進行全面綜合的分析,以此來有效的判斷出,整個建筑施工自身的安全狀況[3]。
(一)樣本數據的離散化和約簡
本文主要重點闡述在使用運用BP進行樣本數據的約簡,從而通過使用Boolean Reasoning Algorithm的方式,來對整個樣本的數據進行離散化,然后在合理的通過使用Genetic algorithm的方式來對整個樣本數據,進行屬性上的約間,從而使得約簡出來的總共多達1700度條規則,然后在以此依照于BP人工神經自身的約減規則,從而有效的選擇出了關于LHA自身的覆蓋率以及RHS自身的覆蓋率等指標,然后在對整個數據集,合理的進行規則上的提取,從而有效的到了30條規則。在通過對于提取規則進行進一步的研究分析,在優先參考我國相關建筑施工人員自身的意見,從而才能夠最終的確定好幾項指標,是在整個建筑施工安全當中的關鍵核心要素,即U12U24U32U42U43.在針對于約簡前的評價指標當中,主要是存在大約16個左右,在對于訓練樣本上則是分成了14組,在通過對樣本數據離散化以及屬性的約簡以后,就能夠將原本眾多的評價指標,逐漸的變為5個,這樣也是在最大限度上降低了整個輸入空間,也是便于之后簡化神經網絡結構的展開以及運行,以此提升訓練的效率強度[4]。
(二)約簡后的樣本數據進行預測概述
在這里主要是按照已經被約簡之后所得到的屬性集,剩下的U12U24U32U42U43這五列數據,便能夠很好得的得出了約簡以后的神經網絡訓練的樣本。對于這五列數據,均采用三層的BP神經網絡結構,在輸入層為5個神經元上,在合理的采用以上幾種方式,估計出其中所隱含的層節點數為3.以此,有效的計算出其中所隱含的層節點數的設置,在將這些數值求出總體的平均值。
三、結果
在合理的通過對于建筑施工安全相關的指標體系的研究,并且,主要依照于建筑施工自身的實際,在合理的通過使用安全系統的整體工程原理,在立足于人、機器、環境、管理等幾方面上,對其更進一步的研究,從而有效的確定出了建筑施工安全的16個評價指標。在基于人工神經網絡之下的建筑施工安全評價模型,也主要是將粗糙集作為整個神經網絡自身的前段處理器,主要將其應用在了有效縮減整個神經網絡學習過程當中的一些學習樣本,這樣做也是為了能夠在最限度上滿足于簡化神經網絡結構所對其提出的各種要求,不僅如此,還合理的利用BP神經網絡,并且,自身也是具有較強的預測精準度的。在利用人工神經網絡下的建筑施工安全評價模型當中,也是對我國各個實際建筑施工工程自身的安全狀況,進行了及時有效的安全評價,其所顯示出來的結果也是完全與建筑施工工程自身的實際情況所想符合[5]。
四、結論
只有真正的增強人工神經網絡下的建筑施工安全評價的重視度,才能夠在最大限度上提升我國建筑施工的安全以及穩定性。
參考文獻:
[1]袁寧,楊立兵.基于粗糙集-人工神經網絡的建筑施工安全評價及應用[J].安全與環境工程,2012,01:60-64.
[2]張文博,宋德朝,鄭永前.基于人工神經網絡的建筑施工安全評價[J].工業工程,2011,02:
75-79.
[3]宋飛,許程潔,吳紅霞. 基于改進BP神經網絡的建筑施工安全評價[J].工程管理學報,2011,
06:629-632.
[4]徐平. 基于BP神經網絡的建筑施工現場安全評價研究[J].江蘇建筑,2013,02:63-64+69.
篇6
關鍵詞:中小企業 營銷風險 神經網絡
中圖分類號:F273 文獻標識碼:A
文章編號:1004-4914(2011)11-270-02
隨著中小企業內、外部環境的復雜化,中小企業面臨的營銷風險不斷上升,這不僅影響著中小企業的正常經營,而且嚴重制約著中小企業的發展。然而,由于中小企業面臨的營銷風險受到很多因素的影響,因而要加強對中小企業營銷風險的管理,使企業有效地衡量其面臨的營銷風險水平,就必須對其進行科學而準確的評價與定量分析。
目前,我國對于營銷風險管理的研究還處于起步階段。國內一些學者對營銷風險的定量評價進行了相關研究,其中應用較為廣泛的包括層次分析法、模糊綜合評價法、BP算法等。但這些評價方法均存在一定不足,主要表現為:一是在評價中的隨機因素影響較多,評價結果易受評價者主觀意識的影響及其和經驗、知識的局限,易帶有個人偏見和片面性,主觀性較強;二是神經網絡(ANN)采用BP算法對網絡進行訓練時,學習過程收斂速度慢,容易陷入局部極小點,特別是當學習效率設置高時,可能產生震蕩;三是BP算法的健壯性不好,網絡性能對網絡的初始設置比較敏感。為此,筆者根據Elman神經網絡的特點,利用其非線性與泛化的能力,建立了一個基于Elman神經網絡的中小企業營銷風險識別及評估模型并進行了實證研究。
一、Elman神經網絡理論基礎
Elman神經網絡是一種典型的動態回歸神經網絡,一般分為4層,即輸入層、隱層、承接層和輸出層。其輸入層、隱層、輸出層的連接類似于前饋網絡,輸入層的單元僅起著信號傳輸的作用,輸出層單元起線性加權作用。隱層單元的傳遞既可采用線性函數也可采用非線性函數,承接層用來記憶隱層單元前一時刻的輸出值。神經網絡的非線性狀態空間表達式為:
Y(k)=G(w3X(k))
X(k)=F(w1Xc(k)+w2(U(k-1))(1)
Xc(k)=X(k-1)
式中:Y,X,U,Xc分別表示m維輸出結點向量;n維中間層結點單元向量;r維輸入向量和n維反饋狀態向量;w3,w2,w1分別表示中間層到輸出層、輸入層到中間層、承接層到中間層的連接權值;G(?)為輸出神經元的傳遞函數,是中間層輸出的線性組合;F(?)為中間層神經元的傳遞函數,采用邏輯斯蒂函數。
二、基于Elman神經網絡的中小企業營銷風險識別模型的分析及建立
(一)神經網絡模型的構建
本文建立的神經網絡營銷風險評估模型的任務是完成營銷風險評估指標和營銷風險等級之間的映射。建立合理的營銷風險評估模型,一方面需要解決營銷風險評估指標的權值問題,另一方面需要探索營銷風險評估指標和營銷風險等級之間的映射規則。
神經網絡的結構是通過神經元的特性以及網絡中神經元連接的特性來定義的。對于營銷風險評估模型可以用Elman神經網絡模型的輸入和輸出節點數以及隱含層數量和各隱含層節點數來表示。在評估模型的網絡結構中,輸入節點的數量可以比較直觀地得到,它就是營銷風險評估指標的數量。評估模型的輸出節點數可以是一個,也可以是多個,對于分類模型,輸出節點數量和分類的類別數量有關,假定營銷風險等級分為m個級別,則評估模型的輸出節點數量可以為m或log2m。在很多情況下,為了簡化網絡結構,提高模型的訓練效率,可以將一個具有多個輸出的網絡模型轉化為多個具有一個輸出的網絡模型。按照這個原則,本文對評估模型的輸出進行簡化,首先,將營銷風險等級分為5個級別,即1級風險為優良狀態(無險)、2級風險為正常狀態(輕險)、3級風險為中度風險狀態(中險)、4級風險為高度風險狀態(重險)、5級風險為危急風險狀態(巨險);其次,參照營銷風險評分的方法,將評估模型的輸出轉換為一個連續型的變量,變量的不同取值范圍對應不同的風險等級。
隱含層節點數的確定一般遵循以下經驗法則:較好的隱含層節點數介于輸入節點和輸出節點數量之和的50%至70%之間;隱含層節點數m必須小于N>1(其中N為訓練樣本數)。為了得到評估模型的合理的隱含層節點數,本文將根據以上經驗法則,確定隱含層節點數的一般范圍,然后在該范圍內,采用擴張法,通過反復的實驗確定合理的隱含層節點數。
(二)模型求解速度和誤差界值分析
對于Elman神經網絡模型,模型的求解速度等價于BP學習算法的收斂速度,一般用達到指定誤差精度時的學習次數表示,它受多種因素影響,包括模型本身的結構、樣本數據的數量和數據特點、模型的初始權值以及模型的學習參數等。
對Elman神經網絡算法訓練速度的影響參數有學習率η、動量因子α和收斂誤差界值E(w)等,對于學習率必須小于某一上限,取0
在評估模型訓練之前,應根據實際情況預先確定誤差界值E(w),誤差界值E的選擇完全根據評估模型的收斂速度大小和具體樣本的學習精度來確定。E值的選擇必須在分類精度和訓練效率之間權衡,當E值選擇較小時,評估模型分類精度高,但收斂速度慢,訓練次數增加;如果E值選擇較大則相反。本文在綜合考慮評估模型的收斂速度和分類精度的前提下,采用變學習率和加動量項相結合的方法以改進評估模型的訓練效率,學習率η取0.8,動量因子α取值0.9,誤差精度E(w)設為0.001。
三、模型的實證分析
(一)指標和樣本數據選取
根據營銷環境引起的中小企業營銷風險的實際,中小企業營銷風險評估指標主要包括營銷人員風險、市場競爭風險、顧客風險、產品銷售風險、供應商風險、營銷組織管理風險6個方面。由于我國中小企業的營銷系統還沒有實現信息化,對營銷風險相關數據的統計工作沒有很好的開展;直接針對營銷風險工作的統計數據還非常少,無法直接加以利用。因此,本文采取參考已完成的同類研究的相關數據作為模型的樣本數據。
(二)實證分析
確定中小企業營銷風險評估模型結構為43×m×1,訓練樣本數量為50。根據隱含層節點數介于輸入節點和輸出節點數量之和50%~70%之間的規則,隱含層節點數m的取值范圍大約為22
本文采用Matlab工具完成營銷風險評估神經網絡模型的研究和驗證工作。從神經網絡模型輸出結果可以看出,對于全部50個訓練樣本,其分級準確率為89.1%。因此,該模型可以滿足中小企業評估營銷風險的要求,并且具有很高的精度和很快的收斂速度。
四、結論
通過分析得出以下結論:
1.通過建立基于Elman神經網絡的中小企業營銷風險評估模型來對中小企業進行營銷風險分析是切實可行的,而且其判別準確率比較高。
2.Elman神經網絡的非線性與泛化的能力能夠適于中小企業營銷風險分析過程中的復雜性和實際情況下的高度非線性,對中小企業面臨的不同營銷風險能夠較準確地識別和評估。
參考文獻:
1.張云起,趙國杰,梁文東.基于優化BP神經網絡的營銷風險衡量與控制[J].西北農林科技大學學報(社會科學版),2006(2)
2.李軼敏.工業企業營銷風險預警指標體系及綜合評價方法[J].時代經貿,2007(58)
3.張蘭霞,周蓉姿,王俊.基于BP網絡企業營銷風險預警模型[J].企業管理,2004(7)
4.謝慶國,沈軼.Elman人工神經網絡的收斂性分析[J].計算機工程與應用,2002(6)
篇7
歐陽亮(1984―),女,湖南大學工商管理學院(長沙,410082)。研 究方向:金融工程與風險管理。
[關鍵詞]匯率預測;匯率波動;神經網絡
匯率作為一個重要的經濟變量,其變動對國民收入的增減、工農業的發展、國內利率、就業 等各方面都有著重要的影響。因此,匯率預測受到廣泛的關注,大量的計量經濟模型和時間 序列模型被用于匯率預測。其中,人工神經網絡(Artificial Neural Networks, ANN)作為 一種非參數的數據驅動型的方法,不需要對數據特征進行事先假設,通過合理的樣本訓練, 學習專家的經驗、模擬專家的行為,并引入非線性轉換函數來求解各種復雜的非線性問題, 具有很強的模式識別能力和高速信息處理能力,從而在時間序列數據預測方面有獨特的優 勢。[1]
利用神經網絡方法預測匯率波動,國內外學者已經進行了比較廣泛的研究。總結國內外學者 的研究成果,用神經網絡預測匯率有3個層次。它們分別是同質神經網絡模型、 異質神經網絡模型和神經網絡組合模型。
一、匯率預測的同質神經網絡模型
同質神經網絡預測模型是用神經網絡根據歷史匯率數據來預測未來匯率,這是作為一種匯 率預測的非參數方法提出來的。由于匯率波動具有非線性相關性和 長效記憶性,因此通過歷史數據進行匯率預測是一種可行的方法。同質神經網絡預測模型認 為;匯率有一個隱含的生成機制,歷史匯率和未來的匯率都由這個機制生成,通過對歷史數 據的觀測,識別這個生成機 制,就可用這個生成機制預測未來的匯率。由于神經網絡是一個數據驅動的自適應的非參數 方法,不基于假設,即使產生數據的過程是未知的,或者很復雜,神經網絡也能識別。
用同質神經網絡進行匯率預測,是根據匯率的歷史數據加上輸入延遲來預測匯率的變化或變 化趨勢。用于匯率預測的神經網絡模型很多,其中最常用的是多層后向神經網絡模型,即BP 神經網絡。BP神經網絡一般采用三層結構:輸入層、隱含層、輸出層。BP神經網絡的算法 和訓練如圖1。
以t時刻匯率種類R的預測為例,滯后期為n,預測長度為L。輸入層的數據是從時刻t開始前n 期的歷史匯率觀測值序列,yt,…, yt-n,輸入才由長度n的滑動窗口產生。輸出層 依次輸出從t時刻開始的L個匯率預測值,yt+1,…, yt+L。相鄰匯率的時間間 隔是等長的。匯率預測的同質神經網絡模型的結構如上圖2。
用同質神經網絡預測匯率的研究很多,1993年,Refenes等人采用神經網絡方法預測匯率變 動,他們將數據分成訓練組(Training Subsample)、測試組(Testing Subsample)和預測組( Forecasting Subsample),先用訓練組和測試組數據訓練神經網絡,然后用預測組數據進行 預測,這種嘗試以及隨后的評議肯定了神經網絡在一定的情況下比“標準”的預測方法表現 要好。[2]Kuan和Liu(1995)用神經網絡對5個不同幣種兌美元的匯率進行預測。這5 種貨幣包括英鎊、加拿大元、德國馬克、日元以及瑞士法郎。研究發現神經網絡對日元和英 鎊的預測的均方差(MSE)很低,但對其余3個幣種的預測效果一般。[3]De Matos(19 94)通過對日元期貨預測比較了多層后向神經網絡(MLFN)和重復網絡的預測效果。[4]Zhang和Hu(1998)用多層后向神經網絡對英鎊和美元的匯率進行預測,發現神經網絡的預 測效果明顯優于線性模型,尤其在預測期比較短的時候。[5]
雖然研究表明神經網絡的預測效果比其他方法好,但是其預測精度和可靠性仍然不盡人意。 對此,學者們對神經網絡進行了改進,提出了諸如聚類神經網絡、重復神經網絡、廣義回歸 神經網絡、模糊神經網絡等經改進的神經網絡進行匯率預測,或者將其他方法與神經網絡結 合,以改善神經網絡的預測能力。例如,Shazly等(1999)用遺傳算法訓練神經網絡的權值。 惠曉 峰和胡運權等(2002)結合遺傳算法,提出了基于實數編碼的GA-BP神經網絡匯率預測人民幣 兌美元匯率的模型。姚洪興, 盛昭瀚和陳洪香(2002)提出了一種改進的小波神經網絡結構。
這些研究在一定程度上提高了神經網絡的預測效果,但是神經網絡的結構、訓練算法、閥值 函數的選擇以及滯后期的確定等問題仍然難以解決。而且,匯率由歷史匯率唯一決定這一 前提也缺乏足夠的理論支持。
二、匯率預測的異質神經網絡模型
用異質神經網絡模型進行匯率預測,是指在預測過程中,考慮影響匯率的各種因素,如利率 、通貨膨脹率、原油價格、貨幣供應、貿易收支差額、消費價格指數、消費信心指數等,根 據這些影響因素來預測匯率。Shazly(1997)選取一個月歐洲美元存款利率、一個月歐洲外幣 存款利率、即期匯率 和一個月的遠期匯率作為輸入變量,預測一個月后的即期匯率。結果表明,神經網絡的預測 效果比通過遠期匯率進行的預測效果要好。[6]楊火斤 和馬洪波(1999)選取GNP、CPI、工業股 票價格指數、短期利率、貨幣供應量、長期利率6個影響因素,將這些變量作為神經網絡的 輸入變量,訓練神經網絡根據這些變量預測匯率。[7]Hui Xiao-feng等(2005)也用 模糊神經網 絡進行匯率預測,輸入的變量包括兩國的CPI和GDP、兩國的利率差、貨幣供應比、凈出口額 等。[8]
異質神經網絡模型的網絡結構和訓練算法與同質神經網絡相似。區別在于同質神經網絡的輸 入是一段時滯的歷史匯率數據,是一維的數據,而異質神經網絡的輸入數據是多個變量的數 據,是二維的數據。令x1, x2,…, xn分別表示影響匯率變動的各個因素,異質神經 網絡的結構如圖3所示。
圖3 異質神經網絡模型
隨著布雷頓森林體系的崩潰,各國紛紛采用浮動匯率制度,影響匯率變動的因素更加多樣化 、復雜化,難以確定。因此,學者們開始用神經網絡與其他預測方法結合使用。一種是與基 本因素分析模型如購買力平價模型、利率平價模型等相結合。根據這些模型確定的影響因素 作為神經網絡的輸入變量,通過神經網絡訓練優化變量的權值,從而進行匯率預測。例如, Qi和Wu(2003)用基于貨幣理論的神經網絡對英鎊和馬克1個月、6個月、12個月的匯率進行預 測,輸入變量為貨幣供應量M1,各個國家的實際工業生產收入、利率作為輸入變量。Lee和W ong(2007)用微觀結構理論和宏觀經濟的6個變量作為神經網絡的輸入,預測匯率波動。
另一種方法是用神經網絡與協整方法結合。先通過協整分析確定影響匯率變動的因素,再用 神經網絡確定各變量的權值。Inc和Trafalis(2006)構建了一個結合協整方法和人工神經網 絡的匯率預測模型方法,先用協整方法確定對匯率有影響作用的變量,然后用ANN對這些變 量進行非線性組合,預測匯率。[9]
異質神經網絡模型將匯率視為整體經濟系統中的一個變量,匯率波動受眾多因素的影響,因 此匯率的波動是根據這些影響因素的波動來預測的,與同質神經網絡模型相比有更強的理論 支持。但是,它的預測效果取決于影響因素的選擇,因此匯率的影響因素的選擇是異質神經 網絡預測模型的關鍵。
三、匯率預測的神經網絡組合模型
神經網絡進行匯率非線性組合預測是一個兩步組合預測模型。Bates和Granger(1969)證明了 預測方法的線性組合比單模型能產生更小的誤差。[10]此后,一些學者在這方面做 了很多研 究。在眾多的組合方法中,神經網絡非線性組合是最廣泛使用的方法。Hu和Tsoukalas(1999 )用不同的GARCH模型預測條件波動,并對這些預測值分別進行線形和非線性組合,結果表明 用神經網絡進行非線性組合的預測效果是最好的。[11]Tseng等(2002)用BP神經網 絡和時間 序列模型――SARIMA模型進行組合,用SARMIA(Seasonal Autoregression Moving Integrat e Average)對匯率進行線性預測,再用神經網絡處理SARMIA模型預測的殘差,進行匯率預測 。[12]用同樣的方法還有Zhang(2003)用ARIMA和ANN組和對英鎊和美元匯率進行預 測。[13]Yu, Wang和Lai(2005)組合廣義線性自回歸模型(GLAR)和神經網絡進行 匯率預測。[14]
用神經網絡對匯率進行非線性組合預測時,是將匯率數據分解成線性部分和非線性部分。先 用基本因素模型或者參數模型對匯率進行第一步預測;然后用神經網絡對第一步預測殘差進 行非線性組合;再根據兩步的預測結果進行匯率預測。或者用神經網絡對不同的參數模型的 預測結果進行非線性組合。下面以神經網絡和ARIMA模型的非線性組合為例,說明神經網絡 組合模型的基本原理。
(3)用神經網絡mode殘差:[AKn^]t=f(et-1,et-2,…,et-n)[JY](4)
其中,f表示神經網絡的預測的非線性函數,et是隨機誤差。
(4)組合ARIMA和神經網絡:[AKy^]=[AKl^]+[AKn^]t[JY](5)
神經網絡組合模型使用神經網絡和線性方法進行非線性組合,考慮了匯率作為一個復雜系統 同時具有線性和非線性特征的實際,充分利用了參數方法和非參數方法的優勢,并綜合了各 種匯率理論的分析結果。大量的實際研究表明,組合預測的效果比單獨用線性模型或單獨用 神經網絡預測的效果要好。
四、比較與結論
同質神經網絡預測模型是根據歷史數據進行匯率預測,是用一維的數據訓練神經網絡。它沒 有 考慮匯率作為經濟系統中的一個變量,受到眾多因素的影響,而僅僅把匯率視為一系列沒有 經濟含義的無規則數據。而異質神經網絡模型則把匯率視為復雜經濟系統中的一個變量,認 為在統計上無規則的匯率數據是由眾多因素共同決定的。異質神經網絡模型用二維數據進行 訓練,與同質神經網絡模型相比,其預測有更充分的理論支持。但是,影響匯率的因素至今 沒有定論也沒有統一的選取法則。
同質神經網絡預測模型和異質神經網絡預測模型都將匯率視為單純的非線性變化的時間序列 ,而實際匯率的波動不是單純的線性或非線性的,而是同時包含線性和非線性模式,因此單 純的線性模型和非線性模型都不能很好地預測匯率。而神經網絡組合預測模型則與前兩種方 法有本質的不同,它同時考慮了匯率的線性和非線性特征,在線性預測的基礎上再進行非線 性組合,充分利用參數方法和非參數方法的優勢。一方面,研究表明線性預測有很多效果很 好 的方法,如ARIMA,GARCH等參數模型;另一方面,這些模型都基于很強的假設條件,不同的 條 件下預測效果有很大差別。因此,在實際預測時候,很難確定某個模型比其他模型有更好的 樣本外預測效果。最優模型的選擇是件很困難的事情。用神經網絡組合模型,避免了 最優模型選擇的問題,又綜合了不同的匯率理論的分析結果。
另外,同質神經網絡預測模型和異質神經網絡預測模型都是單模型的一步預測的方法,研究 表明單一的模型往往只能適應某一特定的情況或者反映一部分的信息,而實際匯率是一個復 雜的系統,組合不同的參數模型或者參數模型不同參數的預測結果,能夠較大限度地利用各 種預測樣本信息,比單個預測模型考慮的問題更系統、更全面,從而提高了預測的精度。
自2005年7月21日起,中國實行匯率改革以來,央行入市干預的力度明顯減弱。由市場供求 關系決定的人 民幣匯率受到眾多因素的影響,波動幅度較以往明顯加大。用神經網絡組合模型對人民幣匯 率進行預測,充分考慮了匯率波動的復雜性。結合線性方法和非線性方法的優勢,能抓住匯 率波動的線性和非線性特征,并能全面挖掘和反映樣本信息,有較好的樣本外預測效果。因 此,神經網絡組合模型是人民幣匯率預測的最佳選擇。
但是,用神經網絡組合模型進行匯率預測也存在一些難以解決的問題。首先是神經網絡自身 的優化問題,如隱藏層數及隱藏層結點數的確定、激活函數的確定、局部最優等,神經網絡 的結構直接影響著預測效果。其次,在神經網絡進行組合預測時,如何選擇被組合的模型以 及模型的個數,是另外一個難以解決的問題。第三,神經網絡可以根據殘差最小的原則不斷 地調整參數來改變預測效果,但是它不能改變輸入數據,而匯率數據往往是劇烈波動,存在 噪音的。因此,如何對數據進行除噪,優化神經網絡的輸入數據是另一個值得研究的問題。
主要參考文獻:
[1]Guoqiang Zhang, Eddy Patuwo, Michael Hu. Forecasting with artificialneural networks: The state of the art[J]. International Journal of Forecastin g, 1998, 14: 35-62.
[2]Refenes. Constructive learning and its application to currency excha nge rate forecasting. In: Neural networks in finance and investing: using artifi cial intelligence to improve real world performance, 1993, 465-493.
[3]CM Kuan, T Liu. Forecasting exchange rates using feedforward and rec urrent neural networks[J]. Journal of Applied Econometrics, 1995, 10(4): 347-6 4.
[4]De Matos. Neural networks for forecasting exchange rates: [disserta tion n]. Canada: The University of Manitoba, 1994.
[5]Gioqinang Zhang, Michael Y. Hu. Neural Network Forecasting of the Br itish Pound/US Dollar Exchange Rate[J]. Omega, Int. J. Mgmt Sci, 1998, 26(4):495-506.
[6]Mona R. El Shazly, Hassan E. El Shazly. Comparing the forecasting pe rformance of neural networks and forward exchange rates[J]. Journal of Multina tional Financial Management, 1997(7): 345-356.
[7]楊 火斤, 馬洪波. 人工神經網絡在中長 期匯率預側中的應用[J]. 系統工程, 1999, 17(1): 18-24.
[8]HUI Xiao-feng, LI Zhe, WEl Qing-quan. Using fuzzy neural networks fo r RMB/USD real exchange rate forecasting[J]. Journal of Harbin Institute of Te chnology (New Series), 2005, 12(2): 189-192.
[9]Huseyin Ince, Theodore B. Trafalis. A hybrid model for exchange rateprediction[J]. Decision Support Systems, 2006, 42(10): 1054-1062.
[10]Bates JM, Granger CWJ. The combination of forecasts[J]. Operation s Research Quarterly, 1969, 20: 451-68.
[11]Michael Y. Hu, Christos Tsoukalas. Combining conditional volatilityforecasts using neural networks: an application to the EMS exchange rates[J].Journal of International Financial Markets, Institutions and Money, 1999, (9):407-422.
[12]Fang-Mei Tseng, Hsiao-Cheng Yub, Gwo-Hsiung Tzeng. Combining neuralnetwork model with seasonal time series ARIMA model[J]. Technological Forecas ting & Social Change, 2002, 69: 71-87.
[13]G peter Zhang. Time series forecasting using a hybrid ARIMA and neu ral network model[J]. Neuro computing, 2003, 50: 159-175.
[14]LeanYu, Shouyang Wang, K. K. Lai. A novel nonlinear ensemble foreca sting model incorporating GLAR and ANN for foreign exchange rates[J]. Computer s & Operations Research, 2005, 32: 2523-2541.
Forecasting Exchange Rate with ANN: A Comparative Anal ysis
Xie Chi1 Ouyang Liang2 Abstract:With the popularity of floating exchange rate system,a lot of methods with parameter and non-parameter are adopted to forecast the ex change rate, and ANN is one of them. There are three types of ANN for exchange r ate forecasting, namely the homogenous ANN model, the heterogeneous ANN model an d the hybrid ANN model. This paper researches on the three models, specificallytheir characteristics and limitations, and draw the conclusion that both ANN mod el give full consideration to the linearity and nonlinearity characters of the e xchange rate. The ANN model can offer better results in a more systematic and co mprehensive way, because it adopts the thoughts integrating the analysis of diff erent exchange rate theories, and broadly utilizes the forecast samples.
Key words:Exchange Rate Forecasting; Exchange Rate Fluctuation;ANN
篇8
[關鍵詞] 工作崗位;BP神經網絡;系統設計
[中圖分類號] F240 [文獻標識碼] A [文章編號] 1006-5024(2007)12-0030-04
[基金項目]安徽省高校青年教師科研資助計劃項目“人工神經網絡在工程評價中的應用”(批準號:2004jq143);安徽理工大學 青年科學基金資助項目“基于人工神經網絡的綜合評價系統設計”(批準號:2007jg12)
[作者簡介] 汪克亮,安徽理工大學教師,碩士,研究方向為綜合評價、決策分析;
楊 力,安徽理工大學副教授,碩士,研究方向為系統工程、復雜系統建模;
查甫更,安徽理工大學教師,碩士,研究方向為環境質量評價。(安徽 淮南 232001)
人力資源是企業中最寶貴的資源,對企業的生存、發展和競爭力的不斷提高都起著至關重要的作用。人力資源的培育、開發與利用,不僅成為經濟增長的決定性因素,而且直接構成企業核心競爭力的關鍵性戰略資源。作為人力資源管理的一個重要組成部分,工作崗位評價是建立在工作說明書的基礎上,綜合運用多種學科的理論和方法。即它是按照一定的客觀標準,從工作崗位的環境、勞動強度、承擔責任、所需資格條件等因素出發,對工作崗位進行系統的衡量和評價,在定性的基礎上進行定量測評,以量值來表現工作崗位特征,使得性質相同、相近的崗位具有統一的評判、估價標準。這種評價方法可以比較出崗位與崗位之間的相對價值大小,從而可以將員工在企業中的作用和貢獻量化,為企業崗位歸級、分類等工作奠定基礎,為建立公平合理的薪酬制度提供客觀依據。
對工作崗位進行評價的方法很多,傳統的方法有排列法、分類法、評分法、因素比較法,等等。實踐證明,這些方法都具備一定的合理性,但是還不夠完善。這是由于評價指標的量值和權重的確定都是依據評估人員的經驗進行的,主觀性強,缺乏客觀性,這樣就在很大程度上使得評價結果缺乏公平性、科學性,從而進一步影響到薪酬制度的公平合理性。近年來出現的人工神經網絡(Artificial Neural Network,簡稱ANN)因其廣泛的自適應、自學習和強大的非線性映射能力,在多變量非線性系統的建模方面有著廣泛的應用。BP神經網絡(Back-Propagation Network)是目前在各領域中研究和應用最廣泛的人工神經網絡,體現了人工神經網絡理論與應用中最精華的部分,它擅長的是處理那種規律隱含在一大堆雜亂無章數據中的映射逼近問題。由于工作崗位評價系統是由評價指標、評價標準、評價技術和方法等一系列子系統組成的復雜非線性系統,作為一種處理復雜非線性系統問題的有效工具,本文嘗試利用BP神經網絡來設計工作崗位評價系統,為定性和定量評價工作崗位提供一條新的思路。
一、工作崗位評價指標體系的建立
1.選擇評價指標的原則
要對工作崗位進行公平合理的評價,前提是要建立科學的評價指標體系。因為工作崗位評價不僅要明確工作狀況和工作量的差異,而且要滿足企業人力資源管理基礎工作的需要,促進人力資源管理工作的發展。因此,必須在決定工作崗位工作狀況和工作量的眾多因素中選擇合適的因素,進行全面、科學的評價。對于評價指標的選擇,應該考慮以下三個原則:
全面性。評價指標的全面性是進行科學評價的基礎,評價指標應該能夠全面地反映工作崗位的工作狀況和工作量,體現不同崗位的工作差別,反映出崗位工作對企業的貢獻。
可評價性。評價指標的可評價性主要體現在兩個方面:一是指在目前企業的工作實際中,運用現有的技術和方法,能夠對評價指標進行測定或評定,作出評價;二是指對每一個評價指標都能夠按照統一的評價標準作出獨立的評價,最好是能作出定量評價。
實用性。主要是指在選擇評價指標的時候,選擇那些對企業的人力資源管理工作有用、能促進企業人力資源管理工作發展的因素作為評價因素。這樣可以使得評價結果能夠直接應用于企業人力資源管理實踐。
2.工作崗位評價指標體系
工作崗位評價的內容非常廣泛,影響因素眾多,我們經過深入調研,密切聯系實際,依據上述的選擇原則,共建立5個一級指標:勞動技能、勞動責任、勞動強度、勞動環境、社會心理因素。每個一級指標又由若干個二級指標組成,一共22個二級指標,這些指標既能全面體現企業崗位的工作狀況和工作量,又能應用目前的技術和知識進行評定和測量,使崗位的具體工作抽象化、定量化,從而產生可比性。建立的評價指標體系如表1所示。
二、BP算法及其改進
1.BP神經網絡
人工神經網絡是人工智能的一個重要部分,人工神經元是人工神經網絡的基本處理單元。它是一個近似模擬生物神經元的數學模型,通過與其相連的神經元接收信息。根據網絡中神經元的連接方式,神經網絡可以分為前向網絡、反饋網絡和自組織網絡三種基本類型。
BP網絡,又稱為誤差反向傳播網絡,是一種典型的前饋網絡。它具有三層或三層以上的階層,其各層之間各神經元實現完全連接,而每層的神經元之間無連接。BP網絡主要是由輸入層、隱含層、輸出層組成,各層之間實現完全連接。輸入信號從輸入層節點輸入,依次傳過各隱含層節點,然后傳到輸出節點。實踐已經證明了三層BP網絡可以以任意精度逼近一個連續函數。
2.BP算法
BP網絡所完成的信息處理工作,從數學意義上講是利用映射訓練樣本(x1,y1),(x2,y2),…(xk,yk)…,實現從n維歐氏空間子集到f[A]的映射。BP網絡的學習過程是由正向傳播和反向傳播兩部分組成。在正向傳播過程中,輸入樣本從輸入層經過隱含層處理并傳向輸出層,每一層神經元狀態只影響下一層神經元狀態,如果在輸出層得不到期望的輸出,則轉入反向傳播。此時,誤差信號從輸出層向輸入層傳播并沿途調整各層之間的連接權值以及各神經元的偏置值,以使誤差信號不斷減小,經過反復迭代,當誤差小于允許值,網絡的訓練結束。BP網絡具體的學習過程按以下步驟進行:
(1)置各權值或閾值的初始值:Wji(0),θj(0)為小的隨機數值。
(2)提供訓練樣本:輸入矢量Xk,k=1,2,…,P;期望輸出dk,k=1,2,…,P;對每一個輸入樣本進行下面(3)到(5)的迭代。
(3)計算網絡的實際輸出及隱含層單元的狀態:
okj=fj(∑wjiokj+θj),其中f(x)為轉移函數,采取Sigmoid函數,即
(4)計算訓練誤差:
δkj=okj(1-okjj)(tkj-okj) (輸出層)
δkj=okj(1-okj)∑δkmwmj(隱含層)
(5)修正權值和閾值:
wkj(t+1)=wji(t)+ηδjoki+α[wji(t)-wji(t-1)]
θj(t+1)=θj(t)+ηδj+α[θj(t)-θj(t-1)]
(6)當k每經歷1至P后,判斷指標是否符合精度要求:
E≤ε; ε:精度。
(7)結束。
3.BP算法的改進
傳統的BP網絡把一組樣本的輸入/輸出問題變為一個非線性優化問題,使用了優化中最普通的梯度下降算法。BP算法在應用中最突出的優點是具有很強的非線性映射能力,網絡的隱含層數、各層的神經元數以及網絡的學習系數都可以根據具體情況任意設定,對問題的識別具有很強的功能,對于復雜的非線性模型仿真從理論上來說可以達到任意小的程度。在實際預算中,標準BP算法存在著收斂速度慢和容易陷入局部極值兩個重要問題。為此,我們以如下兩項措施來改進BP算法。
(1)學習率自適應調整。標準BP算法收斂速度慢的一個重要原因是學習速率不當。學習率太小,收斂太慢;學習率太大,則可能導致振蕩甚至發散。我們采用學習率的自適應調整,即當連續兩次迭代其梯度方向相同時,表明下降太慢,將步長加倍;而當連續兩次迭代其梯度方向相反時,表明下降過頭,則步長減半。
(2)加動量項。標準BP算法在修正w(t)時,僅按照t時刻的瞬時負梯度方向進行修正,沒有考慮以前時刻的梯度方向,從而使學習過程常常發生振蕩,收斂很慢。我們加動量項的目的是為了降低網絡對誤差曲面細節的敏感性,從而抑制網絡限于局部極小。
改進后的權值修正公式為:
w(t+1)=w(t)+α(t )[(1-η)d(t)+ηd(t-1)]
α(t)=2λα(t-1)
λ=sign[d(t)d(t-1)]
式中:α(t)為學習率,為k時刻的負梯度,η為動量因子,0≤η≤1。
三、基于BP神經網絡的工作崗位評價系統設計
1.評價指標的標準化
由于工作崗位評價涉及到一系列的指標,有定性指標和定量指標,各個評價指標的量綱也不一樣。因為根據BP網絡的特點,輸入節點數據的取值范圍應該是[0,1],所以,必須對評價指標進行標準化處理。
(1)定量指標
對于評價指標ui,其中mi和Mi分別為評價指標ui的最小值和最大值。設ri為決策者對評價指標ui的屬性值xi的無量綱化值,且ri∈[0,1]。根據評價指標的類型,可采用下列兩種無量綱化標準函數:
當目標越大評價越好時,
當目標越小評價越好時,
(2)定性指標
在該評價指標中,大部分是一些不能直接量化而只能進行定性描述的指標,可以采用確定指標評價等級隸屬度的方法來實現其量化。其方法是:設Ui為定性評價指標,Ui相對于評價集A=(α1,α2,…,αn)的隸屬度向量為:ri=(ri1,ri2,…,rin)。此處隸屬度向量可采用專家調查的方法,并通過集值統計方法來確定,或者可以通過模糊數學中確定隸屬函數的方法來確定。另外,一種最簡單的方法就是直接利用專家打分的方法來確定,評分時專家充分審核、分析每個工作崗位的影響因素,給出各個評價指標評分值,取值范圍是[0,1]。但是,為了保證與定量指標的可比性,可以根據上面定量指標的處理方法,將得到的評分值進行標準化處理后再作為神經網絡的輸入。
2.系統結構設計
實踐證明,具有單隱層的BP網絡可以逼近任意連續函數。本文設計了一個三層BP網絡來模擬工作崗位評價系統的評價過程。其中,將評價指標的標準化值作為網絡的輸入向量,所以,本文中輸入節點共有22個,輸出節點為1個,輸出值為工作崗位評價結果,即工作崗位相對價值的量化值。由于輸入向量和輸出向量之間不滿足線性關系,因此,選擇單極性的sigmoid函數作為轉移函數。另外,隱含層的節點數也直接影響到網絡的性能。對于隱含層節點數的確定,我們可以采用經驗公式:Pm= Pn+r+L,其中,Pm、Pn、r分別為隱含層、輸入層、輸出層的神經元數目,L為1-10之間的一個整數。可以采取對比實驗的方式來選擇最佳隱含層節點的數目。采用改進BP的算法來進行學習,根據學習時間及次數與達到全局誤差的綜合效果來看,6個隱含層神經元比較合適。
以技術知識要求、質量責任等22項工作崗位評價指標的標準量化值作為網絡輸入向量,用X=(xi,x2,…,x22)表示;隱含層節點用向量Y=(y1,y2,…,y6)表示;O=(o1)表示輸出向量,根據轉移函數的性質,o1∈[0,1],是工作崗位的綜合評價值,用S∈[0,1]來表示,分值越大,則表明該工作崗位的相對價值越高;反之,相對價值就越低。 將訓練集的實際輸出數據轉換為[0,1]的數值,期望輸出用T=(t1)表示。 輸入層節點到隱含層節點的權值用向量V=(v1,1,v1,2,…,v22,6)表示,隱含層節點到輸出層節點的權值用向量W=(w1,1,w2,1,…,w6,1)表示。對于隱含層有:
yj=f(∑vijxi) (j=1,2,…,6)(1)
對于輸出層有:
oj=f(∑wj1yj)(2)
這樣(1)、(2)兩式就建立了工作崗位評價系統。系統結構圖如圖1所示:
3.網絡訓練樣本的獲得
神經網絡要具有評價功能,必須經過一定數量樣本數據的訓練。所以,獲得適當數量的訓練數據是進行網絡訓練的前提。選取某個企業的20個工作崗位作為實證分析的對象,即神經網絡的訓練單元。其中,將該企業的20個工作崗位的22項評價指標的專家打分值作為訓練單元的輸入數據,而以相應工作崗位的評價值作為網絡的期望輸出。對于網絡期望輸出結果的獲得,我們可以采取常用的層次分析法(The Ana-lytic Hierarchy Process,簡稱AHP),這種方法是由美國著名的運籌學家T.L.Saaty于20世紀70年代提出的一種以定性與定量相結合的系統化、層次化決策分析方法。層次分析法的原理是把復雜的問題分解為各組成因素,將這些因素按支配關系分組,以形成有序的遞階層次結構。通過兩兩比較判斷,確定每一層中因素的相對重要性,建立判斷矩陣,通過矩陣的最大特征值與特征向量的計算,得出該層要素對于上層準則的權重。利用層次分析法,不僅可以得出每一個工作崗位評價指標對于工作崗位相對價值的權重,而且可以將每一個評價指標的評分值與指標權重加權相加,得出每一個工作崗位的綜合評價值,該評價值就能作為網絡的期望輸出。這樣采用層次分析法,便能獲得訓練樣本與仿真樣本。
4.網絡訓練與系統仿真
獲得了網絡訓練樣本數據,再對網絡進行訓練。我們將編號為1-15崗位數據作為訓練單元輸入BP神經網絡,給定的學習精度為ε=0.0001,初始學習速率為0.05,每個訓練樣本崗位的綜合評價值作為網絡期望輸出。采用Matlab 7.0神經網絡工具箱對網絡進行訓練,當訓練誤差達到了精度要求,訓練停止。將編號為16-20的樣本崗位作為仿真樣本來檢驗網絡的評價和預測精度,發現網絡的仿真結果同樣本的評價結果非常接近,如表2所示。這一點表明該網絡具有很好的泛化能力,采用BP神經網絡建立工作崗位評價系統是完全可行的。
四、結束語
工作崗位評價是企業人力資源管理工作的重要內容,對工作崗位進行科學、客觀的評價,是確定公平、合理的薪酬制度的基礎,這一點對于提高員工工作積極性和保持企業活力都具有很重要的意義。本文在建立工作崗位評價指標體系的基礎上,采用BP神經網絡來設計企業工作崗位評價系統,利用BP神經網絡自身強大的非線性映射能力和很強的自學習性、自適應性和容錯性,能夠充分地挖掘出樣本評價指標中有關規律和信息,揭示影響工作崗位相關因素的內在作用機制,有效地克服評價過程中人為確定標準值和權重的主觀性因素的干擾,并且針對BP網絡收斂慢、容易陷入局部極小的缺點,采取了加動量項和學習率自適應調整的方法進行改進,以彌補BP網絡的缺陷,更能夠體現工作崗位評價的科學性和客觀性。仿真試驗表明,該評價系統取得了令人滿意的結果。在實際應用中,為了保證系統評價的有效性,應該對系統進行必要的修改和調整,對系統的運行狀況進行檢查和控制,力求系統達到準確、高效、易操作及具備良好的適應性。只要做好以上工作,基于BP神經網絡的工作崗位評價系統就能夠成為企業人力資源管理的有效工具。
參考文獻:
[1]沈世鎰.神經網絡系統理論及其應用[M].北京:科學出版社,1998.
[2]焦李成.神經網絡系統理論[M].西安:西安電子科技大學出版社,1993.
[3]安鴻章.工作崗位的分析技術與應用[M].天津:南開大學出版社,2001.
[4]安鴻章.工作崗位研究原理與應用[M].北京:中國勞動出版社,1998.
[5]李永杰,李強.工作分析理論與應用[M].北京:中國勞動社會保障出版社,2005.
[6]趙曼.人力資源開發與管理[M].北京:中國勞動社會保障出版社,2002.
[7]石全濤.現代人力資源開發與管理[M].上海:上海交通大學出版社,1999.
[8]楊力.基于BP神經網絡的城市房屋租賃估價系統設計[J].中國管理科學,2002,(10).
[9]張新紅,鄭丕諤.基于神經網絡的管理信息系統綜合評價方法[J].系統工程學報,2002,(5).
篇9
關鍵詞:BP神經網絡;廣義回歸神經網絡;量子粒子群算法;水質預測
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2013)23-5373-04
在水產養殖中, 水體環境直接影響到養殖水產品的產量及質量,漁業健康養殖要求能夠對水質的變化進行實時的監控及預測預警。物理、生物及化學等多方面因素會對養殖環境的水質產生影響,其主要包括:水溫、PH值、溶解氧含量、硝氮含量、氨氮含量等。作為水質預測預警的工具,水質預測模型的研究一直受到各國專家學者的廣泛關注。國內外已有不少學者對水質預測模型構建進行了研究,Karul C等[1]應用BP網絡建立水庫富營養化模型。Kuo等[2]使用BP人工神經網絡以水體中五種物質的濃度為特征參數來預測臺灣烏腳病區地下水水質變化;殷高方等[3]將BP神經網與水體環境因子的高頻實測數據相結合,構建了巢湖水華的短期動態預測模型;張升東等[4]建立適用于水庫水質評價的 BP 人工神經網絡模型,將模型應用于臥虎山水庫 2010年 8月到2011年12月的水質評價。雖然到目前為止BP網絡在水質預測中已得到了廣泛的應用,但由于其自身存在收斂速度慢和容易陷入局部極小的不足,其預測性能還有待進一步提高。
GRNN[5]由The Lockheed Palo Alto研究實驗室的Donald Specht在1991年提出,它建立在數理統計的基礎上,具有良好的逼近性能,學習能力很強;另外,由于其只需確定合適的光滑因子而無需對權值進行反復訓練,故收斂速度較快,上述優點使其在預測方面比BP網絡具有更高的預測精度及更快的運行速度[6-7]。
平滑因子是GRNN唯一待確定的參數,平滑因子的確定對整個預測模型的性能具有關鍵性作用。該文采用QPSO來確定合適的平滑因子,以提高GRNN模型的預測能力,使之能夠更好地做好養殖水環境參數的預測工作。
1 BP神經網絡及其改進
BP神經網絡是1986年由Rumelhart和McCelland為首的科學家小組提出,是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡模型之一。其主要思想是:輸入學習樣本,使用反向傳播算法對網絡的權值和偏差進行反復的調整訓練,使網絡的誤差平方和最小。但是,BP算法是一種梯度下降算法,并且由于非線層單元的存在,導致網絡存在多個最小點,故最后可能會產生局部最小值。其次,對于一些復雜問題,由于學習速率太小會造成學習過程收斂速度較慢等問題,另外對網絡隱含層層數和單元數的選擇尚無理論上的指導,需通過經驗或不斷實驗來確定,故可能對預測結果產生影響的人為干擾因素較多。針對上述問題,不少學者對BP神經網絡進行了一些改進,如采用L-M優化算法(又稱阻尼最小二乘法)改進BP神經網絡,降低網絡對誤差曲面局部細節的敏感性,以提高中等規模神經網絡的收斂速度和泛化能力[8]。
2 基于QPSO-GRNN的氨氮預測模型
2.1 量子粒子群算法
QPSO算法[9-10]是在經典的PSO算法基礎上所提出的一種有較高收斂性和穩定性的進化算法,在許多優化問題中,QPSO已經證明比PSO要優越。
2.2 基于QPSO-GRNN的氨氮預測模型
氨氮是漁業養殖中一項十分重要的水質指標,它對魚類的生長有著重要的作用,由于用來監測氨氮的設備要比監測溶氧等其他因子的設備昂貴很多,故可以通過其他因子與氨氮之間存在的相互關系來預測氨氮值。
本文收集了國家羅非魚產業技術研發中心無錫養殖基地25天內連續監測的100組數據作為建模數據。其中輸入數據為PH值、溫度值、硝氮值和溶氧值,輸出數據為氨氮,把前90個樣本作為訓練樣本進行訓練,后10個樣本作為預測樣本。
3 結論
針對BP網絡用于預測水質時存在的收斂速度慢和易陷入局部極小的不足,提出基于QPSO-GRNN的水質預測模型,實驗結果證明:該模型與BP網絡和L-M BP網絡相比較,預測的精度較準確,運行速度也得到較大提高。
參考文獻:
[1] Karul C, Soyupak S, Yurteri C. Neural network models as a management tool in lakes. Hydrobiologia, 1999, 408 /409: 139-144.
[2] Kuo Y M, Liu C W, and Lin K H. Evaluation of the ability of an artificial neural network model to assess the variation of groundwater quality in an area of black foot disease in Taiwan. Water Research, 2004, 38: 148-158.
[3] 殷高方,張玉鈞,胡麗,等.BP神經網絡在水華短期預測中的應用[J].北京理工大學報,32(6)2012.6: 655-660.
[4] 張升東,徐征和,杜敏,等.基于BP神經網絡的臥虎山水庫水質評價[J].濟南大學學報:自然科學版,2013,27(4): 419-423.
[5] Specht D F. A general regression neural network[J]. IEEE, Transactions on Neural Networks,1991, 2(6):568-576.
[6] Leung M T, Chen A S, Daouk H. Forecasting Exchange Rates Using General Regression Neural Networks [J]. Computers & Operation Research, 2000, 27(4):1093-1110.
[7] Terri L. Cravener, William B. Roush. Prediction of amino acid profiles in feed ingredients: Genetic algorithm calibration of artificial neural networks [J].Animal Feed Science Technology.2001, 2(90):131-141.
[8] HAGAN M T, MENHAJ M B. Training feed-forward networks with the marquardt algorithm[J]. IEEE Transactions on Neural Networks,1994,5( 6) : 989-993.
[9] Sun J, Xu W B. A Global Search Strategy of Quantum-behaved Particle Swarm Optimization[C]//Proceedings of IEEE Conference on Cybernetics and Intelligent Systems. [S. l.]: IEEE Press, 2004:111-116.
[10] 毛力,馬亦先,梁淑萍,劉以安.群智能在Ad Hoc網絡QoS組播路由中應用的研究[J].計算機工程與應用,2011,47(24): 73-76.
[11] Mandal P, Senjyu T, Urasaki N, Funabashi T, Srivastava A. A novel approach to forecast electricity price for PJM using neural network and similar days method[J].IEEE Transactions on Power Systems,2007, 22(4):2058-2065.
篇10
關鍵詞:數據;時間序列;分析;處理
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2012)09-2090-02
Time Series Analysis of Wave data
YEXiao-ying, ZHENG Xue-yu, CHEN Feng, HAN Fei
(Neusoft Institute of Information Technology,Foshan 528225,China)
Abstract: In this paper, we discuss the analysis and process methods of time series data. Time series come from a lot of industrial data procession. The Analysis of time series is important. Some time series data are periodical, such as complex periodical functions of electrical signal. Others are aperiodicity, such as a signal with stochastic processes.
Key words: data; time series; analysis; process
在實踐應用的很多領域,都有對波動數據的分析與處理。從最簡單形式的周期性物理波形,到復雜一些的聲波等復合波動的時域頻域分析,模式識別領域的處理與應用方法,經濟金融領域的非周期復雜波動數據的特性研究。雖然問題產生的各自領域有很大的跨度,從方法論的角度來看,認識與解決問題的時候,常常有穿越領域的應用。而一些最常用的處理方法基本上成為所有領域內分析理論的基礎。例如使用更簡單的多個函數來擬合復雜函數、微分分段考察問題特性、積分近似實際情形、使用隨機統計分析方法等等。
波動數據有的具有規律的周期性,更普遍的波動數據沒有規律的周期性。
1時域與頻域的分析
周期性出現的波動數據時間序列,在知識領域內通常可以稱為周期信號或簡稱信號,可以通過考察其時域與頻域特性來分析。時域與頻域作為周期信號的基本性質,是觀察信號的不同角度,兩者可以通過傅里葉變換來互相轉換。信號的上升時間與下降時間,是判斷信號是否高速的依據。信號的頻寬表示的是信號所含的高頻分量。信號的上升與下降時間決定了信號的高頻分量。
波動數據的時間序列信號唯一存在于時域中(張賢達,2002),這是我們可以真實觀察并感受到波動數據的域。時域中信號的可見波形,可以簡單直觀表達信號的存在以及變化趨勢。當以波形描述一個信號時,應注意在波形圖上可見的該信號關鍵值,關鍵值包括有信號的不連續點、零點、最大值點和最小值點等。許多問題的求解都可以通過分析信號波形而得到簡化。
包含隨機因素的數據,處理起來需要加入更復雜的模型,或需要引入數理統計模型。不包含隨機因素的信號是確定性信號。對于不包含隨機信號的確定性信號,一般分為連續信號與離散信號。通過數據抽樣,可以把連續信號轉化為離散信號。時域中的任何波形,都可以用頻域中的正弦波來合成,并且可以得到唯一的描述。
時域與頻域是從不同的域來觀察同一件事物。時域是從現實中觀察動態的信號。頻域是在另一個空間以頻率為坐標軸來觀察動態信號(奧本海姆,2010)。在很多時候,這種觀察空間的轉換,能夠更加容易看出信號的特性,而頻域分析也具有更為簡練的描述形式。
傅里葉變換可以將時域的信號變換到頻域。傅里葉變換有三種類型:傅里葉積分(FI)、離散傅里葉變換(DFT)、快速傅里葉變換(FFT)。在頻域中,對波形的描述變為不同正弦波的集合。每個頻率分量都有各自的幅度與相位。對于時域中非周期的信號可以進行以信號存在時間為周期的周期拓延,從而變為周期信號來進行分析。
在頻域中,第一個正弦波頻率稱為一次諧波,第二個正弦波頻率稱為二次諧波,依次類推。每個諧波都有不同的幅度和相位。所有諧波及其幅度的集合稱為頻譜。頻域中的頻譜表示的是時域波形包含的所有正弦波頻率的幅度。在知道頻譜的情況下,要觀察它的時域波形,只需將每個頻率分量變換成它的時域正弦波,再將其全部疊加即可。這個過程稱為傅里葉逆變換。不同的數學變換,變換對原始數據觀察的角度與空間,或許能使得內在規律性變得更加清晰。
圖1時域與頻域變換示意圖
2有限元方法
在結構分析領域中,關于靜力結構、結構震動、彈塑性材料等研究中,為了得到盡可能精確的數學物理數據,常采用有限元分析方法來進行波動與震動的描述。有限元分析的目的:針對具有任意復雜幾何形狀變形體,完整獲取在復雜外力作用下它內部的準確力學信息,即求取該變形體的三類力學信息(位移、應變、應力)。
有限元方法使用基于“離散逼近(discretized approximation)”的基本策略,可以采用較多數量的簡單函數的組合來“近似”代替非常復雜的原函數。例如(廖振鵬等,1992)所進行的對波動有限元模擬的研究。時域有限元法不但可以用于研究復雜線彈性介質中的波動問題,而且利用計算機圖形仿真技術還可以把波動過程動態地顯示出來,直觀地揭示與波動源和傳播路徑等有關的各種物理因素和波動特征之間的關系.因此,這一方法是研究工程科學中一系列重要波動問題的有力工具。
有限元方法對波動時間序列傳播的物理介質媒體建立結構震動的三大類方程(平衡方程、幾何方程、物理方程等)以及邊界與初始條件,來進行波動時間序列的研究(來翔,2007)。這一類波動數據的時間序列,其物理特征是完全依賴于傳播的媒介。在時域頻域分析中,具有一定帶寬的信號,其在一定媒介中傳播的過程,也是需要考慮信號衰減的。在這一點上,與有限元方法的情況類似。
3模式識別與神經網絡方法
時間序列數據或信號在更復雜的分析處理情形下,就不僅僅停留在信號本身的物理特性上。對信號攜載的語法以及語義的判斷分析是更重要的目的。線性神經網絡可以應用于系統辨識、信號辨識、自適應濾波和控制等方面。目前在神經網絡的多數應用中,采用BP神經網絡,其具有廣泛的適應性與有效性,主要應用于模式識別與分類。
在BP神經網絡的應用中(孫虎兒,2009),增加網絡層數可以提高網絡識別性能,提高精度,但同時使得網絡結構復雜,增加訓練時間。因此首先考慮增加隱含層的神經元數,而不是增加網絡層數來提高網絡性能。隱含層數、隱含層的神經元數的適當數量,需要通過具體的試驗來大概確定。
在使用BP神經網絡進行字母表的圖像識別中(朱凱,2010),設計并訓練一個BP網絡,完成26個英文字母的5X7像素二值數字圖像的識別。取得了較好的噪聲樣本訓練下的一定容錯性。
4經濟與金融領域的復雜數據模式的波動性研究
在經濟與金融領域里,對時間序列數據的研究,具有非常重要的理論與實踐應用意義。在時間序列中,按照所得到的數據的連續性分為離散時間序列與連續時間序列。按照是否存在一定的趨勢,分為平穩時間序列與非平穩時間序列。平穩時間序列的觀測值基本上在一定的范圍之內,不會有增長或者減少的趨勢,也不會有超出范圍的波動。在現有的平穩時間序列處理中,往往把波動看作是隨機的。非平穩時間序列包含趨勢性,或有季節性、周期性,也可能是趨勢性與季節與周期性的復合序列。
在時間序列分析的過程中(王燕,2008),首先對取得的數據進行相關分析。在有趨勢拐點的時候,使用不同的模型分段擬合前后時間序列。然后判斷恰當的隨機模型來擬合時間序列的觀測數據。對于簡單的時間序列,可以用趨勢模型和季節模型來擬合。對于平穩時間序列,可用ARMA模型來擬合。對于非平穩時間序列要將其轉化為平穩時間序列來分析。
在更加復雜的情況下,可以考慮數據的Markov特性,使用Markov鏈的運用。有時一個時間序列中僅僅部分數據體現出Markov性,而其他部分的則是無規律的。
5結論
該文從波動數據的時間序列的最簡單的形式出發,論述在數據不同領域以及不同復雜度之下的分析處理方法。很多處理方法是跨領域的,例如時域頻域分析方法就從數學這樣的純理論研究領域出發,應用在電子、通訊、計算機、機械、農林、地質、經濟、金融等幾乎所有的學科中。波動數據如果不借助領域內知識,很難建立有效的分析判斷模型。在諸多波動數據的時間序列處理中,依然沒有有效的方法。例如外匯市場價格的高頻數據分析于處理,迄今沒有很好的方法。對波動數據時間序列的研究在可見的未來一直具有理論與實用意義。
參考文獻:
[1]張賢達.現代信號處理[M].2版.北京:清華大學出版社,2002.
[2](美)奧本海姆.信號與系統[M].西安:西安交通大學出版社,2010.
[3]廖振鵬,劉晶波.波動有限元模擬的基本問題[J].中國科學B輯,1992(8).
[4]來翔.幾類雙曲型方程交替方向有限元分析[D].山東大學,博士學位論文,2007.
[5]孫虎兒.基于神經網絡的優化設計及應用[M].北京:國防工業出版社,2009:36-53
[6]朱凱,王正林.精通MATLAB神經網絡[M].北京:電子工業出版社,2010:220-224.