神經網絡在信息安全的應用

時間:2022-11-28 10:42:50

導語:神經網絡在信息安全的應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

神經網絡在信息安全的應用

目前信息安全問題已經得到社會的廣泛關注,目前在信息安全管理中主要依靠現有的病毒庫,采用病毒查殺的方法來保證系統安全。但是在實際上,這種病毒查殺方法并不具有高效、預先防御的功能,導致很多新型病毒出現后系統的安全保護出現滯后性。而PCA技術的出現進一步強化信息安全管理能力,可以有效避免信息安全事件發生,具有先進性,值得關注。

1PCA技術分析1.1PCA技術概括

在當前的實時網絡環境下,網絡數據的流通數量越來越大,并表現出高度的數據維度特征,尤其是在業務的高峰時期,有效的識別數據特征并對異常數據進行隔離是保證信息安全的關鍵。在這種情況下,基于統計學中的PCA技術(主成分分析方法)出現,并成為現階段處理網絡數據的常見方法,與傳統技術相比,該技術能夠進一步降低數據維度,并最大程度上保證了數據所具有的原始特征。在這種情況下,數據量減少且維度降低有助于提高異常數據的監測性能,這是傳統技術所不具備的。1.2主動成分分析方法的降維原理PCA技術是一種可以將高緯度數據的不同數據映射成為少數幾個能夠代表元數據特征值的降維方法,在經過這種數據處理之后,這些少數的特征值可以反映出原有數據的特征屬性,并且為了保證數據處理效果,這些處理之后的數據是沒有關聯性的。在PCA的數學表達過程中,假設待處理的網絡異常源數據具有n個維數特征值,表述為:x1、x2……xn,在經過PCA處理之后,就可以將其轉變為n個綜合變量,通過這種計算方法可以確定不同綜合指標因子y的維度數,并且從第一個變量開始一直到第n個變量數,且方差呈現出依次遞減的特征。

2基于主成分分析法的BP神經網絡信息安全管理分析

2.1BP神經網絡信息分析。BP神經網絡最初是對人類大腦的工作進行抽象模擬的技術,其中涉及到了計算機科學、生物學、數學等內容,目前已經在廣泛應用在人工智能機器學中。從功能來看,BP神經網絡可以通過學習與訓練過程來調整網絡的連接權值,最終達到從輸入到輸出過程的完整收斂狀態。所以在當前的數據處理中,BP圣經網絡具有滿意的網絡信息處理能力,針對網絡信息傳輸過程中存在的信息變形失真或者信息丟失不完整情況進行抽象補充。最后,BP神經網絡具有一定的自主學習能力,能夠識別訓練樣本中各種異常數據,且對于異常數據的變形形式也有一定的識別效果。2.2基于BP的神經網絡學習步驟。在BP神經網絡中,在學習樣本從輸入層輸入到網絡中之后,神經元的激活值開始從輸入層一直想輸出層傳遞,這個過程中,各層的神經元在數據上否會得到相應;之后根據減少目標情況,可以反向從輸出層到隱含層再到輸入層,通過一層一層的修正權值,保證了數據處理過程。而在實際上,這種反向誤差的持續修正,可以提高網絡對輸入模式相應的正確率。

3仿真分析

3.1實驗數據源的確定。本次仿真實驗中采用了KDDCUP99數據集,該數據集主要包含4898431條記錄,本文在該數據集的基礎上,基于10%的測試子集與訓練自己進行仿真實驗,實驗中不僅包含了各種正常數據,也包含異常數據,并且每個異常數據中都包含不同的入侵攻擊行為。3.2仿真準備階段。3.2.1選擇仿真平臺。本次研究中選擇了MATLAB仿真平臺,該平臺是一款在圖像處理、系統仿真以及計算機等領域應用十分廣泛的軟件平臺,經過長時間的發展,仿真平臺可以提供大量的便捷工具,因此在科研領域得到充分運用。3.2.2PCA相關函數的提取。本文所界定的PCA相關函數的資料與表1所示。3.2.3攻擊類型與數目的確定在本次仿真分析過程中所使用的Kddcup文件中包含494021條源數據,在這些數據處理中,通過SQL數據庫進行處理,篩除其中的重復數據,得到了攻擊數據的詳細資料,相關內容如表2所示。同時在數據處理階段,考慮仿真過程中由于MATLAB環境下無法識別費數據化資料,因此數據中的234維度都需要轉變為非數值化數據,采用1代替。3.3數據的歸一化處理與仿真實施。3.3.1數據歸一化處理。數據歸一化處理在實際上就是數據標準化處理,本文為了進一步提高數據質量水平,在保證數據集不丟失自身特征的基礎上轉變為一種更緊湊的形式,所以在數據處理過程中,將詭異處理后的數據集進行集中處理,使整個仿真分析所需要的資源與時間更少,效率更高,則處理過程為:(1)計算帶訓練數據集中的源數據集,提取數據集中的所有元素的平均值,記為P0;(2)將源數據集中的所有元素標準化,獲得標準差;(3)將源數據集歸一化處理。3.3.2仿真處理。考慮到實驗結果是未知的,并且基于PCA的BP神經網絡安全中存在不同分量特征的數目,這些神經元數量無法確定,因此在數據處理過程中,可以在分類模擬訓練的基礎上通過多次連續的實驗來保證PCA的模型仿真結果實現最優化。因此在本次研究中,本文將結合訓練數據集Train.txt與測試數據集進行降維處理,這樣可以獲得不同主分量,之后獲取完成的主分量加入到BP神經網絡中,將測試集通過的PCA對BP神經網絡進行識別,經過多次反復的數據處理,可以得到基于PCA的BP神經網絡安全管理結果。在數據處理過程中,基于PCA的BP神經網絡信息安全管理直接與未改進的BP神經網絡上進行對比,通過對比兩種方法對信息安全數據的識別效果,評價PCA技術的優勢。3.4識別結果與分析。從本次仿真實驗來看,基于PCA的BP神經網絡對于不同攻擊類型具有更強的識別率,相關資料如表3所示。根據表3的相關資料可知,結果相比基于PCA改進的BP神經網絡對于各類網絡攻擊具有更高的識別率,整體信息安全管理能力要顯著高于傳統方法。根據這一結果,共得出以下結論:(1)與傳統的檢測方法相比,PCA改進的BP神經網絡誤報率顯著下降,證明該方法可以在BP神經網絡信息安全管理中提高了安全事件的信息識別率;(2)在五種攻擊類型中,系統對NORMAL攻擊類型的識別率最好,對U2R攻擊類型的識別率較差。這一結果在一定程度上說明了人工神經網絡在訓練樣本充足的情況下,系統對閾值的調節更細致,所以網絡信息安全管理的效果好,且識別率更高;相反訓練樣本不足,在一定程度上會影響識別率。因此可以認為基于PCA的BP神經網絡通過處理對于異常數據具有很高的識別率,因此面對海量異常數據也保持著滿意的識別率,這是傳統技術所具備的,該方法通過主成分分析保證了原有數據的特征,提高了數據識別的準確率。

4結束語

本文詳細分析了基于PCA的BP神經網絡信息安全管理問題,從本文的實驗仿真結果來看,PCA方法滿足BP神經網絡信息安全管理要求,與傳統方法相比,該方法對于安全信息具有更高的識別率,因此值得推廣。

參考文獻

[1]劉凱崢,王振國.高速公路收購價值研究——基于非線性主成分分析和RBF神經網絡預測模型[J].中國市場,2019(30):159-160.

作者:白軼 車宇 單位:中國核動力研究設計院