計算機文本信息挖掘技術論文
時間:2022-09-28 09:49:43
導語:計算機文本信息挖掘技術論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
我國的經濟社會不斷發展,科學技術水平不斷提升,在數據時代背景下,信息呈現爆炸增長趨勢,需要對數據信息進行高效處理,不斷提高工作效率。信息技術加快了數據傳播的速度,優化了信息交流的方式,但也存在安全隱患問題。為了保障網絡安全,可以應用計算機文本信息挖掘技術。
1計算機文本信息挖掘技術概述
計算機文本信息挖掘技術類屬于數據處理技術的范疇,被應用在數據處理之中,主要面向文本信息。應用計算機文本信息挖掘技術可以從海量文本信息中提取有效信息,并概括這些信息數據的特點等,對這些信息進行分類和識別。計算機文本信息挖掘技術具有復雜性特征,其應用流程如下所示:(1)計算機文本信息挖掘技術會對文本對象進行選取,文本對象大多是來自期刊、網頁和其他數據庫中的文本信息。(2)計算機文本信息挖掘技術對文本對象進行了預處理,包括對文本對象進行去噪處理、分詞處理等等。在預處理過程中,計算機文本信息挖掘技術提取了文本對象的特征,并將文本對象特征表示出來。(3)計算機文本信息挖掘技術對文本信息進行了深入挖掘,對具有統一特征的文本對象進行了分類,并考察了信息數據之間的關聯性,預測了文本對象的發展趨勢。以上三步是計算機文本信息挖掘技術應用的重要流程,也是文本挖掘的主要步驟。在應用計算機文本信息挖掘技術時,還需要經常應用鄰近分類算法。鄰近分類算法類屬于文本分類方法的范疇,在應用鄰近分類算法的過程中,需要先制定分類方案,并對數據、分類方案進行比對,看文本屬性最接近哪一個分類方案,可以被歸入到哪一個分類方案之中。為了確保分類的準確性,需要明確分類方案的描述特征,并對文本進行設置。通過計算文本和分類方案的鄰近性,可以對文本進行初步分類。
2計算機文本信息挖掘技術在網絡安全中的應用
2.1應用必要性。當前信息數據越來越多,如何剔除無效數據,保留有效數據,成為各行各業關注的重點問題。信息技術改變了人們的生活方式,改變了社會的生產方式,人們依靠手機、電腦進行線上交流,通過微博、微信等進行線上互通;社會通過網絡系統進行生產控制,通過信息技術進行運營監督。信息技術在一定程度上便捷了人們的生活,推動了社會的發展,需要進一步推動信息技術創新,擴大信息技術的應用范圍。在發展的同時,也需要看到信息技術存在的問題。伴隨信息量的不斷增加,網絡中的虛假信息、詐騙信息等越來越多,只有對這些垃圾信息進行有效攔截,才能保證網絡安全,保障用戶的個人權益。計算機文本信息挖掘技術有著重要的應用價值,其可以對海量信息進行有效分類,識別網絡中的真實信息、虛假信息,并對廣告信息等進行剔除。計算機文本信息挖掘技術對信息數據進行有效判斷,能夠保障網絡安全。實際應用條件上,針對網絡化的信息形式,需要對其中的基礎文本信息進行分析,尤其是與系統內容相關聯的信息內容上,務必要進行必要的調整,并通過相應的技術條件,保證網絡信息內容的安全性。例如,在當前的技術應用條件下,通過手機系統程序,就可以完成對與手機接收信息的文本分析,并在大數據系統的基礎上,通過文本內容的捕捉,確定此類信息的狀態。由此,定位可能存在的垃圾信息,并在手機使用設定中,將此類信息規整到統一的存儲格式中,由使用者進行二次確認,并保證信息管理的有效性狀態。2.2應用路徑。為了發揮計算機文本信息挖掘技術的作用,應該改進鄰近分類方法。計算機文本信息挖掘技術通過鄰近分類方法對互聯網信息進行分類,只有優化鄰近分類方法,才能提升文本信息分類的準確性。傳統的鄰近分類方法存在弊端,不同分類特征可能存在共線,文本信息分類可能會出現訛誤情況。在技術改進過程中,需要堅持將傳統方法作為依托,并對文本特征進行細化描述。技術人員需要合并共性屬性比較明顯的文本特征,并考察特征向量的維度,對其進行有效壓縮。通過上述方法,文本信息分類將更加高效。為了驗證計算機文本信息挖掘技術的有效性,需要開展實驗,考察計算機文本信息挖掘技術與網絡安全檢測之間的關系。技術人員首先要確定實驗對象,包括文本信息預測庫等,并盡量擴充其中的文本信息,確保其中有正常文本信息、廣告信息、詐騙信息等等。根據語料庫設定原則,需要對文本中的數據信息特征進行有效概括,看哪一種信息類屬于文本信息、哪一種信息類屬于廣告信息和詐騙信息。技術人員也可以對廣告信息、詐騙信息等進行合并,將其命名為危害信息。技術人員需要采用鄰近分類方法,測試計算機文本信息挖掘技術的應用效果。在設置評價參數的過程中,應該采用算法判定方式和專家判定方式。上述實驗將會出現四種可能性:(1)算法、專家判定安全信息;(2)算法、專家判定危害信息;(3)算法判定安全、專家判定危害信息;(4)算法判定危害、專家判定安全信息。技術人員需要對評價精度、評價誤差等進行計算,并設計信息檢測平臺,為計算機文本信息挖掘技術的應用提供支撐。網絡信息檢測平臺應該分成一級功能、二級功能,一級功能應該包括首頁、用戶管理等,而二級功能應該包括分類方法、參數評價等。2.3文本挖掘主要技術方向。文本挖掘技術,是計算機網絡化的應用技術手段,也是具體系統開發的方向性技術,在與具體產業進行結合的過程中,可以憑借自身的技術又是條件,適應到多種類型的技術空間中,展示自身科技型價值,適應知識經濟發展環境。(1)基于網絡文本分析的技術條件,可以在網絡新聞與輿情發掘的過程中,發揮自身的技術優勢,對構筑安全的網路環境,貢獻出基礎性技術內容。在網絡化的輿情環境中,個人信息、商業機密等內容的傳播,都會造成嚴重損失,威脅到企業與個人的信息與財產安全。而在這一內容的管理中,需要對客觀的網絡輿情狀態進行分析,在過濾文內容的同時,過濾具體的信息數據,通過關聯性分析、網絡溯源、輿情評價等內容,保證對于整體信息的管理狀態。尤其在輿情的推演中,可以形成完整的模型系統,并在模型的綜合作用下,保證技術的完整性與成長性,針對實際工作環境做出必要的基礎性保證。(2)專利信息的安全管理中,應用文本數據挖掘的工作模式,也可以起到積極作用。專利信息,大多是企業核心科技的關鍵內容,與企業的經濟收益與市場競爭條件息息相關,需要在技術內容上,形成系統性的防護條件,并在執行過程中,針對專利系統的管理流程,設置具體的文本挖掘工作方案,在程序的規范性狀態下,保證管理的有效性。方法上,需要針對專利權登記資料、專利所有權挖掘、專利使用權調查等內容,維護整體技術管理體系的建設狀體,實現同步化的專利技術分析。(3)在文本挖掘技術的應用開發中,表現出了明顯的技術成長性,在多種專業領域展現技術應用條件的同時,也在綜合性、管理性的內容中,呈現出了明顯的應用價值特征。例如,在醫療領域,文本分析可以被應用在醫學健康分析的工作中,通過在中藥成分分析、西藥用藥規律總結等多種信息化內容的安全數據整理,利用各種敏感詞匯與數據,保證了整體信息化系統的建設條件。又如,在企業的市場管理中,可以憑借這技術應用條件,對市場環境中的相關信息進行提取與分析。并在綜合相關市場人員掌握數據的同時,結合企業實際發展狀態,形成指導性的參考數據材料,保證整體信息系統的建設狀態,并使相應網絡資料為實際運行策略的制定提供參考,維護了發展信息綜合性分析執行效果。
3結論
綜上所述,我國的信息技術不斷發展,互聯網范圍進一步拓展,網絡安全問題屢見不以在網絡新聞與輿情發掘的過程中,發揮自身的技術優勢,對構筑安全的網路環境,貢獻出基礎性技術內容。在網絡化的輿情環境中,個人信息、商業機密等內容的傳播,都會造成嚴重損失,威脅到企業與個人的信息與財產安全。而在這一內容的管理中,需要對客觀的網絡輿情狀態進行分析,在過濾文內容的同時,過濾具體的信息數據,通過關聯性分析、網絡溯源、輿情評價等內容,保證對于整體信息的管理狀態。尤其在輿情的推演中,可以形成完整的模型系統,并在模型的綜合作用下,保證技術的完整性與成長性,針對實際工作環境做出必要的基礎性保證。(2)專利信息的安全管理中,應用文本數據挖掘的工作模式,也可以起到積極作用。專利信息,大多是企業核心科技的關鍵內容,與企業的經濟收益與市場競爭條件息息相關,需要在技術內容上,形成系統性的防護條件,并在執行過程中,針對專利系統的管理流程,設置具體的文本挖掘工作方案,在程序的規范性狀態下,保證管理的有效性。方法上,需要針對專利權登記資料、專利所有權挖掘、專利使用權調查等內容,維護整體技術管理體系的建設狀體,實現同步化的專利技術分析。(3)在文本挖掘技術的應用開發中,表現出了明顯的技術成長性,在多種專業領域展現技術應用條件的同時,也在綜合性、管理性的內容中,呈現出了明顯的應用價值特征。例如,在醫療領域,文本分析可以被應用在醫學健康分析的工作中,通過在中藥成分分析、西藥用藥規律總結等多種信息化內容的安全數據整理,利用各種敏感詞匯與數據,保證了整體信息化系統的建設條件。又如,在企業的市場管理中,可以憑借這技術應用條件,對市場環境中的相關信息進行提取與分析。并在綜合相關市場人員掌握數據的同時,結合企業實際發展狀態,形成指導性的參考數據材料,保證整體信息系統的建設狀態,并使相應網絡資料為實際運行策略的制定提供參考,維護了發展信息綜合性分析執行效果。
參考文獻
[1]江啟煜,何曉華,劉秀峰,等.基于大數據整合與文本挖掘的中藥生物分子信息文獻系統關鍵技術模型[J].醫學信息學雜志,2019,40(02):53-57.
[2]韓文智.計算機文本信息挖掘技術在網絡安全中的應用[J].華僑大學學報(自然科學版),2016,37(01):67-70.
作者:劉樹飛 單位:湖南工藝美術職業學院
- 上一篇:計算機軟件安全及防護策略
- 下一篇:計算機程序設計課程群建設論文