數據挖掘技術的研究
時間:2022-02-25 11:34:10
導語:數據挖掘技術的研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要“:互聯網+”戰略的實施促進了我國信息技術的快速發展,數據挖掘技術能夠實現對海量信息的統計、分析以及利用等,因此數據挖掘技術在生活實踐中得到了廣泛的應用。因此本文希望通過對數據挖掘技術的分析,分析數據挖掘技術在實踐中具體應用的策略,以此更好的促進數據挖掘技術在實踐中的應用。
關鍵詞:數據挖掘;應用;發展
1數據挖掘技術的概述
數據挖掘是通過對各種數據信息進行有選擇的統計、歸類以及分析等挖掘隱含的有用的信息,從而為實踐應用提出有用的決策信息的過程。通俗的說數據挖掘就是一種借助于多種數據分析工具在海量的數據信息中挖掘模數據信息和模型之間關系的技術總裁,通過對這種模型進行認識和理解,分析它們的對應關系,以此來指導各行各業的生產和發展,提供重大決策上的支持。數據挖掘技術是對海量數據信息的統計、分析等因此數據挖掘技術呈現以下特點:一是數據挖掘技術主要是借助各種其它專業學科的知識,從而建立挖掘模型,設計相應的模型算法,從而找出其中的潛在規律等,揭示其中的內在聯系性;二是數據挖掘主要是處理各行數據庫中的信息,因此這些信息是經過預處理的;三是以構建數據模型的方式服務于實踐應用。當然數據挖掘并不是以發現數據理論為目的,而是為了在各行各業的信息中找出有用的數據信息,滿足用戶的需求。
2數據挖掘的功能
結合數據挖掘技術的概述,數據挖掘主要具體以下功能:一是自動預測趨勢和行為。數據挖掘主要是在復雜的數據庫中尋找自己有用的信息,以往的信息搜索需要采取手工分析的方式,如今通過數據挖掘可以快速的將符合數據本身的數據找出來;二是關聯分析。關聯性就是事物之間存在某種的聯系性,這種事物必須要在兩種以上,數據關聯是在復雜的數據中存在一類重要的可被發現的知識;三是概念描述。概念描述分為特征性描述和區別性描述;四是偏差檢測。
3數據挖掘技術的步驟分析
3.1處理過程
數據挖掘雖然能夠實現在復雜的數據庫中尋求自己的數據資源,但是其需要建立人工模型,根據人工模型實現對數據的統計、分析以及利用等。
3.2關鍵技術
由于數據挖掘涉及到很多專業學科,因此相對來說,數據挖掘技術融合多門專業技術學科的知識,結合實踐,數據挖掘技術主要應用到以下算法和模型:一是傳統統計方法。采取傳統的統計方法主要有抽樣技術,也就是采取相應的策略對數據進行合理的抽樣。多元化統計和統計預測方法;二是可視化技術,可視化技術是數據挖掘技術的熱點,它是采取可視化技術與數據挖掘過程的結合,以直觀的圖形等使人們更好地進行數據挖掘技術;三是決策樹。決策樹需要對數據庫進行幾遍的掃描之后,才能完成,因此其在具體的處理過程中可能會包括很多的預測變量情況;四是4)聚類分析方法。聚類分析方法是一種非參數分析方法,主要用于分析樣本分組中多維數據點間的差異和聯系。判別分析法需要預先設定一個指針變量,假設總體為正太分布,必須嚴格遵守數理依據。而聚類分析則沒有這些假設和原則,只需要通過搜集數據和轉換成相似矩陣兩個步驟,就能完成聚類分析的全過程。聚類分析主要用于獲取數據的分布情況,能夠簡單方便的發現全局的分布模式,識別出密集和系數區域;此外,對于單個類的分析也有很強的處理能力,能深入分析每個類的特征,并找出變量和類之間的內在聯系。基于距離、層次、密度和網絡的方法是最常用的聚類分析方法。
4數據挖掘技術的實踐應用
數據挖掘技術雖然在我國發展的時間還不長,但是其在實踐中的應用已經非常的廣泛,因為數據挖掘技術在實踐中的應用價值是非常大的,其可以提取隱藏在數據背后的有用信息,具體來看,其主要應用在:(1)在醫學上的應用。人體的奧秘是無窮無盡的,人類遺傳密碼的信息、人類疾病史和治療方法等,都隱含了大量數據信息。采用數據挖掘來解決這些問題,將給相關工作者的工作帶來很大方便。此外,醫院內部醫藥器具的管理、病人檔案資料的整理、醫院內部結構的管理等,也是龐大的數據庫。將數據挖掘技術應用于醫學領域,深入分析人類疾病間的內在聯系和規律,幫助醫生進行診斷和治療,能夠有效提高醫生診斷的準確率,對人類的健康和醫療事業的發展有十分重要的作用。(2)在電信業中的應用。隨著三網融合技術的不斷發展,傳統的電信業務已經不能滿足當前社會發展的需求,而是側重通信、圖像以及網絡等業務的融合,而實現“三網融合”的關鍵技術是實現對數據的分析與統計,因為三網融合會帶來更多的數據,這些數據都需要充分的挖掘,以此實現“三網融合”戰略的實現。將數據挖掘技術與電信業務有效的結合起來,能夠提高資源利用率,更深入的了解用戶的行為,促進電信業務的推廣,幫助各行各業獲取更大的經濟效益。(3)在高校貧困生管理的應用。貧困生管理分析系統主要應用了數據倉庫技術以及數據挖掘技術,其主要是將高校貧困生的各種信息統一納入到高校信息管理平臺中,然后根據具體的貧困生劃分標準,建立模型,進而對學生的信息進行統計與分析,實現對貧困生信息的科學管理,便于高校管理者及時了解學生的信息。
5結語
總之數據挖掘技術在實踐中的廣泛應用,為我國互聯網+戰略提供了關鍵技術支撐,但是由于數據挖掘技術在實踐中還存在某些技術問題,比如各種模型和技術難于集成、缺少與數據庫系統耦合的通用API或挖掘系統僅提供孤立的知識發現功能,難于嵌入大型應用等問題導致挖掘技術在實踐中的應用還存在缺陷,因此需要我們加大對數據挖掘技術的進一步研究,以此更好地實現“互聯網+”戰略。
作者:陳建偉 李麗坤 單位:安陽職業技術學院
參考文獻
[1]舒正渝.淺談數據挖掘技術及其應用[J].中國西部科技,2010(02).
[2]諶章俊,蔣智剛.基于數據挖掘技術的知識發現系統[J].現代情報,2007(05).
- 上一篇:手機社交APP對網絡安全的消極影響及對策
- 下一篇:小學會計監督體系的構建