數據挖掘在未成年人口數量統計的應用

時間:2022-09-20 04:34:06

導語:數據挖掘在未成年人口數量統計的應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

數據挖掘在未成年人口數量統計的應用

摘要:隨著各地各省市教育大會的召開,未成年的教育問題備受關注,本文通過對中國近年來各地區的青少年的人口進行數據收集,運用數據挖掘的方法進行預測,得知未來青少年的人口數量和各地區青少年人口結構情況,從而可以明晰數據背后的意義和規律,對未成年展開適合的教育有著十分重要的意義。

關鍵詞:未成年人口;教育;數據挖掘

根據黨的“”報告,中國經濟已由高速增長階段轉向高質量發展階段,報告指出“在轉變發展方式、優化經濟結構、轉換增長動力的攻關期,建設現代化經濟體系是跨越關口的迫切要求和我國發展的戰略目標”。實現此目標的驅動和載體就是人才,并且未成年人的教育會間接影響國家人才的質量和數量,只有了解各地區青少年的人口數量,才可以因地制宜,更好的進行教育工作。國內有許多專家學者已經運用數據挖掘方法進行了研究。采用數據挖掘的方法,對北京市人口增長影響因素進行分析,通過進行相關性分析,挖掘出34個與北京市人口增長相關性較強的因素,構建了一個較為完整的北京市人口增長影響因素指標體系。通過屬性規約和屬性相關分析對人口信息系統的數據進行了預處理,對預處理后的屬性采用信息增益方法構造決策樹,并對決策樹表示的知識利用決策表的規則合并方法進行合并,據此得出了人口變動的基本規律。

數據潛在信息的重要技術,將它運用在分析中國人口方面一定能起到非常好的效果。研究各個地區的未成年人的人口數量是一個嚴峻的工作,本文使用spssmodeler軟件對2006-2017各個地區未成年人的數量進行分析,對未成年的教育工作提出一些建議。模型建立—聚類分析聚類分析是一種對物品、樣品或者指標進行分類的一種統計分析方法,它們討論的一般是量比較大的物品,要求按照物品各自的特性進行合理的劃分,沒有任何的前提要求和參考標準,即是在沒有先驗知識的情況下進行的分析。本文中案例數據主要來源于中國統計年鑒,數據中主要包括了各個地區青少年的人口數量從2005到2016的數量情況。本文采用聚類分析的方法,按照中國各個地區的未成年的人口增長趨勢的不同將地區進行聚類,明晰各組聚類數據的特點,從而能更好的把握中國未成年人口增長的地區性特征。根據第五次人口普查資料,按各省(區)人口平均密度可分成4類地區:(1)非常稠密區。每平方公里人口在400人以上,包括滬、京、津、蘇、魯、豫、粵、浙、皖等6省3市。占全國總人口的38.8%,平均每平方公里高達552人。(2)稠密區。每平方公里人口在200-400人之間,包括渝、冀、鄂、湘、遼、閩、贛、瓊、晉、黔等10省市。(3)較稠密區。每平方公里人口在100-200人之間,包括桂、陜、川、吉、云、寧等6省(區),占全國總人口的194%,平均每平方公里155人,高于全國平均人口密度。(4)稀少區。每平方公里人口在100人以下,包括黑、甘、蒙、新、青、藏等6個省(區),人口1.13億人,只占全國總人口的9%,平均每平方公里20人,遠遠低于全國平均的人口密度。根據以上數據的分類,可以將此次聚類數目設置為4類。根據聚類結果可以看出,聚類1中包含的省份有北京,天津,內蒙古,吉林,上海,海南,重慶,甘肅,青海,寧夏,新疆。未成年人口的初始數量在1000萬人和500萬人左右,并且在持續快速的增長。聚類2包括山東,廣東,河南,四川,初始未成年人口數量在8000萬人左右,并且增長速度穩定較緩慢。聚類3包含河北,江蘇,湖北,湖南,初始未成年人口數量在5000萬人左右,無明顯的增長。聚類3包含陜西,云南,貴州,廣西,安徽,福建,黑龍江,遼寧,初始未成年人口數量在4000萬人左右。

通過對數據的預處理、數據的聚類分析之后,我們對2005到2016年之間人口的增長狀況有了全面的把握,不僅可以較為科學合理的預測出人口增長的大致趨勢,也可以了解到各個地區的人口增長特點。運用數據挖掘中聚類的分析方法,我們將各個省份近幾年的未成年的人口增長方式進行分類,將中國的未成年的人口增長方式分為了5類。對于人口基數大,并且人口平穩增長的城市,相關政府要合理控制人口增長速度,鼓勵本城市人口向外地發展,緩解城市內部由于人口過多,積壓而產生的社會矛盾。對于人口基數不大,人口增長緩慢的城市,政府應當積極出臺相關政策進行吸引,鼓勵外來人口進行務工,為外來人口提供較為舒適的居住環境和工資條件。同時對于教育問題,政府也需要根據未成年門口的變化趨勢,因地制宜,靈活運用教育政策,促進未成年人教育的高效發展,同時國家應完善法律法規,健全未成年人權益保護制度;父母應履行家庭保護的職責和撫養義務,教育、引導未成年人;學校應全面貫徹國家教育方針,保證未成年人的身心健康和全面發展;社會為未成年人健康成長提供良好的社會環境;青少年自身增強自我保護意識,掌握日常生活中自我保護的方法和技巧。

參考文獻:

[1]馮守平.中國人口發展預測模型的構建與應用[J].統計與決策,2010,(15):24-27.

[2]柳德江,殷鳳玲,唐紅燕.玉溪市未來人口預測三種模型的分析[J].中國人口•資源與環境,2011,(3):17-19.

[3]龍承星,張波.昆明市人口預測模型研究[J].云南民族大學學報:自然科學版,2011,(7):258-261.

[4]趙沙,張福平.西安市未來人口規模預測及人口發展對策研究[J].干旱區資源與環境,2012,(2):7-12.

[5]沈巍,武鑫.基于數據挖掘的北京市人口增長影響因素研究[J].中國人口•資源與環境,2013,23(S2):470-473.

作者:王瑤 臧子雁 單位:北京物資學院