統計數據質量提升分析
時間:2022-04-08 10:19:43
導語:統計數據質量提升分析一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:近幾年以來,我國的民營經濟發展速度不斷加快,并逐漸成為國民經濟體系的重要組成部分,所以在對國民經濟的發展進行研究時,必須深入研究民營經濟的統計工作。但是,根據我國的部分民營經濟官方統計數據顯示,其中存在許多失真的現象,不能對我國的國民經濟發展起到良好的借鑒作用。因此,本文對民營經濟統計數據工作現狀展開了深入分析,并提出了數據挖掘技術的應用策略。
關鍵詞:數據挖掘;民營經濟;統計數據;質量
在大數據技術快速發展的推動下,大數據時代逐漸來臨,人們越來越重視數據的價值。通過采用數據挖掘技術,能夠從海量的信息數據中挖掘出比較具有價值的信息,所以必須保證統計數據的質量合格,才能對挖掘信息起到至關重要的決定性作用。對于政府統計工作而言,民營經濟統計數據質量影響著政府統計部門的公信力以及整體信息。隨著社會主義市場經濟的快速發展,政府部門在日常工作事務中越來越注重使用統計數據。但是,在使用官方統計數據時,其質量很容易受到社會公眾以及媒體的質疑,認為民營經濟統計數據中存在失真信息。為了有效提升民營經濟統計數據質量,必須加強研發全新的數據挖掘技術,才能改善質量低下的問題,滿足使用者的需求。因此,數據挖掘技術對于提升民營經濟統計數據質量起到重要作用。
1民營經濟和統計數據質量的概述
目前,學術界對于民營經濟的研究仍然處于初級階段,沒有形成相對統一的觀點,其中比較普遍的觀點認為:“民營經濟屬于國有和國有控股、集體控股、外商以及港澳臺商獨資和控股經濟組織,民營經濟體系中的重要組成部分為私營企業、個體工商企業以及農民專業合作社。在民營經濟體系中,有私營企業以及個體工商戶兩大重要部分。”而統計數據質量,主要受到多方面因素的影響,其中的主要評判標準為實用性、準確性、及時性、可解釋性以及銜接性等等。具體而言,統計數據質量主要從準確性、適用性、可比性、可獲得性以及時效性等各個方面來進行評判。
2當前我國民營經濟統計數據質量的主要現狀
目前,我國政府每年都要對外公布大量的民營經濟統計數據,這些統計數據和人們的日常生活存在密切相關的聯系,對于民營經濟決策和得出結論具有不可或缺的作用。但是在我國民營經濟統計數據工作中存在許多復雜的現象,所以造成了各種問題。2.1當前民營經濟統計數據存在失真現象。目前,社會公眾以及媒體普遍了解民營經濟統計數據存在失真的現象,例如:部分地方的GDP增長速度已經逐漸超過全國,GDP總量逐漸大于全國。而這一民營經濟統計數據就存在嚴重的失真現象,主要原因在于缺乏完善的統計制度。而且在部分地區的統計部門工作中,在民營經濟統計數據時,沒有設定專門的統計負責部門,完全把各個行業的民營經濟統計數據工作指派為相應的行業部門負責,然后在調查隊以及統計組和數據統計完成之后,再通過各級政府部門向上通報。而許多地方政府為了節約人力、物力和時間,沒有進行數據統計工作,完全以虛假數據上報,所以造成民營經濟統計數據中存在失真的現象,無法保證統計數據質量。2.2各個地區的民營經濟統計指標存在偏差,無法使統計數據準確銜接。從整體層面上來看,在我國的各個地區民營經濟統計中沒有形成統一的指標,也沒有專門設定相應的部門來進行民營經濟統計,所以就導致各個省市在統計民營經濟數據時,缺乏完善的參考標準,分別按照自身的實際情況來進行統計,所以就造成各個地區的民營經濟統計數據缺少可比性,無法使統計數據形成準確銜接。例如:在湖北省的民營經濟統計數據工作中,工商局、工商聯以及中小企業局等幾個部門都負責民營經濟管理工作,但是市級的民營經濟統計卻由中小企業主管部門來進行控制。正是由于各個部門的概念模糊不清,沒有形成統一的統計標準和統計體系,所以對湖北省的民營經濟統計工作以及科學決策造成較為不利的影響。2.3民營經濟部門配合統計工作缺少積極性,隨意申報各項數據。隨著大數據時代的來臨,民營經濟統計數據不斷增多,這也就造成民營經濟統計工作任務的負擔不斷加重,如果仍然通過統計部門和政府部門來開展工作,將會導致工作效率降低,必須充分調動民營經濟實體的工作積極性。然而在民營經濟統計工作中沒有制定完善的法律法規約束,其完全要求民營經濟實體按照義務的要求進行統計工作,導致許多統計部門缺少工作積極性,喜歡隨意敷衍了事,隨意申報各項數據,這也就導致民營經濟統計數據不夠準確。
3數據挖掘技術對民營經濟統計數據質量的提升作用和應用策略
3.1微觀層面的應用。由于我國民營經濟體系存在的對象比較廣泛,各個對象的規模都不一樣,而且在分布范圍上比較廣泛,所以在開展民營經濟統計工作時具有較大的難度。因此,為了提升民營經濟統計數據質量,筆者針對數據挖掘技術的應用作用展開了深入分析。3.1.1識別孤立點。在應用數據挖掘技術時,首先需要明確孤立點,也就是數據集合中和許多普通數據存在不一樣特征的數據。因此,在挖掘數據的孤立點時,需要同時提供n個數據點或對象幾何,然后在集合中挖掘發現預期孤立點m,并且及時發現和剩余數據存在顯著差異的數據對象,這m個數據對象都屬于孤立點。在應用數據挖掘技術對孤立點進行挖掘時,可以采用基于統計、距離、密度、偏離、粗糙集以及聚類的多種不同方法,或者應用人工神經網絡的方法。在挖掘民營經濟統計數據的孤立點時,其中包含的數據內容比較龐大,所以在政府機構人員收集數據工作時,無法進行一一核實,必須在一次篩選的過程中,把差異性孤立點數據準確篩選出來,把許多無效的數據剔除出去,才能得到更加真實的原始數據。所以可以應用聚類分析的方式,來分析民營經濟統計數據的孤立點,這樣能夠減少工作量。3.1.2替代缺失數據。在大數據中的缺失數據主要指的是集中部分記錄的屬性值丟失以及空缺,這些屬性值反映了缺失信息。在我國的民營經濟統計數據中存在大量的信息數據,但是缺少完善的記錄制度,所以很容易提交空白數據或虛假數據,從而影響了數據統計結果的準確性以及真實性。因此,為了替代民營經濟統計數據中的缺失數據,可以采用單值替代、回歸替代以及類均值替代等多種方式,才能獲得準確的替代結果。3.2宏觀層面的應用。我國的許多地方統計部門在對民營經濟統計數據進行處理以及分析的過程中,通過應用數據挖掘技術,能夠提高操作效率和數據處理速度。因此,需要從這樣幾點入手,才能獲得準確的分析、預測結果。第一,加強應用關聯規則。在事務數據庫中把不同事務的屬性表現出來,然后把這些事務的關聯規律找出,從中深入挖掘隱含信息,這樣能夠快速匯總出和行業存在關系的數據信息,從而消除空白數據和虛假數據。第二,應用決策樹。其主要通過構建分類、聚類以及預測模型,能夠利用決策樹來綜合分析和預測民營經濟統計數據,從而獲得準確的預測、統計結果。
4結語
總而言之,在我國社會現代化改革發展的過程中,為了促進社會經濟穩定可持續發展,必須加強利用數據挖掘技術等先進的技術,以此來確保民營統計數據質量,創造良好的社會經濟效益。
參考文獻:
[1]柯芳.基于數據挖掘技術的提高民營經濟統計數據質量研究[J].經濟論壇,2017,(6):141-144.
[2]辛金國.基于數據挖掘技術的統計數據預處理研究[J].JournalofDataAnalysis,2013,8(5):55-65.
[3]辛金國,柯芳,李紹君等.數據挖掘技術在浙江省經濟統計中的應用[J].統計科學與實踐,2009,(4):31-33.
作者:萬金 單位:河南駐馬店市統計局
- 上一篇:統計管理體制與企業統計研究
- 下一篇:機電一體化鉗工技能訓練研究