大數據時代下統計學面臨的挑戰及建議

時間:2022-03-10 09:12:51

導語:大數據時代下統計學面臨的挑戰及建議一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

大數據時代下統計學面臨的挑戰及建議

摘要:傳統的統計學是因數據而生的,也是以研究數據為根本目的,傳統統計學有其獨特的數據收集、整理與分析的方法體系,也確實為我們研究數據帶來了便利,但是不得不思考的是在數據爆炸的信息時代,尤其是“大數據”概念產生以后,傳統的統計學如果不改變,又將如何應對大數據分析帶來的挑戰,該文將從零售行業的角度分析大數據為傳統統計學帶來的諸多挑戰。

關鍵詞:總體數據;相關性;個性化營銷;定制服務

隨著科技的發展,大數據已經成為信息時代的一場技術革命。大數據是指傳統數據庫管理工具難以處理的大量的、多樣化的數據。當前普遍認為大數據有3個特點:第一,數據量非常大;第二,數據增長速度非常快;第三,數據類型越來越多樣化[1]。零售業作為傳統的線下實體經營行業,積累了大量的消費者以及管理層的數據,如果依靠傳統的統計學模型對這些數據進行分析,很難得出可以用于企業經營管理的有效信息,加上年輕一代消費者越來越追求個性化,所以傳統統計學所采用的根據部分樣本推斷總體的分析方法已經無法滿足市場的個性化需求,因此,傳統統計學要想跟上時展的步伐,就必須做出與之相適應的改變。

1零售行業里大數據與傳統統計學的區別

維克多•邁克爾在《大數據時代》一書中提出了大數據思維的3個最顯著的變化:一是樣本等于總體。這與過去基于樣本進行統計分析的思維截然不同;二是不再追求精確性。在大數據中往往存在“噪音”和罕見事件,這樣的數據影響了結果的精確性;三是相關分析比因果分析更重要,在大數據時代我們將注意力更多地放在“是什么”而不是“為什么”[2]。大數據的以上特性在零售行業同樣適用,零售行業的大數據與傳統統計學的區別有以下3點。第一,大數據收集總體數據,而傳統統計學多采用抽樣的方式收集部分數據。傳統統計學在做統計分析時首先針對某一個問題提出假設,然后確定需要調查對象的總體,由于數據采集存在一定的難度,所以統計分析采取從總體中隨機抽樣選取一部分數據作為分析的對象,如此的話對隨機抽樣的方法與數據采集的準確性要求是非常高的。而大數據收集的是數據“總體”,在進行分析的時候不會人為進行假設,排除了人的干擾因素,僅僅從數據本身出發進行數據分析。在零售行業如果能運用大數據思維分析數據,從產生數據的顧客行為本身出發,針對不同顧客做出個性化營銷,而不是人為假設的話,管理層就可以根據數據進行預測,避免了主觀的經驗與直覺的判斷。沃爾瑪作為零售行業的巨頭,運用大數據分析得出的著名的啤酒與尿布理論可以證明這一點。第二,大數據注重個體行為的研究,統計學用樣本數據推斷總體行為。傳統的統計學采用抽樣調查的方式對樣本數據進行分析,用樣本推斷總體,那些在圖表上反映出來的異常數據被排除在外。大數據包容一切數據,其中包括各種結構化、半結構化、非結構化甚至是異構數據。對于零售行業而言,顧客的總體行為表現是沒有意義的,因為每個顧客的需求不同,在不同的時間和地點需要的商品都不同,只有根據每位顧客的不同行為進行個性化服務才能讓線下的零售行業有優勢可言。美國高檔連鎖百貨Nordstorm最近開始采用線下實體店客流分析服務供應商EuclidAnalytics公司的客流監測解決方案EuclidZero,基于用戶連接Wifi行為來獲取店內顧客手機的Mac物理地址并進行線下追蹤,由此可以通過單個顧客在百貨店里的行動路線和滯留時間,從而用于改善商品羅列與室內動線以及顧客個性化偏好與推薦服務[3]。第三,大數據注重數據之間的相關性,而傳統統計學更加關注數據分析的結果。從社會發展的角度來看,大數據對數據的關聯性分析更有助于零售行業管理層做出決策。對于傳統零售行業而言,線下的用戶體驗是非常重要的,如果能根據用戶行為數據分析出哪些商品放在一起能促進購買力,那么零售行業將會有更大的利潤空間,相比之下,統計學進行的結果分析顯得沒有那么重要。

2大數據在零售行業的優勢

邁克爾•舍恩伯格說:大數據發展的核心動力就是人類測量、記錄和分析數據的渴望。第一,大數據收集的數據是多樣化的、非標準化的,而統計學收集的數據都是標準化、結構化的,統計學無法對非結構化的數據進行分析與測量。但是在零售行業僅僅對標準化的數據進行分析做出的判斷已無法滿足行業的需求,通過對用戶在商品前滯留的時間以及與貨架上商品的互動行為產生的數據進行分析,從而調整貨架的位置才是主流。第二,大數據可以實時、快速監測與收集數據,而統計學收集數據時間長、難度高。大數據收集與處理數據的能力對于零售行業的供應鏈管理十分有效。零售市場可以利用大數據對庫存和員工行為進行監測,從而為管理層做決策提供依據。沃爾瑪為了提高大數據成果在不同部門之間的高效利用,并增加存貨管理和供應鏈管理的投入回報率,其開發了RetialLink工具。供應商使用該工具可以預先知道不同店鋪商品銷售和庫存情況,從而能夠在沃爾瑪發出指令前自行補貨,極大地減少商品斷貨,提高供應鏈的庫存水平[4]。

3傳統統計學面對大數據挑戰要做出改變

大數據的出現給我們的生活帶來了巨大的改變,甚至不同國家的政府都將大數據作為國家的戰略資源。相比之下,傳統統計學面臨著大數據的巨大挑戰,如果能根據自身優勢做出改變,傳統統計學仍然具有存在的價值。第一,改變數據的收集方式。統計學收集數據時前期要做大量的準備工作,需要耗費大量的人力物力成本,所以想要更加高效收集數據,就必須做出改變。由于大數據是基于互聯網收集數據的,所以對于不使用互聯網的地區和群體來說,大數據就顯得很無力,而傳統統計學可以在此基礎上發揮自身優勢,在以往的數據收集方式上進行創新。第二,傳統統計學在數據的分析思維上也要進行改變。傳統統計學不光要打破只能分析標準化數據的魔咒,更要著重分析問題的本質,而不是一味注重結果分析,雖然“是什么”很重要,但是一直以來探尋事物內在本質才是不斷推動人類社會進步的動力所在,所以統計學也要學會知道“為什么”。

4結語

信息技術的發展是無法想象的,我們無法通過今天來預測未來10年信息行業的發展。只有追上時代的腳步,做出順應時代潮流的改變,才能免遭淘汰,對于傳統統計學也是一樣,停留在原地不動是不明智的,改變才是世界的本質。而所有技術的變革都將反饋給人類的生活,讓人們和社會從中受益。

作者:吳興蔚 單位:河北省張家口市蔚縣第一中學

參考文獻:

[1]城田真琴.大數據的沖擊[M].人民郵電出版社,2013.[2]維克多•邁爾.大數據時代[M].浙江人民出版社,2013.

[3]李寶仁,鄭漢良,王瑩.大數據時代零售業統計的變革[J].經濟與管理,2015(3):39-43.

[4]趙巍偉.RETIALLINK數據抽取和處理工具的設計與實現[D].上海交通大學,2011.