高校數(shù)據(jù)中臺建設(shè)方案設(shè)計(jì)探討

時(shí)間:2022-03-01 10:24:04

導(dǎo)語:高校數(shù)據(jù)中臺建設(shè)方案設(shè)計(jì)探討一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

高校數(shù)據(jù)中臺建設(shè)方案設(shè)計(jì)探討

摘要:高校數(shù)據(jù)呈現(xiàn)多元化狀態(tài),應(yīng)用場景不斷被多樣化、碎片化、即時(shí)化的輕量級微服務(wù)解耦,業(yè)務(wù)部門要求實(shí)現(xiàn)跨平臺、跨部門協(xié)同辦公,提供高效的數(shù)據(jù)挖掘、分析與決策服務(wù)。傳統(tǒng)數(shù)據(jù)中臺無論從數(shù)據(jù)質(zhì)量、體量還是供給方式上均不能滿足需求。針對存在的問題,設(shè)計(jì)了新型的數(shù)據(jù)中臺方案,提出構(gòu)建采集數(shù)據(jù)、治理數(shù)據(jù)、發(fā)布數(shù)據(jù)、管理數(shù)據(jù)、分析數(shù)據(jù)五類能力,形成數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)資產(chǎn)、知識庫、數(shù)據(jù)處理和分析、制度規(guī)范五個體系,為解決數(shù)據(jù)的管、通、統(tǒng)三類核心問題和實(shí)現(xiàn)數(shù)據(jù)的全生命周期治理提供了一種新的解決思路。研究成果在一定程度上豐富了智慧校園研究內(nèi)容,也可為高校信息化建設(shè)提供一定的理論參考和方法借鑒。

關(guān)鍵詞:數(shù)據(jù)中臺;數(shù)據(jù)治理;數(shù)據(jù)倉庫;數(shù)據(jù)服務(wù);數(shù)據(jù)挖掘

隨著智慧校園的不斷發(fā)展,高校數(shù)據(jù)呈現(xiàn)多元化的狀態(tài),各業(yè)務(wù)部門對數(shù)據(jù)的需求從原來單純的業(yè)務(wù)管理轉(zhuǎn)向數(shù)據(jù)分析決策與判斷,原來面向單一部門內(nèi)部的管理轉(zhuǎn)向跨部門的流程服務(wù),對實(shí)現(xiàn)數(shù)據(jù)互通、流程跨部門推進(jìn)的需求越發(fā)突出[1-2]。此外,在大數(shù)據(jù)背景下,數(shù)據(jù)隱私與安全越發(fā)重要[3]。因此,傳統(tǒng)數(shù)據(jù)倉庫、數(shù)據(jù)共享中心無論從數(shù)據(jù)體量、數(shù)據(jù)質(zhì)量還是供給模式上均已不能滿足高校當(dāng)下對數(shù)據(jù)深層次挖掘、分析利用的需求,嚴(yán)重阻礙和限制了智慧校園的推進(jìn)。鑒于此,本文有針對性地提出了高校數(shù)據(jù)中臺建設(shè)方案,解決數(shù)據(jù)管、通、統(tǒng)問題,形成從數(shù)據(jù)采集、清洗、治理、存儲、使用、管理等環(huán)節(jié)的閉環(huán),降低數(shù)據(jù)使用門檻,實(shí)現(xiàn)數(shù)據(jù)真正為教學(xué)、科研、管理、服務(wù)而服務(wù)。

1數(shù)據(jù)中臺建設(shè)現(xiàn)狀

數(shù)據(jù)中臺是一個體系,也是一種解決方案,可以被定義為一個集數(shù)據(jù)采集、融合、清洗治理、組織管理、智能分析為一體,將數(shù)據(jù)以服務(wù)方式提供給前臺應(yīng)用,以提升業(yè)務(wù)運(yùn)行效率、持續(xù)促進(jìn)業(yè)務(wù)創(chuàng)新為目標(biāo)的整體平臺[4]。數(shù)據(jù)中臺的概念最早由阿里巴巴公司于2015年提出,2018年各大互聯(lián)網(wǎng)公司紛紛提出中臺戰(zhàn)略并隨之進(jìn)行組織架構(gòu)的調(diào)整,將“中臺”的概念推向了高潮[5]。目前,國內(nèi)對數(shù)據(jù)中臺的研究趨于成熟,在互聯(lián)網(wǎng)、金融、電力、媒體等行業(yè)得到廣泛應(yīng)用[6-8]。高校由于受到自身業(yè)務(wù)需求的限制,應(yīng)用案例相對較少,但也取得了可觀的成績,如西安電子科技大學(xué)數(shù)據(jù)開放平臺、南京理工大學(xué)大數(shù)據(jù)分析平臺等。高等職業(yè)類院校起步較晚,但是發(fā)展迅猛,特別是自2018年推進(jìn)整改工作以來,基本都已完成數(shù)據(jù)融合平臺和大數(shù)據(jù)分析平臺建設(shè),形成了較為科學(xué)、規(guī)范的數(shù)據(jù)標(biāo)準(zhǔn)體系,實(shí)現(xiàn)了數(shù)據(jù)的初步治理與沉淀,構(gòu)建了數(shù)據(jù)倉庫和共享數(shù)據(jù)中心,初步具備了數(shù)據(jù)中臺的規(guī)模。相比于國內(nèi),國外尚未推出數(shù)據(jù)中臺的概念,但是針對數(shù)據(jù)標(biāo)準(zhǔn)體系、數(shù)據(jù)治理、數(shù)據(jù)處理、數(shù)據(jù)服務(wù)等方面的研究相對成熟,廣泛地應(yīng)用于高校教學(xué)、科研、管理和服務(wù)。

2傳統(tǒng)數(shù)據(jù)中臺建設(shè)模式及存在問題

高校是數(shù)據(jù)產(chǎn)生、擁有和使用的主體,面對繁雜、異構(gòu)、字段內(nèi)容缺失、難以關(guān)聯(lián)和分析等數(shù)據(jù)問題,進(jìn)行了一系列數(shù)據(jù)融合、智慧校園基礎(chǔ)平臺、大數(shù)據(jù)分析與決策系統(tǒng)等項(xiàng)目建設(shè)。采用微服務(wù)架構(gòu),純B/S模式,建成了一站式網(wǎng)上服務(wù)大廳、統(tǒng)一身份認(rèn)證系統(tǒng)、主數(shù)據(jù)平臺、數(shù)據(jù)交換平臺ODI、API服務(wù)總線、大數(shù)據(jù)分析與決策系統(tǒng)。確定了數(shù)據(jù)源和目標(biāo),構(gòu)建了較為原始的集數(shù)據(jù)采集、轉(zhuǎn)換、清洗治理、存儲、管理、使用、展示為一體的數(shù)據(jù)中臺體系,基本上實(shí)現(xiàn)了信息標(biāo)準(zhǔn)化、服務(wù)一站化、業(yè)務(wù)流程化、數(shù)據(jù)模型化。但是,隨著智慧校園的不斷推進(jìn),應(yīng)用場景不斷被多樣化、碎片化、即時(shí)化,往往需要針對某一簡單場景快速上線和應(yīng)用,各職能部門需要實(shí)現(xiàn)跨平臺、跨部門協(xié)同辦公,對數(shù)據(jù)的使用需求和分析決策需求越發(fā)明顯。此外,移動化的普及對使用習(xí)慣的改變也催生了移動化辦公的轉(zhuǎn)變。這些不斷產(chǎn)生和變化的需求對智慧校園體系提出更高的要求。而反觀現(xiàn)有數(shù)據(jù)中臺體系顯然不能滿足需求,由于種種原因并沒有實(shí)現(xiàn)平臺價(jià)值的充分利用,存在諸多問題,歸納總結(jié)如下。1)數(shù)據(jù)中心黑盒運(yùn)行,技術(shù)要求高,部門要數(shù)據(jù),操作復(fù)雜。2)數(shù)據(jù)維度缺少,只考慮數(shù)據(jù)交換,數(shù)據(jù)價(jià)值未充分利用。只有結(jié)構(gòu)化數(shù)據(jù),忽視了非結(jié)構(gòu)化數(shù)據(jù)。3)數(shù)據(jù)資源分散,師生重復(fù)填表。大量線下數(shù)據(jù)無法流動共享,數(shù)據(jù)來源缺乏權(quán)威。4)數(shù)據(jù)質(zhì)量缺乏保障,難以為領(lǐng)導(dǎo)決策提供可信數(shù)據(jù)支撐,難以支持?jǐn)?shù)據(jù)統(tǒng)計(jì)、分析,難以支持復(fù)雜的跨部門業(yè)務(wù)協(xié)作。

3高校數(shù)據(jù)中臺方案設(shè)計(jì)

數(shù)據(jù)中臺不是一個跨時(shí)代的全新理念,其建設(shè)基礎(chǔ)依然是數(shù)據(jù)倉庫和數(shù)據(jù)中心。為此,本文針對傳統(tǒng)數(shù)據(jù)中臺存在的問題,采用大平臺、微服務(wù)的智慧校園架構(gòu),提出更優(yōu)的高校數(shù)據(jù)中臺解決方案。目的在于實(shí)現(xiàn)全局?jǐn)?shù)據(jù)服務(wù)能力統(tǒng)一供給,充分支撐智慧校園體系中的各類信息化服務(wù)綜合應(yīng)用和數(shù)據(jù)分析挖掘的需求。同時(shí)為解決數(shù)據(jù)的管、通、統(tǒng)3類核心問題提供理論依據(jù)和方法借鑒。其設(shè)計(jì)方案如圖1所示。圖1數(shù)據(jù)中臺體系·02·1)數(shù)據(jù)源層涵蓋高校常見的各類數(shù)據(jù)源,包括關(guān)系型DB、文本文件、syslog日志、二進(jìn)制日志等數(shù)據(jù),實(shí)現(xiàn)線上業(yè)務(wù)數(shù)據(jù)、線下業(yè)務(wù)數(shù)據(jù)、智能設(shè)備數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)的全量提取,在物理層面形成一個大的數(shù)據(jù)集。2)數(shù)據(jù)采集、處理層以需求為驅(qū)動,以數(shù)據(jù)多樣性的全域思想為指導(dǎo),統(tǒng)一業(yè)務(wù)系統(tǒng)集成通道,確定人事、科研、學(xué)工、教學(xué)等數(shù)據(jù)唯一源頭,制定相應(yīng)規(guī)范制度,確保數(shù)據(jù)來源唯一性。遵循并完善現(xiàn)行數(shù)據(jù)編碼體系,基于Hadoop生態(tài)體系,采集和治理全業(yè)務(wù)、多終端、多形態(tài)的數(shù)據(jù),解決各類數(shù)據(jù)在邏輯層面的統(tǒng)一。3)數(shù)據(jù)倉庫平臺層對異構(gòu)數(shù)據(jù)先進(jìn)行分類存儲、分類治理、源頭治理,溯源數(shù)據(jù)血緣關(guān)系、質(zhì)量關(guān)系,統(tǒng)一數(shù)據(jù)格式,再實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一存儲,在物理層面形成一個大的數(shù)據(jù)倉庫。對于原有數(shù)據(jù),抽取、清洗、治理后直接引入數(shù)據(jù)倉庫。4)數(shù)據(jù)治理輸出層構(gòu)建統(tǒng)一數(shù)據(jù)治理體系,涵蓋數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建、不同類別數(shù)據(jù)集成、數(shù)據(jù)質(zhì)量檢測規(guī)則和評分體系、以及配套的數(shù)據(jù)管理規(guī)范制度等內(nèi)容,實(shí)現(xiàn)數(shù)據(jù)的全生命周期治理,使得數(shù)據(jù)治理真正成為一個不斷循環(huán)和迭代的過程。5)數(shù)據(jù)應(yīng)用層構(gòu)建統(tǒng)一數(shù)據(jù)開放平臺,通過統(tǒng)一服務(wù)總線API接口供應(yīng)數(shù)據(jù)。程序通過API調(diào)用直接訪問到數(shù)據(jù)源中的數(shù)據(jù),無需本地再建數(shù)據(jù)庫,實(shí)現(xiàn)輕量級架構(gòu)。同時(shí),將不同來源、不同架構(gòu)的數(shù)據(jù)進(jìn)行統(tǒng)一的API封裝,屏蔽多數(shù)據(jù)源、多物理表、多查詢渠道、多出口供給的復(fù)雜性,實(shí)現(xiàn)數(shù)據(jù)與程序的松耦合架構(gòu),從而實(shí)現(xiàn)簡單應(yīng)用場景的快速開發(fā)與上線。此外,構(gòu)建數(shù)據(jù)庫體系和知識庫體系,真正降低數(shù)據(jù)使用門檻,為廣大師生、各業(yè)務(wù)部門、各級領(lǐng)導(dǎo)提供數(shù)據(jù)化、智能化的智慧校園服務(wù)。

4預(yù)期成效

本設(shè)計(jì)方案在傳統(tǒng)數(shù)據(jù)中臺體系基礎(chǔ)上,構(gòu)建了新的更優(yōu)的數(shù)據(jù)中臺體系,落地后應(yīng)實(shí)現(xiàn)5類能力和5種體系,分別是構(gòu)建采集數(shù)據(jù)、治理數(shù)據(jù)、發(fā)布數(shù)據(jù)、管理數(shù)據(jù)、分析數(shù)據(jù)5類能力;形成數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)資產(chǎn)、知識庫、數(shù)據(jù)處理和分析、制度規(guī)范5個體系。

5總結(jié)

以智慧校園建設(shè)為背景,分析了傳統(tǒng)數(shù)據(jù)中臺建設(shè)現(xiàn)狀與建設(shè)模式,針對存在的問題,提出新型的數(shù)據(jù)中臺解決方案,為解決數(shù)據(jù)的管、通、統(tǒng)3類核心問題和實(shí)現(xiàn)數(shù)據(jù)的全生命周期治理提供了一種新的解決思路。同時(shí),智慧校園建設(shè)應(yīng)構(gòu)建采集數(shù)據(jù)、治理數(shù)據(jù)、發(fā)布數(shù)據(jù)、管理數(shù)據(jù)、分析數(shù)據(jù)5類能力,形成數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)資產(chǎn)、知識庫、數(shù)據(jù)處理和分析、制度規(guī)范5個體系。降低數(shù)據(jù)使用門檻,為廣大師生、各業(yè)務(wù)部門、各級領(lǐng)導(dǎo)提供數(shù)據(jù)化、智能化的智慧校園服務(wù)。隨著5G網(wǎng)絡(luò)、物聯(lián)網(wǎng)絡(luò)、大數(shù)據(jù)、人工智能等技術(shù)的不斷發(fā)展、普及及應(yīng)用,數(shù)據(jù)中臺將會朝著數(shù)據(jù)更多樣、底層更智能、上層使用更簡單、應(yīng)用更豐富的方向發(fā)展,在不久的將來,必將迎來各行各業(yè)依托數(shù)據(jù)中臺進(jìn)行數(shù)字化轉(zhuǎn)型和構(gòu)建數(shù)據(jù)智能應(yīng)用的熱潮,而蓬勃發(fā)展的相關(guān)技術(shù)也將為數(shù)據(jù)中臺功能的完善與升級提供更多的可能性。

參考文獻(xiàn)

[1]李巍巍.?dāng)?shù)據(jù)中臺技術(shù)在業(yè)務(wù)系統(tǒng)中的應(yīng)用研究[J].現(xiàn)代信息科技,2019,3(21):108-110.

[2]畢強(qiáng),朱亞玲.元數(shù)據(jù)標(biāo)準(zhǔn)及其互操作研究[J].情報(bào)理論與實(shí)踐,2007,(5):666-670.

[3]CAIYH,LIY,QIUCY,etal.MedicalImageRe-trievalBasedonConvolutionalNeuralNetworkandSupervisedHashing[J].IEEEAccess,2019,(7):51877-51885.

[4]蘇萌,賈喜順,杜曉夢,等.?dāng)?shù)據(jù)中臺技術(shù)相關(guān)進(jìn)展及發(fā)展趨勢[J].?dāng)?shù)據(jù)與計(jì)算發(fā)展前沿,2019,1(5):116-126.

[5]鄧中華.大數(shù)據(jù)大創(chuàng)新:阿里巴巴云上數(shù)據(jù)中臺之道[M].北京:電子工業(yè)出版社,2018:4-33.

[6]孫建平.大數(shù)據(jù)服務(wù)賦能農(nóng)業(yè)銀行數(shù)字化轉(zhuǎn)型[J].農(nóng)銀學(xué)刊,2019(2):4-7.

[7]林鴻,方學(xué)民,袁葆,等.電力物聯(lián)網(wǎng)多渠道客戶服務(wù)中臺戰(zhàn)略研究與設(shè)計(jì)[J].供用電,2019,36(6):39-45.

[8]韓嫕,展祎萌,李義彪.電力物聯(lián)網(wǎng)多渠道客戶服務(wù)中臺戰(zhàn)略研究與設(shè)計(jì)[J].現(xiàn)代電視技術(shù),2019(6):90-93.

[9]辛慧娟,肖軍.基于NB-IoT技術(shù)的多傳感器數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)[J].微型電腦應(yīng)用,2020,36(12):35-37.

[10]王曉晗.基于Hadoop技術(shù)的遠(yuǎn)程教學(xué)智慧云平臺設(shè)計(jì)[J].微型電腦應(yīng)用,2021,37(11):90-93.

作者:呂忠亭 崔巍 劉洋 張婕 單位:延安職業(yè)技術(shù)學(xué)院 延安大學(xué) 物理與電子信息學(xué)院