智慧校園學生數據畫像生成方式

時間:2022-08-17 08:33:22

導語:智慧校園學生數據畫像生成方式一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

智慧校園學生數據畫像生成方式

摘要:近些年,大數據技術在我國逐步得到發展,并被社會的各個領域所應用,因此數據的價值深受關注。以海南經貿職業技術學院為例,學校在授課過程中,會生成許多有關學生的數據,因此,我們需要更多地考慮如何將這些數據升值為有利資源,為學生及學校相關部門所用。由此,本文基于Hadoop大數據平臺,對學生畫像存在的價值以及系統設計和研究思路進行了詳細分析,希望可以為相關研究人員提供參考。

關鍵詞:智慧校園;Hadoop;學生畫像;方式研究

數據技術具有低成本,高速度以及能夠大規模利用數據價值的特點,可以有效促進社會各個領域的發展?,F如今,各大學的數字化和計算機化建設基本上都已得到了完成,并且日趨智能化。隨之而來的各類數據也越來越多,這也包括海南經貿職業技術學院,學生在校期間生成了大量的數據群,例如消費數據、學業成績數據、圖書查看數據等各方面的數據,從各種角度進行研究,以了解學生的行為和喜好,為學生進行畫像以幫助學生全面客觀地了解自己,同時也有利于學生管理部門精確管理并幫助學生提高教育水平。

1什么是Hadoop技術

在大數據時代,無論是傳統的計算,還是傳統的數據存儲,都已經不能跟上現代化的腳步。Hadoop的逐步發展及完善,和Spark技術的問世,有效解決了大數據所面臨的各種問題。Hadoop可以說是一個統一的分布式計算,專門用于處理規模較大的數據,通過自動并行處理提供的MapReduce,自然可伸縮性,簡單的實現和強大的容錯能力等。提供分布式并行計算。它具有數據提取,轉換和加載以及離線數據處理的優勢。此外,Hadoop還與Sqoop,Flum和其他工具兼容。Sqoop是一種數據遷移工具,用于在MySQL與現有關系數據庫(例如Oracle,HDFS和Hbase)之間導入和導出數據。Flum提供高可用性和可靠的解決方案。它是一個用于大規模日志收集,聚合和傳輸的分布式系統,可以執行大規模流數據的分布式收集[1]。

2學生畫像所存在的價值

1)可以使數據中存在的孤島問題得到改善,促進信息的流通性。大數據人物畫像需要從學校的多個部門檢索學生數據,以保證建模的結果是準確有效的,并允許在不同部門之間可以共享數據。2)信息技術的合理應用,可以有效提升管理水平。通過充分利用學生模型,現代教育系統來進行計算機化,使教育決策更具有科學性,從而實現教育機構的高水平管理。3)探索基于學生畫像的新教學模式,對現有的教育體系進行創新及優化,可以有效提升教學質量;4)通過對學生畫像結果進行分析,可以捕捉學生獨特的人格特質,對學生進行準確的指導和幫助,并制定精確的實施策略,已達到對學生進行科學、有效、精確的管理工作。

3學生畫像的系統設計

3.1學生畫像系統功能需求

可以通過網絡從網頁訪問大數據驅動的學生畫像系統。該體系劃分為三個步驟:1)客戶端;2)服務器;3)數據庫模式。如圖1行為畫像構建步驟所示,學生在進入系統后,就會進行身份識別,對學生的各種數據進行總結和讀取,最終對學生的日常生活、學習成績等數據構建成不同時間段的報表,并為學生提供相應的指導和建議,就比如說,學生去圖書館借書,假如特別頻繁借書就會對學生進行獎勵或表揚,假如在學習或者閱覽等方面特別懶惰,就會對學生進行批評或者是提供相關好的建議。并反饋給輔導員或學生個人,進行談話戒備。通過該系統,我們希望為學生提供一個學生畫像系統,該系統集成了學術統計信息、信息請求和年終摘要[2]。

3.2學生畫像系統數據需求

程序數據十分重要,可以說是系統的心臟。想要對個人信息進行及時準確的處理與分析,那么系統就需要大量數據來完成和歸納個人信息,例如消費統計和分析,學校成績等。數據分為學生的生活中的基本數據、學生在平時學習中的表現所產生的數據等。數據通常都是以Excel表或csv文件進行展現,之后納入數據庫。數據總長度需要設置為100,以避免數據庫存儲異常。在進行數據采集過程中,會有一些異常的數據產生,例如一些不完整或是不準確的數據,這些數據有一個統一的名稱(臟數據)。對于臟數據,我們可以采取在分析數據之前先清理數據的方法。操作時,所有數據源都需要進行格式化轉換。數據清理十分重要,是必不可少的環節,結果的質量與模式效果和最終結論直接相關。在實際操作中,數據清理通常占掃描過程工作量的50%到80%,因此它也是運行整個配置文件系統的關鍵鏈接,在格式設置上需要謹慎[3]。

3.3學生畫像系統設計原理

1)需要遵循簡單的原理在進行數據處理過程中,也需要以簡單原理為基礎。這樣在獲取有用數據時,可以有效控制數據群的大小,提升數據質量。在實際工作中,您可以選擇特定的分析數據和適當的處理方法來執行簡單、有效的工作。2)確保清晰明了的原理所有事物的分析,都會有其結論產生。其結論必須清晰明了。假如在結論沒有明確的狀況下,這時所講的分析并不成立,也不具備任何意義,因為必須在進行分析之前需要對該結論進行尋找和驗證。3)數據要具有可靠性良好的分析應基于可靠的數據源。實際上,在許多情況下,數據收集會花費更長的時間,包括計劃和定義數據,調整數據報告以及允許開發人員正確提取或進行數據設置。在對良好數據進行分析只有一個目的,那就是尋求正確答案,所以所采集數據的精確性是其基礎,否則的話,就會適得其反。4)報告進行圖標體現應盡可能使用圖表體現數據。采用圖表來替換大量堆疊的數字,使用戶可以更生動、直接地面對所存在的弊端或者是做出的結論。另外,圖標雖然有很多好處,但是也不能過度使用。因為人在面對大量圖表示容易感到困惑。5)要具有思維邏輯邏輯性在報告中是十分重要的,除了需要具有邏輯性外,還需要具備三個步驟,那就是對問題的挖掘、分析和解決。具有較強邏輯性的分析報告也是具有說服力的。分析的結論應基于嚴格的分析和數據推理過程。6)要具有實用性編輯數據分析報告時需要認真仔細。要保證基礎數據不僅具有真實性還要具有完整性,在進行分析的過程中,一定要遵循科學、合理和完整的原則,分析結果必須可靠且包含內容要切合實際[4]。

4研究思路與方法

4.1進行數據收集

需要以學校當前的學術管理系統、教育管理體系、招生體系、注冊體系等為基礎,來進行學生基礎數據的獲取,例如學生在校期間的圖書閱讀數據、專業學習表現數據、上網信息等[5]。

4.2數據進行預處理

學生行為的數據,具有多元化及復雜性等問題,并不適用于對數據進行直接挖掘。為了獲得純粹,精確和完善的數據,首先需要處理數據。數據的清理主要是針對數據的完整性,統一性,合法性處理,從而獲得想要的干凈數據。數據合并是統一存儲和合并多個數據源。數據選擇涉及調整原始數據以減小數據大小。數據轉換是效特征值的獲取,也就是對數據進行歸一化和離散化等處理[6]。

4.3構建學生畫像模型

分析各種類型的學生數據,分析學生在各個角度產生數據的差別,并使用分類算法創建一個合理的標簽系統來構建大數據學生畫像模型。不同的標簽所體現的是學生特征或者是屬性,并且隨時間、區域、不同類型進行轉變。使用大數據算法,將學生行為管理和思想政治教育的概念和實踐相結合,進行預測模型的合理設計,學生畫像像系統的構建,并為學校生成學生思維動態和行為數據標簽,以幫助學校對學生的思想和行為進行實時掌握和規范,從而實現對教育進行精準化管理[7]。需要就當前存在的主要問題,合理使用相關的策略,從而推動分布式數據庫系統的開發進程,改善分布式數據庫系統的管理水平,明確工作重點,擴大應用價值。

參考文獻:

[1]王冰冰,彭海樓.Oracle分布式數據庫系統及網絡安全策略探究[J].數碼世界,2020(4):242.

[2]肖占軍,孔偉燁,艾宏巖.分布式日志結構數據庫系統的主鍵維護方法探析[J].數字化用戶,2019,25(19):84.

[3]莫新建.分布式數據庫系統的查詢優化技術研究[J].電腦知識與技術,2020,16(13):48-49.

作者:符龍生 單位:海南經貿職業技術學院