金融數據可視化應用和探索
時間:2022-07-13 09:08:20
導語:金融數據可視化應用和探索一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:隨著金融數據容量和復雜度的不斷提高,使得用戶對金融數據的分析和理解產生了一定的困難。進行金融數據可視化研究已成為金融市場的一個重要需求。本文基于Python可視化技術,進行金融數據可視化實例分析,并提出了金融數據可視化分析應用模式。文中實例生成對應的可視化圖形,用更直觀的方式對金融數據進行多維度展示并加以分析。研究結果表明,在金融數據分析中應用可視化技術可以讓研究人員和用戶迅速地洞察數據的內涵和價值,為進一步決策分析做出有利的技術支持。
關鍵詞:金融數據分析;可視化;Python;可視化庫;應用模式
1引言
目前,大數據技術已經覆蓋至社會生產和生活的各個領域,數據科學帶來了新一輪科技革命和產業變革的機遇。經濟金融領域是“數據金礦”。隨著大數據技術的發展,金融行業需要結合數據科學和金融業務進行創新,整合結構化和非結構化數據,挖掘和分析客戶的消費信息,預測客戶的行為和消費習慣,從而提高金融行業服務的效率。基于大數據技術,金融機構已在客戶畫像、精準營銷、業務審批、融資授信、風險防范和量化交易等領域取得較好的效果[1]。隨著數據科學和計算機存儲技術的發展,金融數據的產生和存儲量與日俱增[2]。在美國銀行(BankofAmerica,BOA)等一些金融機構中,每天都會處理成千上萬條的電子轉賬[3]。隨著這些金融基礎數據量的不斷增大,金融數據研究者和分析人員通過單純查看數據表格分析方式已經捉襟見肘。普通用戶想通過金融數據進行投資和理財分析更是一籌莫展。而可視化技術對于處理金融數據有著得天獨厚的優勢,可以幫助人們對海量、多維的金融數據進行分析,使得人們能夠以相對直觀快速的方式對數據傳遞的信息加以理解,進而為這些信息創造價值提供技術支持。本文主要研究可視化技術在金融數據的應用優勢,首先基于Python中的可視化庫對金融數據實例進行可視化設計,然后對可視化的結果進行進一步的研究分析。
2技術路線研究
2.1可視化技術研究現狀
面對海量、高維、多源和紛繁復雜數據的分析挑戰,可視化技術把數據挖掘技術、科學可視化、計算機圖形學和人機交互等方法結合起來,并將人眼作為一個并行處理器,利用人眼的模式識別能力和感知能力對數據進行交互的可視化表達以增強認知。把不可見或難以顯示的數據轉化為可以感知的顏色、符號、圖形等輸入。研究新的可視化方法和理論模型,利用新的用戶交互手段輔助其從復雜矛盾或不完整的數據中挖掘出的信息之間的關系和隱藏模式,從而為決策提供有效的支持[4]。隨著全球范圍內數據量劇增,數據可視化技術在生命科學、地理信息學、工業、軍事等各個領域得到了廣泛應用。近年來,它在網絡安全、金融和商業智能等領域的數據可視化也被大范圍應用,成為數據可視化中新的熱點。目前國外學術界與工業界都沿著面向實際數據庫、基于可視化的分析推理與決策、解決實際問題等方向發展。斯坦福大學提供了按需數據可視化Webinar[5]。在金融數據可視化領域,美國北卡羅萊納州立夏洛特分校的可視化中心開發了基于識別特定關鍵詞的電子轉賬數據可視化系統和構建了客戶信用風險分析系統RiskVA[6]。在國內學者的可視化技術研究中,劉芳等提出一種基于引力場聚類的金融數據可視化方法[7],形成清晰的可視化聚類結果,發現數據變化規律。陳偉等采用R語言實現了基于大數據可視化技術的信息系統AC審計方法[8]。孫遠波等利用疫情期間所發布的各階段疫情數據可視化作品[9],分析出疫情可視化設計的用戶分類、數據類型、特點和演化過程等。高莉莉等對中國知網(CNKI)檢索的文獻進行計量分析[10],運用Citespace軟件對檢索的相關文獻進行可視化分析,繪制科學知識圖譜。綜上所述,可視化技術的研究已經取得了一定的成果,并在各個應用領域進行了實踐。金融數據分析領域同樣需要可視化技術的幫助和支持。
2.2Python可視化庫簡介
Python是目前最流行的程序設計語言之一。由于其簡潔性和可擴展性,自2004年以來,使用率呈線性上升,目前已經穩定在編程語言前三名[11]。它的優勢在于擁有豐富的擴展庫,可以實現數據的可視化。常見的Python數據可視化庫以matplotlib庫和NumPy庫為基礎,還包括Pandas庫、Seaborn庫、Bokeh庫等。本文中重點使用了兩個基于Python的可視化庫,具體如下:(1)Matplotlib庫。Matplotlib是Python語言中可視化的基礎庫,具有十分強大和復雜的功能。它提供了一套和MATLAB類似的API,用戶可以調用函數實現快速繪圖和制表等功能。但相對而言,生成的可視化圖表缺少鮮明的特點。(2)Plotly庫。Plotly庫是一款開源的繪圖庫,主要使用js進行圖形繪制。實現過程中主要是調用Plotly的函數接口,底層實現完全被隱藏,便于初學者的掌握。而且生成的可視化圖表可操作性強,便于進行多維數據的復雜性分析展示。
3金融數據可視化應用實例
3.1金融數據分析
數據分析是數據科學的一個核心研究方向。它是指將收集到的各類數據,采用一定原則和技術手段,進行清洗、計算、分析、加工處理的過程。金融數據是在各項金融活動中產生的數據。在金融部門開展的金融業務中產生的數據既是對其自身經營狀況的客觀反映,也反映了國民經濟的宏觀和微觀運行。金融數據和金融數據處理具有自身的一些特征[12]。金融數據的數量巨大,信息來源廣泛,主要來自金融機構內部的數據、市場的數據和全社會的數據。本文實例中的數據集來源于中國人民銀行的調查統計司,屬于來自社會的數據。在金融數據可視化設計流程中,首先通過各種設備和技術手段采集相關的數據;然后將采集的原始數據進行數據預處理;接著進行可視化映射,把不同數據之間的聯系映射為視覺通道的不同元素;最后用戶可以從數據可視化結果中提取有用信息。
3.2Python可視化設計實例
本文以中國人民銀行調查統計司發布的2021年度中資大型銀行人民幣信貸收支表為例[13],進行金融數據可視化分析設計實例分析。其中數據的字段包括境內存款中的個人存款、單位存款、國庫定期存款和非存款類金融機構存款。
3.2.1可視化餅圖設計實例
餅圖或圓環圖是由面積大小不一或顏色填充的扇形組成的圓形圖表,主要用于顯示數據中各項與總和的比例。它可以用于快速展示數據中各項數據在整體數據中的占比情況。基于Plotly庫繪制餅圖使用Pie函數。繪制環形圖時,在Pie函數中設置控制環形中心空白大小的hole屬性即可完成。還有一類特殊的餅圖被稱為旭日圖,是可以對各部分構成進行進一步分析比對的可視化圖形,對數據的多維度、多層次分析很有幫助。現對2021年度中資大型銀行人民幣信貸收支表中一月數據進行可視化分析。把現有的數據進行預處理。首先用Plotly庫繪制境內存款四種情況數據進行可視化設計,對境內存款的情況進行一個概括分析。境內存款情況如圖1所示。從圖中直觀看到在2021年1月份,境內存款主要由單位存款、個人存款、非存款類金融機構存款和國庫定期存款構成。其中個人存款達到509,840.27億元,占比超過境內存款一半。單位存款的占比也較大,但相對于個人存款而言還存在一定的差距。非存款類金融機構存款所占的比例較小。而國庫定期存款占比非常小,幾乎可以忽略。這說明,從2021年的存款數據來看,個人用戶傾向于保守的投資理財方案,因此個人存款數量巨大。而單位存款占比相對較大,主要是限于目前經濟狀況的不穩定期,持保守態度,沒有進行大規模投入再生產,應該以活期存款的形式保持資金鏈的暢通。非存款類金融機構存款占比較小屬于正常現象,保有一定的存款額度,大筆現金流應該出現在投資領域。國庫定期存款占比非常小,是由于國家對各項發展的大力支持,支出較大,存款構成較小。接下來通過對境內存款中占比較大的個人存款和單位存款情況設計可視化圖進行對比展示。境內個人存款和單位存款對比旭日圖如圖2所示。從圖中可以看出,個人存款的數額大于單位存款。但在個人存款中,活期存款和定期存款數額差別不大,而單位存款中定期存款數額遠遠小于活期存款。這進一步驗證了圖1的分析結論,個人存款按保守的理財方案以定期存款為主;為了保持現金流的周轉,單位存款以活期存款為主。
3.2.2可視化直方圖設計實例
上文中,旭日圖對比了境內個人存款和單位存款的占比,這對于各構成部分的分層次對比一目了然。然而,為了更直觀地比較兩類存款相同構成部分的具體數值,本文基于Plotly庫設計個人與單位存款對比直方圖如圖3所示。從圖3中可以直觀對比單位存款和個人存款在活期存款、定期存款、結構性存款和保證金方面的具體數據。其中,除保證金外,個人存款的其他三個分支層次均大于單位存款。由此可見,對于多構成部分數據的直接對比分析,直方圖與旭日圖一起使用,更能說明問題的所在,使得這部分的數據分析和對比更為清晰明確,展示效果更容易被人接受和理解。
3.2.3可視化折線圖設計實例
折線圖將數據標注成點,并通過直線將點進行連接,可以清楚直觀地展示數據的增減趨勢。在Python中使用Plotly庫中的plot()函數可以繪制折線圖。本文設計2021年度境內存款折線圖如圖4所示,以用來研究2021年度境內存款的走勢和之間的關系。從圖4可知,全部四種類型的境內存款在2021年度均趨于平穩狀態,無大幅波動現象發生。其中,國庫定期存款最為穩定,是嚴格按照國庫管理的相關規定來執行的。非存款類金融機構的存款有輕微的波動,屬于金融機構正常投資理財的行為,說明本年度內不存在突現的大規模投資風潮。單位存款在2月份時有明顯下降,這與我國農歷新年單位發放年終績效獎金對應。其余時間相對平穩,說明年度的發展居于穩定狀態。春節假期后,個人生活和經濟狀態回歸常態,而相應的個人存款數額會在3月有所上升。因個人用戶群體基數較大,整體情況在一年中會出現一些小幅波動。
4結論
本文結合金融數據的特點,基于Python語言的可視化庫,以中國人民銀行調查統計司發布2021年度中資大型銀行人民幣信貸收支表為例,進行了可視化分析設計,分別從不同角度對2021年度的存款數據進行可視化展示和細致的數據分析。這些可視化設計和分析能夠使研究人員和普通用戶更直觀、快速地對金融數據進行分析和挖掘,以便得出有效的決策支持。綜上所述,本文對金融數據進行的可視化研究和探索具有較好的應用價值和實際意義。
作者:羅孟華 王可 單位:貴州財經大學大數據應用與經濟學院(貴陽大數據金融學院) 貴州財經大學信息學院
- 上一篇:經濟視角德法課程教學研究
- 下一篇:企業業財融合角度財務轉型方式