商業銀行大數據審計難點與對策
時間:2022-04-03 10:31:42
導語:商業銀行大數據審計難點與對策一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
(一)數據獲取難度大,大數據分析有時成為。“無米之炊”商業銀行內部審計大數據分析雖然起步較早,但受理論儲備和科技投入等因素的影響,普遍缺乏高效的數據分析接口,數據需求得不到有效滿足,審計部門常常面臨“無米下鍋”的窘境。一是數據來源系統雜。商業銀行信息化建設歷史較長,經過長期發展,各銀行均建立起龐大的信息系統。為迎合業務發展需要,許多商業銀行將系統建設職責按業務條線進行了劃分,而系統整合不夠充分,客觀上造成了系統林立而數據隔絕的問題。例如,大型商業銀行的系統數量可達千余個,涵蓋銀行各業務條線。由于受部門銀行等不利因素影響,各條線單獨采集和加工數據,部分系統間機構樹、客戶編碼等基礎數據還不統一,給系統間數據交互造成障礙。目前,大多數商業銀行都建立了企業級數據倉庫,但數據完備程度仍有待提升,新系統數據入倉速度也不能滿足審計時效的要求。二是數據類型樣式多。傳統數據分析方法主要是對結構化數據的分析。大數據理論豐富和普及了對數據類型的認識,將網頁、日志文件、搜索索引、社交媒體、電子郵件、辦公文檔、影音文件及傳感數據等多種類型數據都納入分析。商業銀行內部審計多年來在結構化數據采集和存儲方面積累了一定的經驗,但對非機構化數據的處理仍處于起步階段。三是數據安全影響大。商業銀行就像一架強大的數據加工機器,不但收集了客戶的多維度關鍵信息,也通過交易結算生成了海量行為數據。這些數據有的受到國際組織或他國監管機構關注,有的屬于我國政府監管重點,有的是銀行內部數據,敏感性強、受保護程度高。如歐盟《通用數據保護條例》(GDPR)被稱為史上最嚴厲的個人數據保護法,對觸犯法規的處罰上限是“兩千萬歐元或企業年度全球營業額的4%”,也會給企業聲譽帶來重大風險。從當前實踐來看,覆蓋數據采集、加工和應用全鏈條的數據安全機制還不夠完善,出于安全需要,商業銀行大多被動采取限制使用策略,數據需求普遍得不到充分滿足。隨著全社會數據安全意識的提升,數據獲取難度將不斷加大,一定程度上對數據使用產生了障礙。四是數據申請鏈條長。內審部門根據審計項目需要,常常需要分析不同業務條線、不同系統的數據。審計數據需求涵蓋范圍廣,時效性強。而現有數據申請機制,常常需要與業務部門、數據管理部門、數據加載部門和數據維護部門等多部門進行協商,溝通協調成本較高。即使審批通過,還需經歷數據采集、上傳、加載等技術流程,從數據申請到數據獲得耗時較長,缺乏一站式便捷的數據應用接口。五是數據存儲空間不足。從當前應用實踐來看,商業銀行內審部門主要采取兩種方式實現審計數據分析。一種是直接訪問數據倉庫。該方式的優點是數據通道相對貫通,數據獲取難度小,但出于安全性和效率性考慮,數據倉庫往往無法支持較多用戶同步訪問,系統并發任務受限,不能滿足審計業務需要。另一種是將審計需要的數據遷移至審計數據庫。該方式的優點是數據庫獨立,數據管理的自主性強,但也給審計部門賦予了本不擅長的數據管理職責。有的商業銀行審計數據庫達到幾百T的規模,由于存儲資源不充分,數據管理機制和手段不完善,該類審計數據庫時常面臨存儲結構不合理和存儲空間不足的問題。(二)原始數據不夠規范清晰,數據含義難以理解。商業銀行內部審計大數據分析一項顯著的特色就是可以從數據源頭著手分析,通過對未經加工和清洗的原始數據進行比對,找出問題疑點線索。應用這種數據分析方式,需要對原始數據有較深入的理解。而在當前數據的設計初衷、采集方式和服務流程等方面,均對數據的認識和理解存在不利因素。一是數據和業務不易對應。當今商業銀行信息化程度之高,各類業務鮮有不通過信息系統管理和作業的。在這一發展態勢下,銀行的各類業務都在系統中留有痕跡,有具體的數據體現。國外大型咨詢公司曾估算,銀行每創收100萬美元,平均產生820GB數據,數據量級高居各行業之首。但長期以來,有的商業銀行系統建設重開發、輕管理,存在不重視數據資產的傾向,數據管理不夠規范,從數據還原業務場景存在一定困難。二是數據間關系較難建立。按照關系型數據庫的設計規范,商業銀行數據庫通常遵從一定的范式要求,范式越高數據庫冗余越小。但范式要求會拆解原有數據的業務邏輯,審計數據分析過程中需要重建數據間關系,還原業務邏輯。而數據間關系的信息專業性較強,審計存在一定的技術障礙。三是數據字典難以獲取。數據字典是理解數據的重要文檔,因此,數據字典往往作為商業銀行的重要數據進行保管。各家銀行數據文檔管理的規范程度不同,有的商業銀行缺乏對數據字典的統一管理,版本更新也不夠及時。內部審計在獲取數據字典的過程中存在不小的困難。(三)數據分析能力與手段不足。數據應用是體現數據價值的關鍵環節。當前商業銀行內部審計無論在技術手段,還是分析結果方面,數據應用能力與水平都有較大的提升空間。一是數據分析方式方法比較單一。當前商業銀行內部審計主要采用傳統的SQL聯機數據分析手段。該數據分析方法往往從真實業務場景出發,分析違規業務的數據特征,通過賬表拼接和統計分析,按照業務規則和風險規律,揭示問題線索。該方法直觀性強,容易理解,但對業務規則的依賴程度較高。數據分析過程中,有時很難提出有針對性的業務規則,有時提出的規則準確性較低,由此造成SQL聯機數據分析的覆蓋面不全、準確性不高。目前,該方法仍然在商業銀行內部審計大數據分析中扮演重要角色,分析技術難以取得顯著突破。二是數據分析技術在內部審計方面的應用場景缺乏。基于數據挖掘和深度學習理論的大數據分析技術,以概率論為基礎,重視對事物相關性的分析,在客戶營銷和風險管理等方面都有比較成熟的應用。但商業銀行內部審計以問題為導向,重視對普遍性和典型性問題的揭示。由于審計發現問題往往涉及責任人認定和處理處罰,客觀要求問題指向的確定性較強,由此也影響了大數據分析技術在內部審計中的應用。三是數據分析結果精確性不足。當前商業銀行內部審計主要從業務特征入手開展數據分析,業務特征難以做到窮盡,許多業務特征也沒有具體的數據表現,因此審計部門往往只能在有限的業務范圍內,鎖定風險點的個別特征。這些特征有的屬于風險點的非充分特征,不能直接認定違規線索,由此推斷出的問題疑點精準性不高。
二、商業銀行內部審計應對大數據挑戰的策略
(一)建立審計大數據架構體系,實現數據可獲得。采集數據是大數據應用的第一步,也是開展大數據分析的基礎。貫通高效的數據獲取途徑,建設多層次、多維度數據架構,是大數據應用成功與否的核心(見圖1)。一是以原系統數據為基礎,滿足臨時性數據需求。審計大數據必須打通與原系統數據的通道。審計數據分析非常注重對原汁原味數據的挖掘,一是因為原系統數據沒有經過清洗,更能體現業務的貌;二是審計的靈活性決定了數據分析的不確定性,審計數據分析常常會對個別系統、個別數據進行臨時提取和分析。建立與原系統數據往來的“高速公路”,支持靈活、及時、便捷和高效的數據訪問,是審計大數據分析的基礎和保障。二是以數據倉庫為核心,解決審計數據分析業務覆蓋面的問題。數據倉庫存儲全行主要系統數據,并往往按照一定的業務邏輯進行清洗和加工。與數據倉庫建立高效的數據傳輸和訪問機制,能夠有效降低審計數據庫資源占用,提高數據組織效率。審計對倉庫數據的使用,也可以從運用的角度推動倉庫豐富數據來源,提升數據倉庫建設水平。三是以數據集市為抓手,滿足常規審計數據分析需求。在原系統和數據倉庫之上,建設不同主題的數據集市,每一主題下分別按照業務規則還原業務場景。大多數情況下,可以不再從原系統開始拼接數據,而是直接使用集市數據開展分析,降低了數據分析門檻,提高了數據分析效率。四是以外部數據為補充,擴展數據種類和來源。大數據環境下,數據的特點表現為大、多、廣。大就是數據量大,多是指數據種類多,廣則是指數據來源豐富。目前業內比較成熟的大數據應用,正是體現了數據廣的特點。比如,統籌客戶消費、信用、司法、海關、工商等多渠道信息,通過相互印證和比對,全面反映客戶狀態和質量,實現對客戶的完整畫像。廣闊的數據來源,為審計大數據分析提供了更多方向和可能。(二)搭建完善的模型體系,滿足數據可理解。模型是商業銀行大數據分析的主要抓手。多層次、多維度的審計模型體系,體現了內審部門對商業銀行業務風險的理解和認識。模型體系是否完善,決定了審計數據分析的能力和水平。按照使用場景的不同,審計模型可分為基礎模型、分析模型和特征模型三類(見圖2)。一是利用基礎模型,重現業務場景。基礎模型是審計模型體系的基礎,通過重現業務場景,在審計數據分析中發揮前端和接口作用,模型結果主要存放在數據集市中。系統建設往往涉及多個模塊和環節,對每一節點數據的理解常常分散于各開發人員,審計人員在審計項目有限的時間范圍內,很難對原始數據形成深入理解。建設基礎模型,就是在原始數據之上,通過梳理表間關系、字段含義,還原業務鏈條,重現業務場景,建立可理解程度高的中間數據模型,供各類數據分析場景使用。二是利用分析模型,展現業務短板和經營風險。分析模型是在基礎模型之上,建立對某一機構、某一產品或某一客戶的多維度分析。分析模型可以體現業務的發展脈絡和未來趨勢,也可以展現業務的集中程度和分布規律,還可以與某一標準進行比對,查找過度和差距。分析模型通常思路相對固定、編碼相對成熟,審計分析模型也可以借鑒業務部門的經驗,通過逐步積累,豐富分析維度,實現對機構、產品和客戶的全覆蓋。該類模型對制定審計計劃、確定審計重點都是非常重要的參考。三是利用特征模型,鎖定問題線索。特征模型是針對某一業務風險點的具體分析。特征模型的編制主要來源于審計業務實踐,如制度文件、審計案例等。特征模型的結果直接指向具體審計樣本。與分析模型主要解決面和線的問題相比,特征模型更加注重對點的分析。特征模型的豐富與否,體現了審計對業務風險的刻畫能力。(三)采用多種分析手段,達到數據可運用。魔高一尺,道高一丈。在傳統審計數據分析思路和手段逐步透明化的背景下,沿用傳統方法發現審計疑點線索的難度正在不斷加大,迫切需要豐富審計數據分析手段,通過維度變化揭示舞弊和違規。一是通過統計匯總,實現歷史數據積累。對成熟的特征模型,實現定期自動運行,形成區分時段和時點的風險特征線索。對線索記錄進行累積,直觀展示違規數量、金額等量化指標,展現特征的集中程度,反映業務風險的聚集水平。二是通過大數據分析技術,發現數據背后隱藏的相關性規則。傳統的審計數據分析,主要是從業務實際出發,梳理業務規則,首先完成業務建模,再根據業務模型的數據映射,通過數據關聯和拼接,完成數據建模。當前應用比較廣泛的大數據分析技術與此相反,往往從數據特征出發,將數據特征投入成熟的算法,首先形成數據模型,再憑借業務經驗對模型結果進行解讀,提煉業務模型。大數據分析技術與傳統方法相比,主要依靠數據說話,能夠挖掘業務數據的深層規律,從而發現傳統方法難以鎖定的問題,揭示非常規風險。三是通過可視化技術,直觀展示分析結果。多種數據類型、多個數據來源渠道納入審計數據分析范圍,必然帶來分析結果的多樣化,也會帶來結果數量的膨脹。審計數據分析的目的是面向應用的、不直觀、不易理解、數據量龐大的結果數據,一定會影響疑點線索的應用。可視化分析技術是以可視技術和自動化分析技術為核心,支持對大規模復雜數據進行分析的技術方法。可視化的自動建模技術將大數據以直觀的圖形形式展示,審計人員可以直觀發現數據背后的信息。因此,審計數據分析應有效引入文本可視化、網絡可視化、時空數據可視化、多維數據可視化等多種技術,打通數據的最后一公里,提升分析結果的直觀性,促進分析結果的有效應用。
總之,對商業銀行內部審計來說,大數據是一種技術,也是一種模式,更是一種思想。大數據浪潮滾滾而來,涉及商業銀行的方方面面,內審部門除技術層面外,還要從組織方式、工作模式、業務流程和人員構成等多個方面主動變革,適應未來審計業務發展的需要,進一步發揮內部審計在商業銀行經營管理、風險合規和績效發展等多方面的獨特作用。
作者:曹軼 單位:中國農業銀行股份有限公司審計局
- 上一篇:政策性銀行經營效率研究
- 下一篇:商業銀行內部審計增值路徑