中小企業信貸評級和違約情況分析
時間:2022-05-18 11:58:02
導語:中小企業信貸評級和違約情況分析一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
[摘要]小微企業是國民經濟和社會發展的重要基礎,是創業富民的重要渠道,但由于中小微企業數據的可獲取性與可靠性較低,銀行及其他金融機構如何有效地為小微企業提供信貸融資服務是一個富有挑戰性且具有重要意義的課題。文章通過三種分類算法對中小企業的信貸評級和違約情況進行預測,運用經典判別分析和機器學習算法進行模型構建和比較,尋找信譽評級預測的最優模型,對數據相對缺少的中小企業信譽評估有一定借鑒價值。
[關鍵詞]信譽評級;信貸策略;中小企業;分類算法
1引言
在疫情期間,中小企業受到了巨大的沖擊,清華大學和北京大學于2020年2月關于995家中小企業聯合調研顯示,85%的企業撐不過三個月,67%撐不過兩個月,34%撐不過一個月。[1]市場避險情緒的加劇以及疫情對中小企業的影響會使信貸需求大幅增加。在此情形下,對企業數據不夠充足的中小企業資質和信譽評估就成了一大難題。關于企業信譽評級的建模方法,目前國內外學者主要使用Logistic回歸分析、[2]AHP模糊綜合評價法、[2]神經網絡算法等,[3]但仍存在精度較弱、程序復雜等問題。Hajek和Michalak(2013)綜合分析了世界范圍內的企業信用評級預測的建模算法,[4]包括經典統計方法和機器學習算法。Hajek和Michalak提到,經典統計模型的結果相對容易解釋,但是需要各種假設在理論上成立,而機器學習算法的預測能力更強。然而,在上述提及的研究中,模型的變量設置較為全面,包括流動比率、市凈率、總資產收益率、負債比率等公司金融數據,而對于本文提供的中小企業數據,變量類型存在局限性,且數據量較少。在這類問題上,文章優先使用經典統計方法進行建模分析,在此基礎上引入機器學習算法進行模型比較。
2數據來源與變量說明
文章在123家有貸款記錄和302家沒有貸款記錄的中小微企業數據的基礎上(包含2016年10月—2020年2月全部的進項發票和銷項發票信息),定義了四個變量以評估企業的信譽評級。
2.1盈利能力
盈利能力代表一家企業獲得利潤的能力。文章的盈利能力定義為銷項發票價稅總額減去進項發票價稅總額,并按季度取平均值,當企業的盈利能力取值為負數時,說明企業平均運營虧損。
2.2發展能力
發展能力代表一家擴大規模的潛在能力,文章的發展能力定義為企業每個季度的盈利環比增長率均值。
2.3還款潛力
還款潛力指企業償還債務的能力。文章使用每季度企業的平均盈利與企業的平均進項發票價稅合計之比代表企業的還款能力。2.4發票作廢率發票作廢率在一定程度上體現出企業是否健康合法運營,是銀行需重點關注的指標。文章中發票作廢率定義為企業每個季度的作廢發票占每個季度發票總和的平均比例。表1給出了上述變量的數據結構,前兩列為變量名和對應的字母代號。
3模型構建與分析
根據已有部分帶標簽的數據,需要對無信貸記錄標簽的企業進行是否放貸和信譽評級的兩步判斷。在處理二分類問題上,許多學者會優先考慮使用二元Logistic回歸模型。然而,James(2013)發現在處理分類結果很確定的問題時,Logistic回歸的估計結果可能不穩定。[5]他指出,當數據類較為離散時,線性判別分析不存在這一問題。因此,文章引入線性判別分析(LinearDiscriminantAnal-ysis,LDA),這也是一項分常用的分類技術。Fisher判別法是常用的一種線性判別法,該方法借鑒了方差分析的思想,將K組p維向量投影到某一個方向,使得它們投影后組與組之間盡可能地分開。該方法假定K個總體的協差陣矩陣滿秩且相等。
3.1是否放貸的判斷
對123家有信貸評級和違約記錄的企業按7∶3的比例進行訓練和測試。測試結果與測試集的原有標簽構建混淆矩陣,用于檢驗模型的預測效果。訓練得到的判別函數為:y1=-3.1989×10-09×PRO-1.1766×10-03×SOL+1.7192×10-03×POT+13.2854×INV(1)判別規則為:x∈Gl,若|y1-y—1≤i≤2i1|=min|y1-y—i1|l=1,2(2)當l=1時,G1代表給予貸款;當l=2時,G2代表不予貸款。模型效果如表2所示。準確率(Accuracy)=96.97%,真負利率(Specicity)=100%。對于測試集模型檢驗的結果,其準確度(Accuracy)高達96.97%,模型效果很好。然而,需要著重關注誤判的部分,因為錯誤地將不予貸款的企業識別為給予貸款與錯誤地將給予貸款的企業識別為不予貸款,兩種行為所造成的影響是不對等的,前者可能讓銀行因企業違約而面臨巨大損失。因此,對于此種不平衡的問題,借助一個新的指標———真負利率(Specicity)對模型結果進行判斷。由數據可知,真負利率為100%,說明該模型能很好地識別不予貸款的企業。即使在本模型中將一家本應該貸款的企業錯判為不該貸款,可能減少了相應的業務和利息收入,但卻準確地識別了不該貸款的企業,盡可能地避免了銀行面臨企業違約的風險。
3.2信譽評級預測
文章首先使用Fisher判別模型來進行預測,但該模型準確率只有50%,為進一步提升分類模型的性能,考慮放寬K個總體具有相同協差陣的前提假設,引入二次判別分析(QuadraticDiscriminantAnalysis,QDA),模型準確率提升為66.7%。在此基礎上,建立樸素貝葉斯分類器(NaiveBayesClassier,NBC),與現有的模型進行比較。樸素貝葉斯的一個重要假設條件是樣本屬性之間相互獨立。由圖1可知,變量之間的相關系數絕對值均低于0.3,呈現低度相關,基本滿足該假設條件。樸素貝葉斯分類器的原理是對于給定的待分類項,求解在此項出現的情況下其他各個類別出現的概率,哪個最大,就認為待分類項屬于哪一類別,概率計算公式為:最終樸素貝葉斯分類模型的準確度為72.2%,超過了Fisher判別和二次判別分析的50%和66.7%,因此推薦采用樸素貝葉斯分類器模型。
4結論與建議
商業銀行有著調節經濟的職能,面對中小企業的資金需求變化要提前掌握并早做準備,完成良好的風險預估。文章提供的模型能依靠銀行可收集有限的數據,在分類器得到良好訓練的情況下,進行初步的信譽評估,并建議銀行及時加入更多維的數據進行分析。在面對增加的資金需求和緊縮的信貸供給下,銀行也需要審慎地決定并及時地根據市場情況調整信貸策略,可加入專家的分析和判斷,發揮主觀能動性并綜合多角度對中小企業的信譽進行辨別。
作者:李文浩 付文強 吳易達 單位:華僑大學
- 上一篇:數字人民幣對商業銀行的影響
- 下一篇:小微企業金融服務提升策略