系統識別號 | U0002-1206201119285100 |
---|---|
DOI | 10.6846/TKU.2011.00378 |
論文名稱(中文) | 客戶屬性分組與個人信用風險評分卡模型之建構 |
論文名稱(英文) | A Comparison of Credit Risk Scorecards Using Different Attribute Classification Rules for Personal Loans |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 統計學系碩士班 |
系所名稱(英文) | Department of Statistics |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 99 |
學期 | 2 |
出版年 | 100 |
研究生(中文) | 張毓仁 |
研究生(英文) | Yu-Ren Chang |
學號 | 698650206 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2011-05-28 |
論文頁數 | 105頁 |
口試委員 |
指導教授
-
林志娟
委員 - 鄧文舜 委員 - 張慶暉 委員 - 林秋華 委員 - 蔡桂宏 |
關鍵字(中) |
信用風險評分模型 邏輯斯迴歸 正確率 吉尼係數 |
關鍵字(英) |
credit scoring model logistic regression AUROC gini coefficient |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
在實務的應用上,往往需要將連續型變數轉換成類別型變數,但如何在損失最少原始資料資訊的條件下,將連續型變數加以分組便成為很重要的課題,為了探討該議題,本研究採用等距與分量分組方法,將連續型變數各分成四組、五組及六組,本研究除了先以該銀行所提供的所有變數為考量的情況下進行模式建構,另外再分別以證據權數(weight of evidence, WOE)/訊息值(information value,IV)、逐步選取法、刪除異常變數、相關係數等四種方法來選取變數,並將這五種篩選出的變數組合使用邏輯斯迴歸來建立信用風險評分模型,最後則採用吉尼係數、AUROC與正確率這三種測量指標來對建構的三十種模型進行比較與評估。本研究實證結果顯示,等距分組方法比起分量分組方法有較好的區別能力。 |
英文摘要 |
Logistic regression model has been more commonly adopted by the credit card industry due to its interpretable feature in credit scoring. The main purpose of the research is to build a credit scoring model for personal loans with the logistic regression model using 2 different classification rules on attributes. Intuitively, equal-length and equal-proportion rules are adopted in this research to the group assigning. The features used are the original variables provided by the credit card department in Taiwan financial holding company. Taking the precision as well as parsimony into consideration, additional feature selections are performed using different criteria. It includes the stepwise procedure through the logistic regression model, weight of evidence/ information value, abnormal deletion and correlation coefficients criteria. The performance of the models are evaluated by population stability index and AUROC, area under the receiver operating characteristic, or equivalently, and gini coefficient. The empirical evidence supports that equal length classification rule outperforms the equal-proportion classification rule. |
第三語言摘要 | |
論文目次 |
目錄 第 一 章 緒論 1 1.1 研究背景 1 1.2 研究動機與目的 3 1.3 研究架構與流程 4 1.4 研究限制 8 第 二 章 文獻探討 9 2.1 信用風險評分卡相關模型 9 2.1.1 企業貸款信用風險評分模型 9 2.1.2 個人信貸評分模型 15 2.2 連續型變數資料分組 16 第 三 章 研究方法 18 3.1 客戶好壞定義 18 3.2 變數區隔及樣本抽樣 19 3.3 變數形成、分組與篩選變數 19 3.3.1 證據權數 21 3.3.2 訊息值 23 3.4 信用風險評分卡模型-邏輯斯迴歸模型 26 3.5 模型驗證 32 3.5.1 AUROC指標 32 3.5.2 吉尼係數 40 3.5.3 正確率 41 3.6 信用風險評分分數 43 第 四 章 實證分析 47 4.1 資料來源及說明 47 4.2 類別型變數分組情形 48 4.3 連續型變數分組情形 57 4.3.1 等距分組方法 57 4.3.2 分量分組方法 71 4.4 篩選變數 84 4.5 實證結果 89 第 五 章 結論與建議 100 參考文獻 103 表目錄 表2.1企業貸款相關文獻之研究彙整表 14 表2.2個人信貸相關文獻之研究彙整表 16 表3.1訊息值之經驗法則 25 表3.2以C為截斷點時,評分模型四種可能分類相關符號定義 35 表3.3評分模型四種可能分類結果 36 表3.4模型的區別能力 40 表3.5次數分類表 42 表3.6不同屬性及其信用風險評分範例 43 表4.1是否於9803月為循環戶違約與非違約分佈狀況 49 表4.2是否於9803月為有效戶違約與非違約分佈狀況 50 表4.3性別違約與非違約分佈狀況 50 表4.4婚姻違約與非違約分佈狀況 51 表4.5教育程度違約與非違約分佈狀況 52 表4.6卡齡違約與非違約分佈狀況 54 表4.7居住狀況違約與非違約分佈狀況 55 表4.8職業違約與非違約分佈狀況 56 表4.9等距四組之信用卡額度違約與非違約分佈狀況 58 表4.10等距五組之信用卡額度違約與非違約分佈狀況 59 表4.11等距六組之信用卡額度違約與非違約分佈狀況 60 表4.12等距四組之9803月餘額違約與非違約分佈狀況 61 表4.13等距五組之9803月餘額違約與非違約分佈狀況 62 表4.14等距六組之9803月餘額違約與非違約分佈狀況 63 表4.15等距四組之額度使用率違約與非違約分佈狀況 64 表4.16等距五組之額度使用率違約與非違約分佈狀況 65 表4.17等距六組之額度使用率違約與非違約分佈狀況 65 表4.18等距四組之年齡違約與非違約分佈狀況 66 表4.19等距五組之年齡率違約與非違約分佈狀況 67 表4.20等距六組之年齡違約與非違約分佈狀況 68 表4.21等距四組之年收入違約與非違約分佈狀況 69 表4.22等距五組之年收入違約與非違約分佈狀況 70 表4.23等距六組之年收入違約與非違約分佈狀況 71 表4.24分量四組之信用卡額度違約與非違約分佈狀況 72 表4.25分量五組之信用卡額度違約與非違約分佈狀況 72 表4.26分量六組之信用卡額度違約與非違約分佈狀況 73 表4.27分量四組之餘額違約與非違約分佈狀況 74 表4.28分量五組之餘額違約與非違約分佈狀況 75 表4.29分量六組之餘額違約與非違約分佈狀況 75 表4.30分量四組之額度使用率違約與非違約分佈狀況 76 表4.31分量五組之額度使用率違約與非違約分佈狀況 77 表4.32分量六組之額度使用率違約與非違約分佈狀況 78 表4.33分量四組之年齡違約與非違約分佈狀況 79 表4.34分量五組之年齡違約與非違約分佈狀況 80 表4.35分量六組之年齡違約與非違約分佈狀況 80 表4.36分量四組之年收入違約與非違約分佈狀況 82 表4.37分量五組之年收入違約與非違約分佈狀況 82 表4.38分量六組之年收入違約與非違約分佈狀況 83 表4.39變數之訊息值 85 表4.40勝算比估計表 86 表4.41近一年逾期次數之相關係數 87 表4.42五種變數組合彙整表 88 表4.43等距四組與分量四組結果比較(K=4) 90 表4.44等距五組與分量五組結果比較(K=5) 91 表4.45等距六組與分量六組結果比較(K=6) 92 圖目錄 圖1.1本文的研究架構圖 7 圖3. 1 邏輯斯函數的曲線圖 29 圖3. 2好客戶與壞客戶之機率分配與截斷點C之關係圖 37 圖3. 3 ROC曲線 39 圖4. 1是否於9803月為循環戶違約與非違約分佈狀況 49 圖4. 2是否於9803月為有效戶違約與非違約分佈狀況 50 圖4. 3性別違約與非違約分佈狀況 51 圖4. 4婚姻違約與非違約分佈狀況 52 圖4. 5教育程度違約與非違約分佈狀況 53 圖4. 6卡齡違約與非違約分佈狀況 54 圖4. 7居住狀況違約與非違約分佈狀況 55 圖4. 8職業違約與非違約分佈狀況 57 圖4. 9等距四組之信用卡額度違約與非違約分佈狀況 58 圖4. 10等距五組之信用卡額度違約與非違約分佈狀況 59 圖4. 11等距六組之信用卡額度違約與非違約分佈狀況 60 圖4. 12等距四組之9803月餘額違約與非違約分佈狀況 61 圖4. 13等距五組之9803月餘額違約與非違約分佈狀況 62 圖4. 14等距六組之9803月餘額違約與非違約分佈狀況 63 圖4. 15等距四組之額度使用率違約與非違約分佈狀況 64 圖4. 16等距五組之額度使用率違約與非違約分佈狀況 65 圖4. 17等距六組之額度使用率違約與非違約分佈狀況 66 圖4. 18等距四組之年齡違約與非違約分佈狀況 67 圖4. 19等距五組之年齡違約與非違約分佈狀況 67 圖4. 20等距六組之年齡違約與非違約分佈狀況 68 圖4. 21等距四組之年收入違約與非違約分佈狀況 69 圖4. 22等距五組之年收入違約與非違約分佈狀況 70 圖4. 23等距六組之年收入違約與非違約分佈狀況 71 圖4. 24分量四組之信用卡額度違約與非違約分佈狀況 72 圖4. 25分量五組之信用卡額度違約與非違約分佈狀況 73 圖4. 26分量六組之信用卡額度違約與非違約分佈狀況 73 圖4. 27分量四組之餘額違約與非違約分佈狀況 74 圖4. 28分量五組之餘額違約與非違約分佈狀況 75 圖4. 29分量六組之餘額違約與非違約分佈狀況 76 圖4. 30分量四組之額度使用率違約與非違約分佈狀況 77 圖4. 31分量五組之額度使用率違約與非違約分佈狀況 77 圖4. 32分量六組之額度使用率違約與非違約分佈狀況 78 圖4. 33分量四組之年齡違約與非違約分佈狀況 79 圖4. 34分量五組之年齡違約與非違約分佈狀況 80 圖4. 35分量六組之年齡違約與非違約分佈狀況 81 圖4. 36分量四組之年收入違約與非違約分佈狀況 82 圖4. 37分量五組之年收入違約與非違約分佈狀況 83 圖4. 38分量六組之年收入違約與非違約分佈狀況 83 圖4. 39等距與分量四組方法在五種變數組合下之吉尼係數比較 93 圖4. 40等距與分量五組方法在五種變數組合下之吉尼係數比較 94 圖4. 41等距與分量六組方法在五種變數組合下之吉尼係數比較 94 圖4. 42等距與分量四組方法在五種變數組合下之AUROC比較 95 圖4. 43等距與分量五組方法在五種變數組合下之AUROC比較 96 圖4. 44等距與分量六組方法在五種變數組合下之AUROC比較 96 圖4. 45等距與分量四組方法在五種變數組合下之正確率比較 97 圖4. 46等距與分量五組方法在五種變數組合下之正確率比較 98 圖4. 47等距與分量六組方法在五種變數組合下之正確率比較 98 |
參考文獻 |
參考文獻 中文參考文獻 [1]林建州(2000),銀行個人消費信用貸款授信風險評估模式之研 究,中山大學財務管理研究所碩士論文,高雄市。 [2]廖仁傑(2005),信用卡業務信用評分制度與模型之有效性研究 ,中央大學財務金融研究所碩士論文,桃園縣。 [3]謝有隆(2006),信用評分模型的建構與驗證,政治大學經濟學 系碩士論文,台北市。 英文參考文獻 [4]Altman, E. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. Journal of Finance, 23(4), 589–609. [5]Bailey, M. (2001). Credit Scoring:The Principles and Practicalities, Bristol:White Box Publishing. [6]Beaver, W. (1966). Financial ratios as prediction of failure. Empirical research in accounting: selected studies. Journal of Accounting Research, 4, 71–111. [7]Brill, J. (1998). The importance of credit scoring models in improving cash flow and collection. Business Credit, 100(1), 16–17. [8]Hand, D. J. & Adams, N. M.(2000). Defining attributes for scorecard construction in credit scoring. Journal of Applied Statistics, Vol. 27, No. 5, 2000, 527-540. [9]Hand, D. J., So Young Sohn & Yoonseong Kim. (2005). Optimal bipartite scorecards. Expert Systems with Applications, 29, 684–690. [10]Desai, V. S., Crook, J. N., & Overstreet, G. A. (1996). A comparison of neural networks and linear scoring models in the credit union environment. European Journal of Operational Research, 95(1), 24–37. [11]Ding, Y. Y., & Wilkins, D. (2006). Improving the performance of SVM-RFE to select genes in microarray data. BMC Bioinformatics, 7(S-2). [12]Fletcher, D., & Goss, E. (1993). Forecasting with neural networks: an application using bankruptcy data. Information and Management, 24(3), 159–167. [13]Makoto Matsumoto & Takuji Nishimura (1988). Mersenne Twister: a 623-dimensionally equidistributed uniform pseudo-random number generator. ACM Transactions on Modeling and Computer Simulation, Vol. 8, No. 1, January 1998, Pages 3–30. [14]Morrison, A. M. (2005). Receiver operating characteristic (ROC) curve preparation - a tutorial. Boston: Massachusetts Water Resources Authority. Report ENQUAD 2005. [15]Siddiqi, N. (2005). Credit Risk Scorecards: Developing And Implementing Intelligent Credit Scoring, John Wiley & Sons Inc. [16]Stein, R. M. (2005). The relationship between default prediction and lending profits: Integrating ROC analysis and loan pricing. Journal of Banking & Finance, 29, 1213–1236. [17]Sun, Z., Bebis, G., & Miller, R. (2004). Object detection using feature subset selection. Pattern Recognition, 37, 2165–2176. [18]Tam, K., & Kiang, M. (1992). Managerial applications of neural networks: the case of bank failure predictions. Management Science, 38(7), 926–947. [19]Van, G.T., Baesens, B., Suykens, J., Espinoza, M., Baestaens, D. E.,Vanthienen, J., & De Moor, B. (2003). Bankruptcy prediction with least squares support vector machine classifiers. Proceedings of the IEEE international conference on computational intelligence for financial engineering, Hong Kong, 1–8. [20]Zhang, G., Hu, Y. M., Patuwo, E. B., & Indro, C. D. (1999). Artificial neural networks in bankruptcy prediction: general framework and cross-validation analysis. European Journal of Operational Research, 116, 16–32. |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信