淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-0202201505055300
中文論文名稱 運用資料探勘於銀行業潛在顧客預測模型之研究
英文論文名稱 A Study of Applying Data Mining for Potential Customer Prediction Model in Banking Industry
校院名稱 淡江大學
系所名稱(中) 資訊管理學系碩士班
系所名稱(英) Department of Information Management
學年度 103
學期 1
出版年 104
研究生中文姓名 吳思葦
研究生英文姓名 Sih-Wei Wu
學號 601630402
學位類別 碩士
語文別 中文
口試日期 2014-12-19
論文頁數 61頁
口試委員 指導教授-戴敏育
委員-翁頌舜
委員-施盛寶
中文關鍵字 資料探勘  顧客關係管理  分類  特徵選取  不平衡資料集 
英文關鍵字 Data Mining  Customer Relationship Management  Classification  Feature Selection  Imbalance Data 
學科別分類
中文摘要 對於各金融機構而言,顧客為企業最珍貴的資產。然而,銀行要如何運用顧客關係管理與行銷手法,將有限的資源發揮最大的效益,那準確的選取潛在顧客則是相當重要的。故本論文目的為利用資料探勘之技術,建置目標顧客預測模型,以找出潛在顧客。

本研究設計為三階段,分別探討資料前置處理、特徵挑選與模型建置。我們針對不平衡資料集使用6種抽樣比例,並利用3種特徵選取法搭配4種分類演算法來建置模型,最後比較其模型效力。

實驗結果顯示,樣本抽樣比例的設定強烈影響分類預測的效果。而分類預測效果最佳之模型是在3:7樣本抽樣比例下,使用R-Square特徵選取法搭配Tree分類演算法。本研究貢獻為建立一套應用於金融業挖掘潛在顧客之模型的研究方法,並可利用預測模型為銀行產出潛在顧客名單,作為行銷決策之參考。
英文摘要 Customers are generally bank and financial institutions’ most vital asset. Thus, it is important for institutions to precisely catch the customers by using limited resource for marking. The purpose of this paper is looking for potential customers by technique of data mining and prediction model.

A three-phase study was designed to explore the data pre-processing, feature selection, and model building. We take six samples from imbalance data sets, employed three different methods of feature selection go with four Classification algorithms, and then compare the preference of these models. The results of this experiment showed that the proportion of samples strongly impacts prediction. Under the proportion of 3:7 in sampling, we find the best preference of the model using R-Square to collocate Decision Tree.

The paper contributes to bringing the forth method that uses prediction model for bank and financial institutions to look for potential customers.
論文目次 目錄
===========================================================
第一章 緒論1
1.1研究背景1
1.2研究動機2
1.3問題定義2
1.4研究目的3
1.5論文架構3
第二章 文獻探討5
2.1顧客關係管理(CUSTOMER RELATIONSHIP MANAGEMENT, CRM)5
2.1.1顧客關係管理之定義5
2.1.2顧客關係管理之核心5
2.1.3顧客關係管理之應用6
2.2資料探勘(DATA MINING)7
2.2.1資料探勘之定義 7
2.2.2資料探勘之流程 8
2.2.3資料探勘之功能 10
2.2.4資料探勘之應用 12
2.3分類技術(CLASSIFICATION)13
2.3.1資料集13
2.3.2輸入屬性14
2.3.3演算法16
2.4金融業利用資料探勘技術於顧客關係管理之相關研究16
第三章 研究方法與系統架構19
3.1研究方法19
3.2系統架構20
3.3資料前置處理21
3.3.1資料抽樣21
3.3.2資料遺失處理22
3.3.3特徵選取23
3.4模型建置26
3.4.1決策樹(Decision Tree)26
3.4.2邏輯斯迴歸(Logistic Regression)27
3.4.3類神經網路(Neural Network)28
3.4.4支持向量機(Support Vector Machine)29
3.5模型效果評估30
第四章 研究結果與討論32
4.1實驗資料32
4.1.1實驗語料32
4.1.2資料前置處理34
4.1.3模型建置35
4.2篩選後之特徵子集比較36
4.3各模型分類效果評估38
4.3.1分類效果評估—依抽樣比例41
4.3.2分類效果評估—依特徵選取法44
4.3.3分類效果評估—依分類演算法49
第五章 結論54
5.1研究結論54
5.2研究貢獻55
5.3管理意涵56
5.4未來展望56
參考文獻58

圖目次
===========================================================
圖 1 本論文架構流程4
圖 2 常見顧客關係管理系統類型7
圖 3 CRIP-DM處理流程9
圖 5 運用資料探勘於銀行業潛在顧客預測模型之系統架構20
圖 6 本研究訓練資料目標類別變數之數量分佈表35
圖 7 保留特徵之共同出現次數長條圖38
圖 8 F-MEASURE平均值之長條圖—依抽樣比例44
圖 9 F-MEASURE平均值之長條圖—依特徵選取法49


表目次
===========================================================
表 1 資料探勘在金融業之應用12
表 2 資料集不平衡之抽樣方法-金融業14
表 3 特徵選取法-金融業15
表 4 在金融業資料探勘於顧客關係管理-顧客識別之相關研究17
表 5 混亂矩陣30
表 6 本研究資料集之特徵總表32
表 7 本研究訓練資料總表34
表 8 特徵選取法篩選結果之比較37
表 9 模型編號與模型名稱38
表 10 分類模型效果比較表—依抽樣比例41
表 11 F-MEASURE平均值表—依抽樣比例44
表 12 分類模型效果比較表—依特徵選取法45
表 13 F-MEASURE平均值表—依特徵選取法 48
表 14 分類模型效果比較表—依分類演算法(R-SQUARE)49
表 15 分類模型效果比較表—依分類演算法(CHI-SQUARE)51
表 16 分類模型效果比較表—依分類演算法(R-SQUARE & CHI-SQUARE)52

參考文獻 中文文獻

[1]王志吉,《應用資料探勘於客戶流失預測模式之研究-以某證券公司為例》,碩士論文,銘傳大學資訊管理學系碩士在職專班,2012。
[2]何俊億,《以信用卡資料庫建構信貸預測模型》,碩士論文,臺灣大學國際企業學研究所,2013。
[3]吳信廷,《特徵挑選方法和分類器在財務危機預測問題中比較》,碩士論文,國立中央大學資訊工程學系,2013。
[4]李御璽、顏秀珍、趙家宏等,〈運用二階段分類技術挖掘潛在中小企業借貸戶之研究〉,Journal of Data Analysis,第8卷,第6期,頁111-135,2013年。
[5]李御璽、顏秀珍,〈資料探勘在銀行信貸行銷上之應用〉,Journal of Data Analysis,第6卷,第4期,頁131-157,2011年。
[6]李御璽、顏秀珍、鄭郁翰等,〈運用分類技術發掘潛在中小企業借貸戶之研究〉,Journal of Information Technology and Applications,第1卷,第3期,頁173-181,2006年。
[7]李逢嘉,《特徵選取為基礎之複合分類預測模式-以信用資料為例》,博士論文,國立清華大學工業工程與工程管理學系,2010。
[8]翁宇廷,《應用svm特徵選取提升財務危機模型之預測能力》,碩士論文,朝陽科技大學財務金融系碩士班,2012。
[9]連思涵,《整合特徵篩選與組合式類神經網路預測企業財務危機》,碩士論文,朝陽科技大學財務金融系碩士班,2011。
[10]陳文華,〈應用資料倉儲系統建立 CRM〉,資訊與電腦,第226期,頁122-127,1999年5月。
[11]陳東和,《應用資料探勘技術於基金客戶風險承受度之分群與預測》,碩士論文,中國文化大學資訊管理研究所碩士在職專班,2008。
[12]陳東滄,《運用資料探勘建構悠遊聯名卡之客戶貢獻度模式-以國內某銀行為例》,碩士論文,東吳大學國際經營與貿易學系,2012。
[13]黃怡華,《應用類神經網路與關聯法則於銀行消費性貸款》,碩士論文,國立成功大學資訊管理研究所,2004。
[14]廖述賢、溫志皓,《資料探勘理論與應用:以IBM SPSS Modeler為範例》,新北市:博碩文化股份有限公司,ISBN:9789862015483,2012。
[15]蕭鈺潔,《整合多重特徵選取方法於股價漲跌預測之研究》,碩士論文,國立中正大學會計與資訊科技研究所,2009。
[16]謝邦昌、蘇志雄、鄭宇庭等,《資料採礦與商業智慧:SQL server 2005》,台北市:鼎茂圖書出版,ISBN:9861225110,2005。
[17]顏秀珍、李御璽、王秋光,〈改善不平衡資料集中少數類別資料之分類正確性的方法〉,電子商務學報,第11卷,第4期,頁847-858,2009年。
[18]羅隆晉,《以集群為基礎之多分類器模型對不平衡資料預測之研究》,碩士論文,銘傳大學資訊工程學系碩士班,2010。

英文文獻

[19]Berry, M. J., and G. Linoff. Data Mining Techniques: For Marketing, Sales, and Customer Support, John Wiley & Sons, Inc, 1997.
[20]Berson, A., S. Smith, and K. Thearling. Building Data Mining Applications for CRM, McGraw-Hill New York, 2000.
[21]Bhatia, A. "A Roadmap to Implementation of Customer Relationship Management (CRM)," ITtoolbox Portal for CRM, 1999.
[22]Curt, H. "The Deviles in the Detail Techniques, Tool, and Applications for Data Mining and Knowledge Discovery-Part 1," Intelligent Software Strategies (6:9), 1995, pp. 1-15.
[23]Dash, M., and H. Liu. "Feature Selection for Classification," Intelligent Data Analysis (1:3), 1997, pp. 131-156.
[24]Davids, M. "How to Avoid the 10 Biggest Mistakes in CRM," Journal of Business Strategy (20:6), 1999, pp. 22-26.
[25]Fayyad, U., G. Piatetsky-Shapiro, and P. Smyth. "From Data Mining to Knowledge Discovery in Databases," AI Magazine (17:3), 1996, pp. 37.
[26]Hsieh, N. "An Integrated Data Mining and Behavioral Scoring Model for Analyzing Bank Customers," Expert Systems with Applications (27:4), 2004, pp. 623-633.
[27]Jo, H., I. Han, and H. Lee. "Bankruptcy Prediction using Case-Based Reasoning, Neural Networks, and Discriminant Analysis," Expert Systems with Applications (13:2), 1997, pp. 97-108.
[28]Kalakota, R., and M. Robinson. "E-Business Roadmap for Success," Reading, Addison Wesley Longman, 1999, pp. 165-168.
[29]Kleissner, C. "Data Mining for the Enterprise," 1998, pp. 295-304.
[30]Ling, C. X., Tielin Chen, Qiang Yang, and Jie Cheng. "Mining Optimal Actions for Profitable CRM," Data Mining, 2002. ICDM 2003. Proceedings. 2002 IEEE International Conference on, 2002, pp. 767-770.
[31]Lo, V. S. Y. "The True Lift Model: A Novel Data Mining Approach to Response Modeling in Database Marketing," SIGKDD Explor.Newsl. (4:2), 2002, pp. 78-86.
[32]Namvar, M., M. R. Gholamian, and S. KhakAbi. "A Two Phase Clustering Method for Intelligent Customer Segmentation," Intelligent Systems, Modelling and Simulation (ISMS), 2010 International Conference on, 2010, pp. 215-219.
[33]Ngai, E. W. T., L. Xiu, and D. C. K. Chau. "Application of Data Mining Techniques in Customer Relationship Management: A Literature Review and Classification," Expert Systems with Applications (36:2), 2009, pp. 2592-2602.
[34]Nunamaker Jr, J. F., and M. Chen. "Systems Development in Information Systems Research," 1990, pp. 631-640.
[35]Owrang O, M. M., and F. H. Grupe. "Using Domain Knowledge to Guide Database Knowledge Discovery," Expert Systems with Applications (10:2), 1996, pp. 173-180.
[36]Peppers, D., M. Rogers, and B. Dorf. "Is Your Company Ready for One-to-One Marketing," Harvard Business Review (77:1), 1999, pp. 151-160.
[37]Piateski, G., and W. Frawley. Knowledge Discovery in Databases, MIT press. 1991.
[38]Prahalad, C. K., and V. Ramaswamy. "Co-Opting Customer Competence," Harvard Business Review (78:1), 2000, pp. 79-90.
[39]Ruey-Chyi Wu, Ruey-Shun Chen, and C. C. J. Y. Chen. "Data Mining Application in Customer Relationship Management of Credit Card Business," Computer Software and Applications Conference, 2005. COMPSAC 2005. 29th Annual International, 2005, pp. 39-40.
[40]Spengler, B. "Eyes on the Customer," Computerworld (33:11), 1999, pp. 60-62.
[41]Stone, M., N. Woodcock, and M. Wilson. "Managing the Change from Marketing Planning to Customer Relationship Management," Long Range Planning (29:5), 1996, pp. 675-683.
[42]Vapnik, V. The Nature of Statistical Learning Theory, springer, 1999.
[43]Wayland, R. E., and P. M. Cole. Customer Connections: New Strategies for Growth, Harvard Business Press, 1997.
[44]Wei Li, Xuemei Wu, Yayun Sun, and Quanju Zhang. "Credit Card Customer Segmentation and Target Marketing Based on Data Mining," Computational Intelligence and Security (CIS), 2010 International Conference on, 2010, pp. 73-76.
[45]Zakrzewska, D., and J. Murlewski. "Clustering Algorithms for Bank Customer Segmentation," Intelligent Systems Design and Applications, 2005. ISDA '05. Proceedings. 5th International Conference on, 2005, pp. 197-202.
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2015-02-02公開。
  • 同意授權瀏覽/列印電子全文服務,於2015-02-02起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2486 或 來信