系統識別號 | U0002-1707201311242100 |
---|---|
DOI | 10.6846/TKU.2013.00602 |
論文名稱(中文) | 遺失資料插補法在最適資產配置投資組合上之應用與比較-以臺灣證券市場為例 |
論文名稱(英文) | Missing Data Imputation Methods Comparisons in Optimal Assets Allocation – The Empirical Analysis in Taiwan Equity Markets |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 統計學系應用統計學碩士班 |
系所名稱(英文) | Department of Statistics |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 101 |
學期 | 2 |
出版年 | 102 |
研究生(中文) | 程于庭 |
研究生(英文) | Yu-Ting Cheng |
學號 | 600650344 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2013-06-22 |
論文頁數 | 129頁 |
口試委員 |
指導教授
-
林志娟
委員 - 張慶暉 委員 - 蔡桂宏 |
關鍵字(中) |
資產配置 證券報酬預測模型 遺失資料 遺失資料插補方法 |
關鍵字(英) |
mean-variance portfolio model factor model missing data imputation method |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
本研究主要探討遺失值插補方法之優劣,研究中首先將完整資料以隨機設定比例移除10%、30%、50%資料,並以不同插補方法將遺失值插補後所得資料與真實值比較,做不同遺失比例、不同插補方法之插補結果與真實值之誤差評估。接著,再將插補後的資料代入預期報酬率估計模型中,以不同模型所計算得到的預期報酬率、變異數與共變異數矩陣,並探討插補方法應用在預期報酬率估計模型上之預測績效表現。最後,將上述所計算得到的預期報酬率、變異數與共變異數矩陣,作為投入要素,求解而得最適資產配置投資組合,並以研究期間最後一個交易日之累績報酬率為指標,用以衡量插補方法在最適資產配置投資組合投資績效之好壞。 根據插補後數值與真實值比較,本研究最推薦EM插補法作為當資料遇到遺失資料時的插補方法,迴歸插補法則為第二推薦之插補方法、接著為MCMC插補法;另外,由於平均數插補法容易受極端值影響,因此,若資料遇到需要插補狀況時,較不推薦以平均數插補法處理該筆資料。此外,就遺失值插補方法在最適資產配置投資組合的應用上,以累績報酬率為指標所得之表現與上述插補能力一致,顯示插補方法應用在最是資產配置投資組合的重要性。 |
英文摘要 |
Data missing is a prevail problem for most of the data analysis. This thesis mainly focuses on how the remedy strategies, data imputation, could affect the optimal assets allocation problems. At first, 10%, 30% and 50% data are removed artificially and randomly from a complete data set. Then four different methods, mean, EM, Regression and MCMC, are employed to impute the data respectively. Then the four imputed data sets are adopted by the optimal assets allocation problems by incorporating the input from three mean estimation models and two variance estimation models. Empirical evidence shows that EM method outperforms the rest imputation methods in terms of the accuracy. Although not as good as EM method, Regression method also performs well especially compare with MCMC method. Mean estimation is quite sensitive to the extreme data and hence is unstable and not recommended. Besides, the investment performance through the aforementioned four imputation methods in optimal assets allocation problems follow the same pattern in terms of the cumulative rate of return. It identifies the importance of the imputation methods in the optimal assets allocation problems application. |
第三語言摘要 | |
論文目次 |
第一章 緒論................................................1 1.1 研究背景與動機........................................1 1.2 研究目的與研究架構................................... 3 1.2.1 研究目的...........................................3 1.2.2 研究架構...........................................4 第二章 文獻探討............................................7 2.1 預期報酬率估計模型....................................8 2.1.1平均報酬調整模型....................................8 2.1.2資本資產定價模型....................................8 2.1.3 Fama & French三因子模型............................9 2.2 遺失值...............................................13 2.2.1 遺失資料的機制....................................13 2.2.2 遺失值的處理目的及方法............................14 2.2.3 插補法之介紹......................................16 第三章 研究方法...........................................20 3.1 資產配置最適化模型...................................20 3.2 證券報酬率預測模型......... .........................24 3.2.1平均報酬調整模型...................................24 3.2.2因子模型...........................................25 3.2.3資本資產定價模型...................................26 3.2.4 Fama & French三因子模型...........................29 3.3證券報酬共變異數估計模型..............................33 3.3.1 平均報酬調整模型之共變異數估計....................33 3.3.2因子模型之共變異數估計.............................34 3.3.3資本資產定價模型之共變異數估計.....................35 3.3.4 Fama & French三因子模型之共變異數估計.............36 3.4 遺失值插補方法.......................................37 3.4.1平均數插補法.......................................38 3.4.2迴歸插補法.........................................38 3.4.3最大期望概似插補法....................... .........39 3.4.4 MCMC插補法........................................41 3.5模型評估準則..........................................43 3.5.1均方誤差...........................................43 3.5.2平均絕對誤差.......................................44 第四章 模擬與實證分析結果.................................46 4.1 資料來源與研究期間...................................46 4.2 遺失資料模擬與插補方法之比較.........................50 4.2.1遺失資料模擬與插補.................................50 4.2.2 插補方法之比較....................................51 4.3 資料模擬與插補方法應用在預期報酬率估計模型上之預測績效表現......................................................59 4.3.1資料模擬與插補方法在預期報酬率估計之應用...........59 4.3.2 插補方法應用在預期報酬率估計模型上之預測績效表現..60 4.4 插補方法應用在最適資產配置投資組合之表現.............85 4.4.1插補方法在最適資產配置投資組合之應用...............85 4.4.2插補方法在最適資產配置投資組合之投資績效表現.......86 第五章 結論與建議........................................111 參考文獻.................................................113 附錄A 插補方法應用在預期報酬率估計模型上之預測績效表現...118 附錄B 插補方法應用在預期報酬率估計模型上之最適資產配置投資績效.......................................................124 表目錄 表2.1 CAPM之發展過程.......................12 表2.2 不同遺失比率與插補數量之插補效能表.......................19 表3.1 投資組合表.......................30 表4.1 不同遺失比例及不同插補法之插補後結果與真實值之誤差評估準則(市值前5大資料).......................53 表4.2不同遺失比例及不同插補法之插補後結果與真實值之誤差評估準則(市值前10大資料).......................54 表4.3不同遺失比例及不同插補法之插補後結果與真實值之誤差評估準則(市值前15大資料).......................55 表4.4不同遺失比例及不同插補法之插補後結果與真實值之誤差評估準則(市值前20大資料).......................56 表4.5不同遺失比例及不同插補法之插補後結果與真實值之誤差評估準則(市值前25大資料).......................57 表4.6不同遺失比例及不同插補法之插補後結果與真實值之誤差評估準則(市值前50大資料).......................58 表4.7 不同遺失比例與不同插補法所得之插補資料以平均報酬調整模型估計結果與真實值之誤差評估準則(市值前5大資料).......................63 表4.8 不同遺失比例與不同插補法所得之插補資料以資本資產定價模型估計結果與真實值之誤差評估準則(市值前5大資料).......................64 表4.9 不同遺失比例與不同插補法所得之插補資料以Fama & French三因子模型估計結果與真實值之誤差評估準則(市值前5大資料).......................65 表4.10 不同遺失比例與不同插補法所得之插補資料以平均報酬調整模型估計結果與真實值之誤差評估準則(市值前10大資料).......................66 表4.11不同遺失比例與不同插補法所得之插補資料以資本資產定價模型估計結果與真實值之誤差評估準則(市值前10大資料) .......................67 表4.12 不同遺失比例與不同插補法所得之插補資料以Fama & French三因子模型估計結果與真實值之誤差評估準則(市值前10大資料).......................68 表4.13 不同遺失比例與不同插補法所得之插補資料以平均報酬調整模型估計結果與真實值之誤差評估準則(市值前15大資料).......................69 表4.14 不同遺失比例與不同插補法所得之插補資料以資本資產定價模型估計結果與真實值之誤差評估準則(市值前15大資料).......................70 表4.15 不同遺失比例與不同插補法所得之插補資料以Fama & French三因子模型估計結果與真實值之誤差評估準則(市值前20大資料).......................71 表4.16 不同遺失比例與不同插補法所得之插補資料以平均報酬調整模型估計結果與真實值之誤差評估準則(市值前20大資料).......................72 表4.17 不同遺失比例與不同插補法所得之插補資料以資本資產定價模型估計結果與真實值之誤差評估準則(市值前20大資料).......................73 表4.18 不同遺失比例與不同插補法所得之插補資料以Fama & .......................74 表4.19 不同遺失比例與不同插補法所得之插補資料以平均報酬調整模型估計結果與真實值之誤差評估準則(市值前25大資料).......................75 表4.20 不同遺失比例與不同插補法所得之插補資料以資本資產定價模型估計結果與真實值之誤差評估準則(市值前25大資料).......................76 表4.21 不同遺失比例與不同插補法所得之插補資料以Fama & French三因子模型估計結果與真實值之誤差評估準則(市值前25大資料).......................77 表4.22 不同遺失比例與不同插補法所得之插補資料以平均報酬調整模型估計結果與真實值之誤差評估準則(市值前50大資料).......................78 表4.23 不同遺失比例與不同插補法所得之插補資料以資本資產定價模型估計結果與真實值之誤差評估準則(市值前50大資料).......................79 表4.24 不同遺失比例與不同插補法所得之插補資料以Fama & French三因子模型估計結果與真實值之誤差評估準則(市值前50大資料).......................80 表4.25 插補方法預期報酬率估計模型上之預測績效表現之次數分配表及相對次數分配表.......................83 表4.26 插補方法預期報酬率估計模型上之預測績效表現之次數分配表及相對次數分配表(排除平均數插補法).......................84 表4.27 插補方法投資績效之次數分配表及相對次數分配表.......................109 表4.28 插補方法投資績效之次數分配表及相對次數分配表(排除平均數插補法) .......................110 圖目錄 圖1.1研究架構.......................6 圖4.1 本研究資料期間、研究期間、估計期間之圖示.......................48 圖4.2樣本估計移動窗口之示意圖 (以第q=0、q=1、q=2、q=3期為例).......................49 圖4.3 市值前5大資料,固定隨機移除10%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................89 圖4.4市值前5大資料,固定隨機移除30%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................90 圖4. 5市值前5大資料,固定隨機移除50%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................91 圖4. 6市值前10大資料,固定隨機移除10%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................92 圖4.7市值前10大資料,固定隨機移除30%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................93 圖4.8市值前10大資料,固定隨機移除50%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................94 圖4.9市值前15大資料,固定隨機移除10%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................95 圖4.10市值前15大資料,固定隨機移除30%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................96 圖4.11市值前15大資料,固定隨機移除50%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................97 圖4.12市值前20大資料,固定隨機移除10%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................98 圖4.13市值前20大資料,固定隨機移除30%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................99 圖4.14市值前20大資料,固定隨機移除50%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................100 圖4.15市值前25大資料,固定隨機移除10%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................101 圖4.16市值前25大資料,固定隨機移除30%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................102 圖4.17市值前25大資料,固定隨機移除50%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................103 圖4.18市值前50大資料,固定隨機移除10%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................104 圖4.19市值前50大資料,固定隨機移除30%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................105 圖4.20市值前50大資料,固定隨機移除50%資料下,不同插補方法之累積報酬率圖(上:naive、中:CAPM、下:Fama & French).......................106 |
參考文獻 |
中文部分 [1]王國河(2002),「整合叢集與迴歸技術以處理大型資料庫遺失值問題之新方法 」,成功大學資訊工程學系碩士學位論文。 [2]王鴻龍、楊孟麗、陳俊如、林定香(2012),「缺失資料在因素分 析上的處理方法之研究」,教育科學研究期刊,第57卷,第1期,29-50。 [3]吳裕益(2006),「多重插補法在數學成就評量的不完整取樣設計之應用」,未出版。 [4]呂喻恩(2008),「不同遺失機轉遺失資料插補法之比較研究」,台南大學測驗統計研究所碩士論文。 [5]李文聖(2000),「因子、特徵與資產配置」,中央大學財務管理系研究所碩士論文。 [6]李美樺(2008),「以橫斷面跨期資本資產定價模型衡量台灣股市報酬與風險之動態關係」,銘傳大學財務金融研究所碩士論文。 [7]李興南 (2002),「在樣本完全隨機闕失之多重插補方法的比較分析」, 國立台灣大學流行病學研究所。 [8]易昆南、袁中萸 (2008),「對模擬縱向數據集缺失值處理的幾種方法比較」,湖南工業大學學報。 [9]林丙輝、何文榮、黃永昌 (2001),「投資學」,麥格羅‧希爾國際出版公司台灣分公司。 [10]林曉芳(2002),「以 Hot deck 插補法推估成就測驗之不完整作答反應 」,國立政治大學教育學系教育心理與輔導組博士學位論文。 [11]張怡婷(2012),「台灣股市投資組合績效之比較」,成功大學財務金融研究所碩士論文。 [12]黃齡葦(2005),「遺失資料之多重插補方法模擬比較研究」,台灣大學農藝學研究所生物統計組碩士論文。 [13]葉瑞鈴、黃正翰、李國隆、林千芩(2006),「統計調查中遺漏值處理之研究 ─ 以台灣地區工程技術顧問服務業調查為例」,數據分析。 [14]樓克望(2012),「GARCH模型與條件分配對俄羅斯股市波動性預測能力之研究」,台北大學國際財務金融碩士在職專班碩士論文。 [15]蔡坤宏(2007),「資本資產定價之研究─三因子模型、財務失敗風險」,雲林科技大學財務金融系研究所碩士論文。 [16]鄭國龍(2004),「因子與特徵模型在投資組合建構之應用」,中央大學財務金融研究所碩士論文。 [17]黎秀雷(2009),「多重插補方法處理缺失資料之因素分析 ─ 以「台灣教育長期追蹤資料庫」之第二波高中、高職、五專學生樣本資料為例」,台北大學統計學系碩士論文。 [18]顏明賢(2001),「非條件資產定價因子之分析」,中央大學產業經濟研究所碩士論文。 [19]顏培俊(2003),「資本資產定價模型之穩健估計分析」,政治大學統計學系研究所碩士論文。 英文部分 [1]Allison, P. D. (2002). Missing data: Quantitative applications in the social sciences. British Journal of Mathematical and Statistical Psychology, 55(1), 193-196. [2]Black, J. W., Duncan, W. A. M., Durant, C. J., Ganellin, C. R., & Parsons, E. M. (1972). Definition and antagonism of histamine H2-receptors. Nature, 236, 385-390. [3]Byrne, B. M. (2001). Structural equation modeling with AMOS, EQS, and LISREL: Comparative approaches to testing for the factorial validity of a measuring instrument. International Journal of Testing, 1(1), 55-86. [4]Chan, K. C., & Chen, N. F. (1991). Structural and return characteristics of small and large firms. The Journal of Finance, 46(4), 1467-1484. [5]Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society. Series B (Methodological), 1-38. [6]Fama, E. F., & French, K. R. (1992). The cross‐section of expected stock returns. The Journal of Finance, 47(2), 427-465. [7]Fama, E. F., & French, K. R. (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics, 33(1), 3-56. [8]Fama, E. F., & MacBeth, J. D. (1973). Risk, return, and equilibrium: Empirical tests. The Journal of Political Economy, 607-636. [9]Kim, J. O., & Curry, J. (1977). The treatment of missing data in multivariate analysis. Sociological Methods & Research, 6(2), 215-240. [10]Kinniburgh, A. J., Mertz, J. E., & Ross, J. (1978). The precursor of mouse β-globin messenger RNA contains two intervening RNA sequences. Cell, 14(3), 681-693. [11]Lintner, J. (1965). The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets. The Review of Economics and Statistics, 47(1), 13-37. [12]Little, R. J., & Rubin, D. B. (1987). Statistical analysis with missing data. New York, USA: John Willey & Sons. [13]Longford, N. T. (2002). Examples of multiple imputation. Data Clean 2002 Conference, Jyvaskyla, Finland. [14]Markowitz, H. (1952). Portfolio selection. The Journal of Finance, 7(1), 77-91. [15]Mossin, J. (1966). Equilibrium in a capital asset market. Econometrica: Journal of the Econometric Society, 768-783. [16]Musil, C. M., Warner, C. B., Yobas, P. K., & Jones, S. L. (2002). A comparison of imputation techniques for handling missing data. Western Journal of Nursing Research, 24(7), 815-829. [17]Peugh, J. L., & Enders, C. K. (2004). Missing data in educational research: A review of reporting practices and suggestions for improvement. Review of Educational Research, 74(4), 525-556. [18]Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory, 13(3), 341-360. [19]Rubin,D. B. (1976). Inference and missing data. Biometrika, 63(3), 581-592. [20]Rubin, D. B. (1987). Multiple imputation for nonresponse in surveys.New York, USA: John Willey & Sons. [21]SAS Institute Inc. (2011). SAS 9.3 Output Delivery System: User's Guide. Sas Institute Inc. [22]Schafer, J. L., & Graham, J. W. (2002). Missing data: Our view of the state of the art. Psychological Methods, 7(2), 147-177. [23]Sharpe, W. F. (1964). Capital Asset Prices: A Theory of Market Equilibrium Under Conditions of Risk. The Journal of Finance, 19(3), 425-442. [24]Sharpe, W. F. (1966). Mutual fund performance. The Journal of Business, 39(1), 119-138. [25]Vansteenkiste, J., Pirker, R., Massuti, B., Barata, F., Font, A., Fiegl, M., & Musil, J. (2002). Double-blind, placebo-controlled, randomized phase III trial of darbepoetin alfa in lung cancer patients receiving chemotherapy. Journal of the National Cancer Institute, 94(16), 1211-1220. |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信