§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0407201614525300
DOI 10.6846/TKU.2016.00131
論文名稱(中文) 台股波峰波谷的資料探勘與預測
論文名稱(英文) Data Mining and Forecasting in Peaks and Troughs of Taiwan Stock Market
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊管理學系碩士班
系所名稱(英文) Department of Information Management
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 104
學期 2
出版年 105
研究生(中文) 方永盈
研究生(英文) Yung-Ying Fang
學號 604630052
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2016-05-29
論文頁數 75頁
口試委員 指導教授 - 李鴻璋(hclee@mail.tku.edu.tw)
委員 - 周清江(cjou@mail.tku.edu.tw)
委員 - 黃國軒(khhuang@ttu.edu.tw)
關鍵字(中) 台灣加權股價指數
資料探勘
機器學習
支援向量機
最佳化
操作正確率
預測
關鍵字(英) Taiwan Stock Exchange
Data mining
Machine learning
Support Vector Machine
Optimization
Operation Accuracy
Forecasting
第三語言關鍵字
學科別分類
中文摘要
2014年底,台灣國內上市公司總市值26.25兆元,總成交值為21.90兆元,約為該年國民生產毛額(GDP)的1.6倍及1.3倍,可看出台灣證券市場規模及影響。證券投資具有可適性資金投入、其績效具有高利潤及高風險特點。如何將風險降低,帶來更穩定的獲利,是個重大課題。
  本文是針對加權股價指數波峰與波谷作研究。本研究分成兩部份,首先定義本論文短期與中期波峰波谷之意義,利用資料探勘技術,統計分析各常用分析指標如成交量、相對強弱指標、股價乖離率、及KD隨機指標等檢視其於加權股價指數波峰與波谷前後變化所表現出的資訊。第二部份則是利用該資料探勘中,所得出的有效的知識,以支援向量機(SVM)預測出未來波峰與波谷發生的時間,並且針對不同條件下的訓練集與測試集做深入探討。
  本文研究結果顯示,於波峰方面,結果顯示其模型敏感度偏高、較易受市場活絡或環境因素變化所影響。本研究在透過多種技術指標組合及參數值,找尋到其中一對中期波峰中的模型對訓練集其波峰平均交叉驗證正確率達到80%以上,對測試集分類正確率皆達到70%以上,且操作正確率平均達至93.75%。波谷方面透過數據發現其較波峰容易預測,在實驗結果中,不論波谷範圍選擇短期或是中期的,皆有能對應出五年平均達到80%以上的操作正確率之特徵值組合,皆是具有一定程度可信度的數據,證實本研究所使用之特徵值所建立的波峰模型與波谷模型,對投資操作人而言具有其參考價值。
英文摘要
The total market value of listed shares in Taiwan was 26.25 trillion and the total turnover volume was 21.90 trillion in year 2014. These was 1.6 times and 1.3 times of Taiwan GDP in that year. That indicated the profound effect of Taiwan stock market. Even with adaptive value, features of investing in stock are still high profit as well as high risk. How to reduce risk and, at the same time, produce high profit is an interesting challenge.
  In this paper, we try to build a model which can predict the peaks and troughs of Taiwan stock market. First, we define peaks and troughs in short-term and medium-term period, respectively. And then, by scanning the historical data, we find the indicators like Volume, Relative Strength Index, Bias Ratio of Stock Price, Stochastic Oscillator…etc. to get information from the peaks and troughs of Taiwan stock market. After that, we use SVM along with some notable features to forecast peaks and troughs of Taiwan Stock Market. Within that evaluation, two kinds of accuracy, the general accuracy (correct or incorrect) and operation accuracy (in the range of indicating or not), is defined. Finally, we discuss parmeters and mark criterions about training sets and test sets in varities of condition. 
  The result shows that prediction accuracy for peaks is highly sensitive and it’s easily effected by varieties of environment. Among these, we present a model for medium-term peaks which the average Cross-Validation Accuracy for the training set is up to 80%, accuracy for the testing set is up to 70%, and average operation accuracy for test set is 93.75%. On the other side, the result shows that models for troughs more easily to predict than that for peaks. For both troughs of short-term and medium-term, they can be found a model with combined features that produce a average operation accuracy for testing set up to 80%. These promising results show that the proposed model can provide a significant value for the investors.
第三語言摘要
論文目次
第一章 緒論	1
1.1	研究背景與動機	1
1.2	研究目的與初步結果	2
 第二章 文獻探討	4
2.1	技術指標介紹	4
2.1.1	相對強弱指標(Relative Strength Index,RSI)	4
2.1.2	隨機指標(Stochastic Oscillator,KD)	4
2.1.3	乖離率指標(Bias Ratio,BIAS)	5
2.2	相關文獻探討	6
2.2.1	技術指標相關文獻探討	6
2.2.2	支援向量機相關文獻探討	9
 第三章 波峰波谷的知識擷取	11
3.1	波峰與波谷的定義	11
3.1.1	波峰之定義	11
3.1.2	波谷之定義	12
3.1.3	波峰波谷混淆狀況處理	13
3.2	成交量對波峰波谷的影響及分析	14
3.2.1	波峰與波谷前後成交最大量與最小量之落點範圍	14
3.2.2	波峰及波谷前三日成交量之趨勢統計	16
3.2.3	成交量10日乖離率對波峰波谷之分析	17
3.3	K線圖於波峰波谷前的變化分析	19
3.3.1	波峰及波谷前三日之K線圖趨勢分析	20
3.3.2	波峰與波谷前三日收盤價變化率統計	21
3.3.3	以收盤價與開盤價之變化率對波峰波谷之分析	24
3.4	相對強弱指標對波峰波谷的分析	26
3.4.1	3日RSI對波峰與波谷之分析	27
3.4.2	長、短線RSI穿越日對波峰與波谷之分析	29
3.5	股價乖離率對波峰波谷的分析	32
3.5.1	波峰與波谷前三日之6日股價乖離率統計	32
3.5.2	利用股價乖離率之交叉點對波峰波谷的分析	34
3.6	KD隨機指標對於波峰波谷的分析	36
3.6.1	K值統計	36
3.6.2	D值統計	39
3.6.3	KD穿越日對波峰與波谷的分析	41
 第四章 實證分析	44
4.1	核心函數選擇	44
4.2	預測正確率定義	45
4.3	實驗資料來源與操作步驟	46
4.4	研究限制	48
4.5	實驗結果	48
4.5.1	特徵值選擇比較	48
4.5.2	波峰波谷前技術指標之不同參數選擇對預測結果之影響	51
4.5.3	探討短中期波峰波谷以不同長度之訓練集及測試集範圍對於預測結果之影響	60
 第五章 結論與建議	71
5.1	結論	71
5.2	未來研究與建議	72
 參考文獻	73

表 2-1 國外學者運用技術指標之相關文獻	6
表 2-2 國內學者運用技術指標之相關文獻	7
表 2-3 國內外運用支援向量機之相關文獻	9
表 3-1 短期波峰前後出現最大量日範圍	14
表 3-2 中期波峰前後出現最大量日範圍	15
表 3-3 短期波谷前後出現最小量日範圍	15
表 3-4 中期波谷前後出現最小量日範圍	15
表 3-5 短期波峰前三日成交量趨勢變化統計表	16
表 3-6 中期波峰前三日成交量趨勢變化統計表	16
表 3-7 短期波谷前三日成交量趨勢變化統計表	17
表 3-8 中期波谷前三日成交量趨勢變化統計表	17
表 3-9 短期波峰前後成交最大量之乖離率( I )	18
表 3-10 中期波峰前後成交最大量之乖離率( I )	18
表 3-11 短期波谷前後成交最小量之乖離率( I )	18
表 3-12 中期波谷前後成交最小量之乖離率( I )	19
表 3-13 短期波峰前三日K線圖趨勢	20
表 3-14 中期波峰前三日K線圖趨勢	20
表 3-15 短期波谷前三日K線圖趨勢	21
表 3-16 中期波谷前三日K線圖趨勢	21
表 3-17 值範圍區間對照表	22
表 3-18 短期波峰前三日收盤價變化率區間	22
表 3-19 中期波峰前三日收盤價變化率區間	22
表 3-20 短期波谷前三日收盤價變化率區間	23
表 3-21 中期波谷前三日收盤價變化率區間	23
表 3-22 短期波峰前三日收盤價與開盤價價差變化率區間	24
表 3-23 中期波峰前三日收盤價與開盤價價差變化率區間	25
表 3-24 短期波谷前三日收盤價與開盤價價差變化率區間	25
表 3-25 中期波谷前三日收盤價與開盤價價差變化率區間	26
表 3-26 RSI值區間對照表	26
表 3-27 短期波峰前三日之3日RSI區間	27
表 3-28 中期波峰前三日之3日RSI區間	28
表 3-29 短期波谷前三日之3日RSI區間	28
表 3-30 中期波谷前三日之3日RSI區間	29
表 3-31 3日RSI線下穿6日RSI線日數統計(短期波峰)	29
表 3-32 3日RSI線下穿6日RSI線日數統計(中期波峰)	30
表 3-33 3日RSI線上穿6日RSI線日數統計(短期波谷)	30
表 3-34 3日RSI線上穿6日RSI線日數統計(中期波谷)	31
表 3-35 短期波峰前6日股價乖離率區間統計	32
表 3-36 中期波峰前6日股價乖離率區間統計	33
表 3-37 短期波谷前6日股價乖離率區間統計	33
表 3-38 中期波谷前6日股價乖離率區間統計	34
表 3-39 短期波峰前後6日乖離率下穿12日乖離率之統計	34
表 3-40 中期波峰前後6日乖離率下穿12日乖離率之統計	35
表 3-41 短期波谷前後6日乖離率上穿12日乖離率之統計	35
表 3-42 中期波谷前後6日乖離率上穿12日乖離率之統計	36
表 3-43 短期波峰前三日的K值統計	37
表 3-44 中期波峰前三日的K值統計	37
表 3-45 短期波谷前三日的K值統計	38
表 3-46 中期波谷前三日的K值統計	38
表 3-47 短期波峰前三日的D值統計	39
表 3-48 中期波峰前三日的D值統計	39
表 3-49 短期波谷前三日的D值統計	40
表 3-50 中期波谷前三日的D值統計	40
表 3-51 短期波峰前K值下穿D值統計	41
表 3-52 中期波峰前K值下穿D值統計	41
表 3-53 短期波谷前K值上穿D值統計	42
表 3-54 中期波谷前K值上穿D值統計	42
表 4-1 波峰特徵值之模型正確率	48
表 4-2 波谷特徵值之模型正確率	49
表 4-3 參數選擇替代符號表	51
表 4-4 短期波峰的穿越日及成交量乖離率參數選擇之統計結果	52
表 4-5 短期波峰的穿越日及成交量乖離率參數選擇每年預測結果-1	53
表 4-6 短期波峰的穿越日及成交量乖離率參數選擇每年預測結果-2	53
表 4-7 短期波峰的穿越日及成交量乖離率參數選擇每年預測結果-3	53
表 4-8 短期波峰的穿越日及成交量乖離率參數選擇每年預測結果-4	54
表 4-9 短期波谷的穿越日及成交量乖離率參數選擇之統計結果	54
表 4-10 短期波谷的穿越日及成交量乖離率參數選擇每年預測結果-1	58
表 4-11 短期波谷的穿越日及成交量乖離率參數選擇每年預測結果-2	58
表 4-12 短期波谷的穿越日及成交量乖離率參數選擇每年預測結果-3	59
表 4-13 短期波谷的穿越日及成交量乖離率參數選擇每年預測結果-4	59
表 4-14 短期波峰配合不同長度之訓練集及測試集平均預測結果	60
表 4-15 中期波峰配合不同長度之訓練集及測試集平均預測結果	61
表 4-16 訓練集為1年、測試集為0.5年之每年預測結果(中期波峰)	62
表 4-17 訓練集為2年、測試集為0.5年之每年預測結果(中期波峰)	64
表 4-18 短期波谷配合不同長度之訓練集及測試集平均預測結果	66
表 4-19 訓練集為1年、測試集為1年之「KD:6 RSI:9 BIAS:3 V10:3」組合的每年預測結果(短期波谷)	67
表 4-20 中期波谷配合不同長度之訓練集及測試集平均預測結果	67
表 4-21 2年訓練集與2年測試集之「KD:6 RSI:6 BIAS:6 V10:9」組合的各年預測結果(中期波谷)	69
表 4-22 2年訓練集與2年測試集之「KD:6 RSI:9 BIAS:3 V10:3」組合的各年預測結果(中期波谷)	70

圖 3 1 雜訊示意圖	13
圖 3 2 K線示意圖	19
圖 4 1 操作正確率定義圖示-1	45
圖 4 2 操作正確率定義圖示-2	45
圖 4 3 實驗操作流程圖	47
圖 4 4 波峰特徵值之模型正確率圖示	49
圖 4 5 波谷特徵值之模型正確率圖示	50
參考文獻
[1]	Alexander, S. S. (1961). Price movements in speculative markets: Trends or random walks. Industrial Management Review (pre-1986), 2(2), 7.
[2]	Ball, R., & Brown, P. (1968). An empirical evaluation of accounting income numbers. Journal of accounting research, 159-178.
[3]	Beaver, W. H., McAnally, M. L., & Stinson, C. H. (1997). The information content of earnings and prices: A simultaneous equations approach. Journal of Accounting and Economics, 23(1), 53-81.
[4]	Brock, W., Lakonishok, J., & LeBaron, B. (1992). Simple technical trading rules and the stochastic properties of stock returns. The Journal of Finance, 47(5), 1731-1764.
[5]	C. W. Hsu, C. C. Chang & C. J. Lin. (2003). A practical guide to support vector classification. Available:http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf
[6]	Coutts, J. A., & Cheung, K. C. (2000). Trading rules and stock returns: some preliminary short run evidence from the Hang Seng 1985-1997. Applied Financial Economics, 10(6), 579-586.
[7]	Hall, M. A. (1999). Correlation-based feature selection for machine learning (Doctoral dissertation, The University of Waikato).
[8]	Huang, W., Nakamori, Y., & Wang, S. Y. (2005). Forecasting stock market movement direction with support vector machine. Computers & Operations Research, 32(10), 2513-2522.
[9]	Kim, K. J. (2003). Financial time series forecasting using support vector machines. Neurocomputing, 55(1), 307-319.
[10]	Lee, C. I., Gleason, K. C., & Mathur, I. (2001). Trading rule profits in Latin American currency spot rates. International Review of Financial Analysis, 10(2), 135-156.
[11]	Lin, H. T., & Lin, C. J. (2003). A study on sigmoid kernels for SVM and the training of non-PSD kernels by SMO-type methods. Submitted to Neural Computation, 1-32.
[12]	Malkiel, B. G., & Fama, E. F. (1970). Efficient capital markets: A review of theory and empirical work. The journal of Finance, 25(2), 383-417.
[13]	Pruitt, S. W., & White, R. E. (1988). The CRISMA trading system: who says technical analysis can't beat the market?. The journal of portfolio management, 14(3), 55-58.
[14]	Szakmary, A., Davidson III, W. N., & Schwarz, T. C. (1999). Filter tests in Nasdaq stocks. The Financial Review, 34(1), 45.
[15]	Vapnik, V. (1998). Statistical learning theory. 1998.
[16]	Vapnik, V., & Chapelle, O. (1999). Bounds on error expectation for SVM. ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS, 261-280.
[17]	尹宏. (2011). 股票投資10大技術指標圖典,漢湘文化。
[18]	吳忠敏, 周聖鈞, & 蔡姈君. (2012). 建構以趨勢為基礎之演化式股票投資決策模型, 第1屆服務與科技管理研討會。
[19]	李家豪. (2001). KD 技術指標之類神經模糊交易決策支援系統. 靜宜大學碩士論文。
[20]	李鴻璋, & 黃紹輔. (2013). 應用三重濾網下之技術指標探討台灣股市交易策略, 淡江大學資訊管理學系碩士論文。
[21]	林金賢, & 李淑惠. (2006). 技術指標與股價漲跌幅非線性關係之獲利能力之探討, 台灣管理學刊, 第 6 卷, 第 1 期, 129-156.
[22]	施惠萍, (1999). 結構性變化的偵測與其在技術分析中的應用, 台灣大學經濟學研究所未出版碩士論文。
[23]	洪志豪. (1999). 技術指標 KD. MACD, RSI 與 WMS% R 之操作績效實證, 國立台灣大學國際企業管理研究所碩士論文。
[24]	洪美慧. (1997). 技術分析應用於台灣股市之研究-移動平均線, 乖離率指標與相對強弱指標, 東海大學管理研究所碩士論文。
[25]	翁頌舜, & 喻欣凱. (2007). 運用支援向量機與文字探勘於股價漲跌趨勢之預測,輔仁大學資訊管理學系碩士論文。
[26]	郭琇靜, & 顧瑞祥. (2007). 應用支援向量機於管制圖異常圖形之辨識, 第13屆全國品質管理研討會。
[27]	黃承龍, 陳穆臻, & 王界人. (2004). 支援向量機於信用評等之應用, 計量管理期刊。
[28]	雷祖強, 周天穎, 萬絢, 楊龍士, & 許晉嘉. (2007). 空間特徵分類器支援向量機之研究. 航測及遙測學刊, 12(2), 145-163.
[29]	劉易昌. (2004). 支援向量機於財務預測上之應用,靜宜大學資訊管理研究所碩士論文。
[30]	隨機指標, MBA智庫. (2016).
http://wiki.mbalib.com/zh-tw/%E9%9A%8F%E6%9C%BA%E6%8C%87%E6%A0%87。
[31]	企業工程與整合實驗室. (2016)
http://eeil.imis.ncku.edu.tw/knowledgebase/zhi-yuan-xiang-liang-ji-support-vector-machine。
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信