§ 瀏覽學位論文書目資料
系統識別號 U0002-0806200614321600
DOI 10.6846/TKU.2006.01021
論文名稱(中文) 使用支援向量迴歸分析股票市場
論文名稱(英文) Analysis of Stock Market Data Using SVM
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊工程學系碩士在職專班
系所名稱(英文) Department of Computer Science and Information Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 94
學期 2
出版年 95
研究生(中文) 蘭宜昌
研究生(英文) Yi-Chang Lan
學號 792190075
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2006-06-20
論文頁數 89頁
口試委員 指導教授 - 蔡憶佳(tsai@cs.tku.edu.tw)
委員 - 顏淑惠(shyen@cs.tku.edu.tw)
委員 - 林慶昌(petani@gmail.com)
關鍵字(中) 支援向量機
支援向量
支向機
嵌入維度
時間序列
報酬序列
學習機器
關鍵字(英) Support Vector Machine
Support Vector
SVM
SVR
Embedded Dimension
Time Series
Return Series
Learning Machine
第三語言關鍵字
學科別分類
中文摘要
投資股票市場是一種滿熱門的投資管道,但卻存在著許多影響股價的各種因素。在資訊科技不斷發展之下,已有許多學者嘗試以各種理論與方法來預測股票市場的未來走勢,其中以人工智慧方法最為引入注目。
  支援向量機(Support Vector machine, SVM)是一種基於結構風險最小化的新穎學習機器演算法。由於它具有許多吸引人的特性以及可靠的經驗效能,因此有越來越多學者將它應用到各個領域中。
  本研究嘗試以支援向量機為分析工具,運用於台灣股票市場。以股市加權指數為樣本,利用嵌入維度切割股價指數報酬序列,並透過支援向量機來建構分析模型,產生股價指數之漲跌預測正確率,同時呈現訓練資料多寡對其影響。
  研究結果顯示,在一般的情況下,台灣股票市場指數波動是隨機的。本研究得知,在訓練資料數量方面,長期的訓練資料並無明顯注於未來預測;反之,中短期數量的訓練資料較能抓住未來走勢。
英文摘要
Stock market is a popular financial tool. There are many factors that affect stock prices. Computer technology has been constantly improving, and there is a growing interest in applying more sophisticated mathematical tools in studying the stock market.
  Support Vector Machine (SVM) based on structural risk minimization theory is a modern algorithm of learning machine. Lots of scholars apply SVM to different kinds of problems due to many attractive features and promising empirical performance.
  In this paper, we try to use SVM as an analytical tool and apply it for analyzing Taiwan stock market. Return series constructed from The Taiwan Stock Exchange Capitalization Weighted Stock Index (TAIEX) time series and cutting by embedded dimension are regarded as the original data. Support vector machine is applied to construct analytical model for the stock index fluctuation simulation.
  Results reveal that the fluctuation of TAIEX is random walk in general. In amount of training history data, it shows that long training data period is not strikingly helpful to predict the trend of the stock index, but using medium-term or short-term training data is good for catching the future stock index's tendency.
第三語言摘要
論文目次
目錄

中文摘要	I
英文摘要	II
致謝	III
圖目錄	VII
表目錄	IX
第一章 緒論	1
第一節 研究背景	1
第二節 研究目的	4
第三節 研究方法	5
第四節 研究步驟	5
第五節 論文架構	7
第二章 文獻探討	8
第一節 統計學習理論	8
一、經驗風險	8
二、VC維	9
三、結構風險最小原理	10
第二節 支援向量分類	12
一、線性支援向量分類	12
二、非線性支援向量分類	19
第三節 支援向量迴歸	26
一、線性迴歸	26
二、非線性迴歸	30
第四節 文獻回顧	32
第三章 股價資料之分析研究	34
第一節 時間序列	34
第二節 報酬序列	34
第三節 特徵萃取	36
第四節 誤差評估	38
一、Leave-One-Out效能評估	38
二、n-Fold效能評估	39
第五節 模型運作	40
第四章 實驗結果	42
第一節 實驗成果	42
試驗組A	45
試驗組B	47
試驗組C	49
試驗組D	51
試驗組E	53
試驗組F	55
試驗組G	57
試驗組H	59
試驗組I	61
試驗組J	63
試驗組K	65
試驗組L	67
試驗組M	69
試驗組N	71
第二節 參考文獻比較	79
第五章 結論	81
第一節 研究結論	81
第二節 未來研究	82
參考文獻	83
英文論文	85



圖目錄

圖 1:國際油價漲跌曲線	2
圖 2:研究流程圖	6
圖 3:VC維	10
圖 4:SRM歸納原理	11
圖 5:最佳分割超平面	13
圖 6:線性支援向量機 – 處理線性可分兩類資料	15
圖 7:無法線性區分為兩類問題	17
圖 8:線性支援向量機 – 處理線性不可分的分類問題	18
圖 9:非線性支援向量機 –處理線性不可分的分類問題	20
圖 10:對應原始資料至特徵空間	20
圖 11:二維空間中的資料	21
圖 12:三維特徵空間中的資料	22
圖 13:線性迴歸函數	27
圖 14:時間序列與報酬序列走勢圖	35
圖 15:訓練資料圖解	36
圖 16:時間序列走勢圖	37
圖 17:系統運作流程圖	41
圖 18:預測統計長條圖(1999/01/05~2005/12/30)	46
圖 19:預測統計長條圖(2000/01/04~2005/12/30)	48
圖 20:預測統計長條圖(2001/01/02~2005/12/30)	50
圖 21:漲跌預測長條圖(2002/01/02~2005/12/30)	52
圖 22:預測統計長條圖(2002/04/01~2005/12/30)	54
圖 23:預測統計長條圖(2002/07/01~2005/12/30)	56
圖 24:預測統計長條圖(2002/10/01~2005/12/30)	58
圖 25:預測統計長條圖(2003/01/02~2005/12/30)	60
圖 26:預測統計長條圖(2003/04/01~2005/12/30)	62
圖 27:預測統計長條圖(2003/07/01~2005/12/30)	64
圖 28:預測統計長條圖(2003/10/01~2005/12/30)	66
圖 29:預測統計長條圖(2004/01/02~2005/12/30)	68
圖 30:預測統計長條圖(2004/04/01~2005/12/30)	70
圖 31:預測統計長條圖(2004/07/01~2005/12/30)	72
圖 32:預測數據綜合統計圖(資料數量之影響)	73
圖 33:預測數據綜合統計(嵌入維度之影響)	75
圖 34:報酬波動走勢圖(資料起始:92/04;嵌入維度:50)	76
圖 35:報酬波動走勢圖(資料起始:91/04;嵌入維度:16)	77
圖 36:報酬波動走勢圖(資料起始:91/07;嵌入維度:21)	77
圖 37:報酬波動走勢圖(資料起始:92/07;嵌入維度:48)	78
圖 38:報酬波動走勢圖(資料起始:92/07;嵌入維度:50)	78



表目錄

表 1:國內主要銀行放款利率(2006年2月21日)	2
表 2:三維特徵空間中的資料 – 可以線性函數區隔	22
表 3:m=2,由時間序列產生之訓練資料	37
表 4:資料研究期間	42
表 5:實驗硬體環境	42
表 6:實驗軟體環境	42
表 7:試驗A~L之訓練資料期間	43
表 8:正確率計算表	44
表 9:預測統計表(1999/01/05~2005/12/30)	46
表 10:預測統計表(2000/01/04~2005/12/30)	48
表 11:預測統計表(2001/01/02~2005/12/30)	50
表 12:預測統計表(2002/01/02~2005/12/30)	52
表 13:預測統計表(2002/04/01~2005/12/30)	54
表 14:預測統計表(2002/07/01~2005/12/30)	56
表 15:預測統計表(2002/10/01~2005/12/30)	58
表 16:預測統計表(2003/01/02~2005/12/30)	60
表 17:預測統計表(2003/04/01~2005/12/30)	62
表 18:預測統計表(2003/07/01~2005/12/30)	64
表 19:預測統計表(2003/10/01~2005/12/30)	66
表 20:預測統計表(2004/01/02~2005/12/30)	68
表 21:預測統計表(2004/04/01~2005/12/30)	70
表 22:預測統計表(2004/07/01~2005/12/30)	72
表 23:預測數據綜合統計表(資料數量之影響)	73
表 24:預測數據綜合統計(嵌入維度之影響)	74
表 25:實驗結果比較表	80
參考文獻
[1]	B. Scholkopf, C. J. C. Burges, and A. J. Smola, Advances in Kernel Methods: Support Vector Learning: The MIT Press, 1998.
[2]	W. Light, Advances in Numerical Analysis : Volume Ⅱ: Wavelets, Subdivision Algorithms, and Radial Basis Functions: Oxford University Press, 1992.
[3]	R. Bellman, Dynamic Programming: Princeton University Press, 1957.
[4]	G. Mak, "The Implementation Of Support Vector Machines Using The Sequential Minimal Optimization," 2000.
[5]	C.-C. Chang and C.-J. Lin, "LIBSVM:a Library for Support Vector Machines," 2004.
[6]	J. Weston and C. Watkins, "Multi-class Support Vector Machines," 1998.
[7]	V. N. Vapnik, The Natural Of Statistical Learning Theory, 2nd ed: Springer, 1999.
[8]	R. Fletcher, Practical Methods of Optimization, 2nd ed: John Wiley & Sons, 2000.
[9]	T. Hellstrom and K. Holmstrom, "Predictable Patterns in Stock Returns," Opuscula ISRN HEV-BIB-OP-SE, 1998.
[10]	P. Cootner, The Random Character of Stock Market Prices: MIT Press, 1964.
[11]	B. Scholkopf, "Statistical Learning and Kernel Methods," Microsoft Research Technical Report MSR-TR-2000-23, 2000.
[12]	V. N. Vapnik, Statistical Learning Theory: Wiley, 1998.
[13]	S. Gunn, "Support Vector Machines for Classification and Regression," ISIS Technical Report, 1998.
[14]	C. Cortes and V. N. Vapnik, "Support vector networks," Machine Learning, vol. 20, pp. 273-297, 1995.
[15]	B. E. Boser, I. M. Guyon, and V. N. Vapnik, "A training algorithm for optimal margin classifiers," In Fifth Annual Workshop on Computational Learn Theory, 1992.
[16]	A. J. Smola and B. Scholkopf, "A Tutorial on Support Vector Regression," NeuroCOLT Technical Report NC-TR-1998-030, 1998.
[17]	陳雅雯, "支援向量機於股價漲跌預測之應用," 南華大學資訊管理研究所碩士, 民國92年.
[18]	王春笙, "以技術指標預測台灣股市股價漲跌之實證研究 --以類神經網路與複迴歸模式建構," 國立台灣大學資訊管理研究所碩士, 民國85年.
[19]	賴漢楨, "技術指標在台灣股市之實證研究─相對期間價量分析法," 大葉大學國際企業管理研究所碩士, 民國93年.
[20]	賴宏仁, "結合技術分析與類神經網路以支援股票投資決策之研究," 國立中山大學資訊管理研究所碩士, 民國84年.
[21]	梅玉成, "應用分散式類神經網路於財經資料庫之資料擷取與決策支援--以股票評等系統為例," 國立台灣大學資訊管理研究所碩士, 民國87年.
[22]	何盈慧, "應用演化式模糊系統來研究台股指數期貨投資決策," 景文技術學院資訊管理系, 民國94年.
[23]	林曉雯, "類神經網路在台灣股市投資之應用-指標選取與回饋式網路架構之建立," 國立台灣大學資訊管理研究所碩士, 民國86年.
論文全文使用權限
校內
紙本論文於授權書繳交後2年公開
校內書目立即公開
校外
不同意授權

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信