淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-2409200621305300
中文論文名稱 資料探勘技術運用在股市序列樣型技術分析之研究
英文論文名稱 Applying Data Mining to Analyze Sequential Patterns in the stock
校院名稱 淡江大學
系所名稱(中) 資訊管理學系碩士班
系所名稱(英) Department of Information Management
學年度 94
學期 2
出版年 95
研究生中文姓名 史育英
研究生英文姓名 Yu-Ying Shih
學號 692520082
學位類別 碩士
語文別 中文
口試日期 2006-05-20
論文頁數 88頁
口試委員 指導教授-李鴻璋
委員-陳安斌
委員-陳彥良
中文關鍵字 資料探勘  時間序列樣型  股價預測 
英文關鍵字 Data Mining  Time Sequential Pattern  Price Forecasting 
學科別分類 學科別社會科學管理學
學科別社會科學資訊科學
中文摘要 本文利用資料探勘技術,來分析台灣股票期貨市場的研究,用過去股市的歷史K線資料建立序列樣型,來預測當日的漲跌,以提供金融投資決策者的參考。股票市場呈現所有投資者決策集合的結果,而投資者的投資行為有其時間關聯性;此投資順序性現象可以利用資料探勘(Data Mining)的技術進行知識的挖掘,尤其資料探勘中的時間序列樣型(Time Sequential Pattern)分析即是用來研究兩件事件前後順序的關係,而近來此項技術演算法有重大的突破,因此採用此一技術來分析股票市場的行為,希望可開展新的研究方向。
本研究的目的在於歸納台灣股票期貨市場的投資序列特徵,根據過去股票市場的歷史性K線交易資料來探勘出台灣股票期貨市場指數期貨的時間序列樣型相關模式,就是使用資料探勘的技術尋找期貨市場指數期貨中具有特別意義的K線組合序列,是否存在期貨市場開盤後15分鐘的三根五分鐘K線漲跌順序相關組合的特性,並依分析結果找出當天日K線具有預期漲跌幅度的相關特性,據此建構台灣股票期貨市場指數期貨的操作行為模式,以提供投資者作正確的金融投資決策。
英文摘要 Abstract:
Our research applies data mining technique to analyze stock and forward market in Taiwan. We build the Time Sequential Pattern by constructing the historical data of Bar-chart (or K-line) of the stock market futures to assist investors` decisions making. The performance of the stock market is the collection of all individuals` decision, and there are some timing relations between their investments. The phenomenon of sequential investment can be studied or explained by using Data Mining technique, especially the Sequential Pattern Analysis. The Sequential Pattern Analysis is used to analyze the sequential relation between two events. The technique has advanced greatly in recent years, so we hope that it would be a new research way by using this technique to analyze the behavior of the stock market.
The object of this research is to generalize the characteristic of the time sequential pattern of investments in the stock market futures in Taiwan. Based on the historical bar-chart transaction data in the stock market, we mine for the sequential patterns of Taiwan stock exchange capitalization weighted stock index futures; use Data mining technique to discover some bar-chart combination sequence which may construct the behavior model to provide the investors with useful information and to assist them doing the correct decisions making .
論文目次 第一章 緒論 1
1.1. 研究背景與動機 1
1.2. 研究目的 3
1.3. 研究方法 3
1.4. 研究架構 4
第二章 文獻探討 8
2.1. 資料探勘之技術與回顧 8
2.1.1.資料探勘定義 8
2.1.2. 資料探勘的流程 10
2.1.3. 關聯法則的相關研究 11
2.1.4. 序列樣型的相關研究 14
2.2. 股票市場技術分析之相關文獻探討 15
2.2.1. 股市投資理論 15
2.2.2. 投資研究的分類 16
2.2.3. 技術指標分析 18
2.3. 指數採樣過程與相關文獻探討 20
第三章 研究方法 27
3.1. 股市資料和研究主題 27
3.2. 方法流程 27
3.3. 交易資料轉換 29
3.4. 取樣及篩選 36
3.5. 探勘作業及測試階段 37
3.5.1. 探勘階段 37
3.5.2. 測試階段 38
3.6. 驗證作業 38
第四章 實驗 39
4.1. 相同對象別實驗 40
4.2. 依期望幅度不同的比較 47
第五章 結論及未來改善 51
5.1. 結論 51
5.2. 未來改善 52

圖目錄
圖1.1 研究架構 6
圖3.1 開盤-最高-最低-收盤 29
圖3.2 等分為三的K線圖 29
圖3.3 極端型K線圖 30
圖3.4 中性型K線圖 30
圖3.5 爬長型K線圖 31
圖3.6 漂流型K線圖 31
圖4.1 實驗4.1設定取樣及篩選參數的執行畫面 40
圖4.2 步驟三畫面的執行畫面 41
圖4.3 資料庫筆數資料 41
圖4.4 實驗4.1的測試結果 42
圖4.5 實驗4.1搭配成交量的測試結果 44
圖4.6 實驗4.1搭配KD的測試結果 44
圖4.7實驗4.1搭配成交量及KD的測試結果 45

表目錄
表2.1 發行量加權股價指數之產業分類及其比重參考 21
表2.2 台股指數期貨契約規格 26
表4.1 實驗4.1使用的設定和參數 40
表4.2 期望漲幅+0.4、無搭配之成功率 45
表4.3 期望漲幅+0.4、搭配成交量之成功率 46
表4.4 期望漲幅+0.4、搭配KD之成功率 46
表4.5 期望漲幅+0.4、搭配成交量及KD之成功率 47
表4.6 序列型樣結果比較表 48
表4.7 期望漲幅 +0.5成功率 48
表4.8 期望漲幅 +1成功率 49
表4.9 期望漲幅 -0.5成功率 49
表4.10 期望漲幅 -1成功率 50


參考文獻 參考文獻
中文部分
[1] 卞志祥,「台灣加權股價指數投資組合之基因演算法建構模型」,交大資管所,碩士論文,1996。
[2] 王邵佑,「隨機指標(KD 值)投資績效之實證研究」,國立台北大學企業管理研究所,碩士論文,1999。
[3] 王春笙,「以技術指標預測台灣股市股價漲跌之實證研究-以類神經網路與複回歸模式建構」,國立台灣大學資訊管理所,碩士論文,1996。
[4] 王皓正,「時間序列資料之查詢與資料發掘--以台灣股市為例」,國立台灣大學資訊管理研究所,碩士論文,2000。
[5] 吳琮璠、謝清佳,資訊管理理論與實務,智勝文化事業公司,台北,1999,4th。
[6] 李金鳳,「資料探勘面面觀」,資訊與教育雜誌,台北,2001。
[7] 杜金龍,基本分析在台灣股市應用的訣竅。台北:金錢文化,1996。
[8] 杜金龍,技術指標-在台灣股市應用的訣竅,台北,金錢文化,1998,初版。
[9] 李安邦,「以遺傳演算法為基底的模糊專家系統於投資策略之應用」,元智管理研究所,碩士論文,1997。
[10] 林萍珍,「遺傳演算法在使用者導向的投資組合選擇之應用」,國立中央大學資管所,碩士論文,1998。
[11] 高梓森,「台灣股市技術分析之實證研究」,國立台灣大學財務金融研究所,碩士論文,1993。
[12] 胡國瑜,「類神經網路產業盈餘預測及其投資策略之研究--以電子電機及紡織業為例」,政大資管所,碩士論文,1996。
[13] 張簡尚偉、張衡閣,「利用常見型樣相鄰矩陣來探勘資料庫序列型樣」,第十三屆國際資訊管理學術研討會,台北,第729-736頁,2001。
[14] 陳世章,「基本分析與股價報酬之關聯性」,台灣大學會計研究所,碩士論文,1996。
[15] 陳完禧、蔡佩瑾、周恩聖,「網際網路網頁存取樣式資料探勘之研究」,第七屆資訊管理研究暨實務研討會,2002。
[16] 陳建福,「遺傳程式與市場擇時策略之研究:台灣股票市場的應用」,政大經研所,碩士論文,1995。
[17] 黃慶光,「台灣股價指數反向操作策略及價量關係分析」,碩士論文,國立中正大學企業管理研究所,2001
[18] 莊樹人,「投資組合之最適資料長度」,銘傳大學經濟研究所,碩士論文,2001
[19] 曾思博,「類神經網路於股價預測與資金之配置應用」,中央大學資訊管理研究所,碩士論文,1999。
[20] 鄧紹勳,「遺傳演算法於股市擇時策略之研究」,中央大學資訊管理研究所,碩士論文,1999。
[21] 蘇明南 ,「移動平均線法則應用於台灣股市之實證研究」,碩士論文,淡江大學財務金融研究所,碩士論文,2001。
英文部分
[22] A. Savasere, E. Omiecinski, and S. Navathe, “An Efficient Algorithm for Mining Association Rules,” Proceedings of the 21st Conference of Very Large Databases (VLDB), pp. 432-444 1995.
[23] C. Apte and S. Weiss. Data mining with decision trees and decision rules. Future Generation Computer Systems, 13, 1997.
[24] C. Westphal and T. Blaxton, Data Mining Solutions-Methods and Tools for Solving Real-World Problems, John Wiley & Sons 1998. Fayyard, U. M., Piatesky-Shapiro, G., and Smyth, P., From Data Mining toKnowledge Discovery: An Overview, Chap. 1 in advances in KnowledgeDiscovery and Data Mining, AAAI Press/ The MIT Press Menlo Park, California,1996, pp. 1-34.
[25] Gia-Shuh Jang, F. Lai and Tai-Ming Parng.Intelligent Stock Trading Decision Support System Using Dual Adaptive-Structure Neural Networks. Journal of Information Science and Engineering, 9(2): 271-297, June 1993.
[26] J. Han and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann,San Francisco, 2001.
[27] J. Han, J. Pei, and Y. Yin, “Mining Frequent Patterns without Candidate Generation,“ Proceedings of the ACM SIGMOD International Conference on Management of Data, Dallas, USA, pp. 241-250 ,2000.
[28] J. Han, J. Pei, B. Mortazavi-Asl, Q. Chen, U. Dayal, and M-C. Hsu, “Freespan: Frequent pattern-projected sequential pattern mining,” Proceedings of the International Conference of Knowledge Discovery and Data mining, pp.355-359 ,2000.
[29] M. Mehta, R. Agrawal, and J. Rissanen. SLIQ : A fast scalable classifier for data mining. (EDBT'96), Avignon, France, March 1996.
[30] Miller Freeman Inc, “The Methodology of Economics and the Survival Principle Revisited and Revised: Some Welfare and Public Policy Implications of Modeling the Economic Agent”,Journal article by Morris Altman; Review of Social Economy, Vol. 57,1999
[31] R. Agrawal, and R. Srikant, “Fast Algorithm for Mining Association Rules in Large Databases, ”Proc. 20th Very Large Database Conf., pp.478-499, Sept.,1994.
[32] R. Agrawal and R.Srikant, “Mining sequential patterns,” Proceedings of The International Conference on Data Engineering, Taipei, Taiwan, pp. 3-14 ,1995.
[33] R. Agrawal, J. Gehrke, D. Gunopulos, and P. Raghavan. Automatic subspace clustering of high dimensional data for data mining applications. SIGMOD'98
[34] R. Agrawal, T. Imelinski and A. Swami, “Mining Association Rules between Set of Itemset in Large Database,” Proc. ACM Special Interest Group on Management of Data “(SIGMOD), pp. 207-216, May 1993.
[35] R. Wang, V. Storey, and C. Firth. A framework for analysis of data quality research. IEEE Trans. Knowledge and Data Engineering, 7:623-640, 1995.
[36] Steven alczak, “An Empirical Analysis of Data Requirements for Financial Forecasting with Neural Networks”,1999
[37] Steven Gold, and Paul Lebowitz. Computerized Stock Screening Rules for Portfolio Selection. Financial Services Review,8: 61-70, 1999.
[38] Y. Wand and R. Wang. Anchoring data quality dimensions ontological foundations. Communications of ACM, 39:86-95, 1996.
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2008-09-27公開。
  • 同意授權瀏覽/列印電子全文服務,於2008-09-27起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2281 或 來信