淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-2805201614372600
中文論文名稱 應用深度學習於財經新聞來源對股價趨勢預測之研究
英文論文名稱 A Study of Deep Learning with Different Finance News Providers for Forecasting Stock Price Trends
校院名稱 淡江大學
系所名稱(中) 資訊管理學系碩士在職專班
系所名稱(英) On-the-Job Graduate Program in Advanced Information Management
學年度 104
學期 2
出版年 105
研究生中文姓名 李嘉洲
研究生英文姓名 Chia-Chou Lee
學號 703630185
學位類別 碩士
語文別 中文
口試日期 2016-05-29
論文頁數 89頁
口試委員 指導教授-戴敏育
委員-詹前隆
委員-侯永昌
中文關鍵字 文字探勘  股價趨勢預測  深度學習  財經新聞  異常報酬 
英文關鍵字 Text Mining  Stock Price Trends Forecasting  Deep Learning  Finance News  Abnormal Returns 
學科別分類
中文摘要 對股價趨勢進行預測一直是投資人非常感興趣的議題,隨著電子媒體快速發展,每日有數以百計與個股相關的財經新聞於不同的電子媒體發佈。以往也有許多相關的研究,運用文字探勘技術與機器學習方式試著對股價趨勢進行預測,以探討是否能藉此獲得異常報酬,然而,卻顯少有研究探討於不同的新聞媒體是否影響預測的結果。本研究聚焦在不同的財經新聞來源對投資決策的影響,並運用深度學習以提高預測能力。實證結果顯示不同的財經新聞來源對投資人的投資決策影響明顯不同,且深度學習能夠提高新聞分類的準確性。
英文摘要 Investors have always been interested in stock price forecasting. Since the development of electronic media, hundreds pieces of financial news are released on different media every day. There were many previous related researches discussed whether the stock price forecasting through text mining technology and machine learning could lead to abnormal returns. However, few of them involved the discussion on whether using different media could affect forecasting results. This research focuses on the influence of using different financial resources to investment and how to improve the accuracy of forecasting through deep learning. The result shows various financial resources have significantly different effects to investors and their investments, while the accuracy of news categorization could be improved through deep learning.
論文目次 目次

第一章 緒論 1
1.1 研究背景 1
1.2 研究動機 2
1.3 問題定義 2
1.4 研究目的 3
1.5 論文架構 4
第二章 文獻探討 7
2.1 文字探勘 7
2.2 分句斷詞與意見詞典 8
2.2.1 意見詞典 9
2.2.2 斷詞 11
2.3 股價之可預測性 13
2.3.1 基本面分析法 13
2.3.2 技術面分析法 13
2.3.3 消息面分析法 14
2.4 財經新聞於股價預測 15
2.5 深度學習 17
2.6 本章小結 18
第三章 系統架構與研究方法 20
3.1 研究方法 20
3.2 研究架構 23
3.3 財經新聞與語料蒐集 25
3.4 資料預處理 29
3.5 新詞萃取 30
3.6 特徵值產生 31
3.7 深度學習 34
第四章 資料分析與結果 41
4.1 資料區間與研究對象 41
4.1.1 資料區間 41
4.1.2 研究對象 42
4.2 資料分配與實驗說明 45
4.2.1 資料分配 45
4.2.2 實驗說明 47
4.3 實驗結果與分析 49
4.3.1 實驗一 : 基於詞典法 49
4.3.2 實驗二 : 支援向量機 54
4.3.3 實驗三 : 深度學習 58
4.3.4 綜合分析 62
第五章 結論與意涵 68
5.1 結論 68
5.2 研究貢獻 69
5.3 研究限制 69
5.4 管理意涵 70
5.5 未來研究方向 71
參考文獻 73
附錄 78


圖目次

圖 1 歷年上市櫃股票交易金額比重 2
圖 2 論文架構 6
圖 3 資訊對事件、新聞、股價之互動關係圖 16
圖 4 神經元權重學習原理示意圖 18
圖 5 資訊系統發展方法的研究生命週期循環圖 21
圖 6 系統發展研究法研究流程圖 23
圖 7 應用深度學習於財經新聞來源對股價趨勢預測之研究架構圖 24
圖 8 Python Crawler 擷取今日新聞財經新聞網頁 26
圖 9 Python Crawler 擷取蘋果日報財經新聞網頁 27
圖 10 Python Crawler 擷取自由時報電子報財經新聞網頁 28
圖 11 Python Crawler 擷取MoneyDJ理財網財經新聞網頁 29
圖 12 傳統非深度神經網路示意圖 35
圖 13 深度神經網路示意圖 35
圖 14 Sigmoid函數圖 37
圖 15 TanH函數圖 37
圖 16 ReLu函數圖 38
圖 17 TensorFlow模型建構示意圖 39
圖 18 五摺式驗證法進行深度學習預測模型建構流程圖 40
圖 19 以意見詞典分類進行五日交易之報酬率比較圖 51
圖 20 以意見詞典分類進行二十日交易之報酬率比較圖 52
圖 21 以意見詞典分類進行六十日交易之報酬率比較圖 52
圖 22 以意見詞典分類進行交易之報酬率熱度圖 53
圖 23 以SVM預測股價趨勢進行五日交易之報酬率比較圖 55
圖 24 以SVM預測股價趨勢進行二十日交易之報酬率比較圖 55
圖 25 以SVM預測股價趨勢進行六十日交易之ROI比較圖 56
圖 26 以SVM預測股價趨勢進行模擬交易之報酬率熱度圖 57
圖 27 以深度學習預測股價趨勢進行五日交易之報酬率比較圖 59
圖 28 以深度學習預測股價趨勢進行二十日交易之報酬率比較圖 60
圖 29 以深度學習預測股價趨勢進行六十日交易之報酬率比較圖 60
圖 30 以深度學習預測股價趨勢進行模擬交易之報酬率熱度圖 62
圖 31 今日新聞各天期之模型ROI綜合比較熱度圖 64
圖 32 蘋果日報各天期之模型ROI綜合比較熱度圖 65
圖 33 自由時報各天期之模型ROI綜合比較熱度圖 66
圖 34 MoneyDJ理財網各天期之模型ROI綜合比較熱度圖 67


表目次

表 1 知網中文情緒詞範例表 9
表 2 NTUSD意見詞範例表 10
表 3 NTUFSD意見詞範例表 10
表 4 新聞媒體採編團隊與內容涵蓋比較表 29
表 5 iMFinanceSD意見詞範例表 31
表 6 特徵標記說明表 31
表 7 新聞內文範例表 32
表 8 新聞詞彙擷取範例表 33
表 9 特徵標記結果 33
表 10 簡列研究對象周轉率統計表 44
表 11 各新聞來源新聞篇數統計表 46
表 12 深度學習預測模型正確率(Accuracy)列表 58

參考文獻 1 Ahmad, K., Oliveira, P. d., Casey, M., & Taskaya, T. (2002). Description of events: an analysis of keywords and indexical names. Third International Conference on Language Resources and Evaluation, 29-35.

2 Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3), 273-297.

3 Deng, L., & Yu, D. (2014). Deep learning: Methods and applications. Foundations and Trends in Signal Processing, 7(3–4), 197-387.

4 Dong, Z., & Dong, Q. (2006). HowNet and the Computation of Meaning: World Scientific.

5 Gidofalvi, G., & Elkan, C. (2001). Using news articles to predict stock price movements. Department of Computer Science and Engineering, University of California, San Diego.

6 Hearst, M. (2003). What is text mining. SIMS, UC Berkeley. Retrieved from http://people.ischool.berkeley.edu/~hearst/text-mining.html

7 Hinton, G. E., & Salakhutdinov, R. R. (2006). Reducing the dimensionality of data with neural networks. Science, 313(5786), 504-507.

8 Holthausen, R. W., & Larcker, D. F. (1992). The prediction of stock returns using financial statement information. Journal of Accounting and Economics, 15(2), 373-411.

9 Karpathy, A. (2016). CS231n: Convolutional Neural Networks for Visual Recognition. Retrieved from http://cs231n.github.io/neural-networks-1/

10 Kaur, A., & Duhan, N. (2015). A Survey on Sentiment Analysis and Opinion Mining. International Journal of Innovations & Advancement in Computer Science.

11 Kharde, V., & Sonawane, S. (2016). Sentiment Analysis of Twitter Data: A Survey of Techniques. arXiv preprint arXiv:1601.06971.

12 Ku, L. W., & Chen, H. H. (2007). Mining opinions from the Web: Beyond relevance retrieval. Journal of the American Society for Information Science and Technology, 58(12), 1838-1850.

13 LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436-444.

14 Li, Q., Wang, T., Li, P., Liu, L., Gong, Q., & Chen, Y. (2014). The effect of news and public mood on stock movements. Information Sciences, 278, 826-840.

15 Loughran, T., & McDonald, B. (2011). When is a liability not a liability? Textual analysis, dictionaries, and 10‐Ks. The Journal of Finance, 66(1), 35-65.

16 Mittermayer, M.-A. (2004). Forecasting intraday stock price trends with text mining techniques. Paper presented at the System Sciences, 2004. Proceedings of the 37th Annual Hawaii International Conference on.

17 Murphy, J. J. (1999). Technical analysis of the financial markets: A comprehensive guide to trading methods and applications: Penguin.

18 Nunamaker Jr, J. F., Chen, M., & Purdin, T. D. (1990). Systems development in information systems research. Journal of management information systems, 7(3), 89-106.

19 Ou, J. A., & Penman, S. H. (1989). Financial statement analysis and the prediction of stock returns. Journal of Accounting and Economics, 11(4), 295-329.

20 Rosenblatt, F. (1957). The perceptron, a perceiving and recognizing automaton Project Para: Cornell Aeronautical Laboratory.

21 Rumelhart, D. E., McClelland, J. L., & Group, P. R. (1986). Parallel Distributed Processing: Explorations in the Microstructure of Cognition, Vol. 1-2. Cambridge, MA.

22 Sullivan, D. (2001). Document warehousing and text mining: techniques for improving business operations, marketing, and sales: John Wiley & Sons, Inc.

23 Tumarkin, R., & Whitelaw, R. F. (2001). News or noise? Internet postings and stock prices. Financial Analysts Journal, 57(3), 41-51.

24 林宜萱. (2013). 財經領域情緒辭典之建置與其有效性之驗證-以財經新聞為元件. (碩士), 國立臺灣大學, 台北市.

25 陳裕菘, 謝邦昌, 李勝輝, & 陳郁婷. (2014). 運用文字探勘與資料採礦技術建立匯率預測模型-以人民幣兌新台幣為例. Journal of Data Analysis, 9(1), 133-146.

26 喻欣凱. (2008). 運用支援向量機與文字探勘於股價漲跌趨勢之預測. (碩士), 輔仁大學, 新北市.

27 黃寶玉, 倪衍森, & 劉程睿. (2010). 探討週轉率對價量波動的連動性及其成因分析~ 以富邦科技 ETFs 成分股爲例. 財金論文叢刊(13), 45-58.

28 謝衫蒂. (2014). 應用機器學習與多辭典的中英雙語意見分析之研究. (碩士), 淡江大學, 新北市.

29 鍾任明. (2005). 運用文字探勘於日內股價漲跌趨勢預測之研究. (碩士), 中原大學, 桃園縣.
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2016-07-18公開。
  • 同意授權瀏覽/列印電子全文服務,於2016-07-18起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2486 或 來信