淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-2807201817295800
中文論文名稱 從社群媒體挖掘以感測日常交通滿意度之研究
英文論文名稱 Sensing Daily Travel Satisfaction Of Commuters by Mining Social Media
校院名稱 淡江大學
系所名稱(中) 運輸管理學系運輸科學碩士班
系所名稱(英) Department of Transportation Management
學年度 106
學期 2
出版年 107
研究生中文姓名 陳翰
研究生英文姓名 Chen Han
學號 605660082
學位類別 碩士
語文別 中文
口試日期 2018-06-25
論文頁數 93頁
口試委員 指導教授-陶治中
委員-顏上堯
委員-劉霈
中文關鍵字 社群媒體挖掘  情感分析  日常交通滿意度  卷積神經網路演算法 
英文關鍵字 Social media mining  Sentiment analysis  Daily travel satisfaction  Convolutional Neural Networks algorithm 
學科別分類
中文摘要 本研究係針對日常交通下社群媒體進行文本挖掘,首先透過建置社群媒體文本資料庫,並將日常交通之社群媒體文本進行情感分析,以瞭解民眾對於日常交通下各公共運具評論之情緒,接著使用深度學習之CNN演算法建構多元情緒決策情感分析模型,再經由實證分析,運用文本挖掘及深度學習分類技術,分析民眾日常通勤通學搭乘公共運具之滿意度,並建構滿意度五個評級尺度,找出民眾搭乘不同公共運具之整體情緒,最後使用K-means集群演算法探討社群媒體輿情內部特徵,此為本研究建立之社群媒體挖掘與情感分析通用程序。
本研究之模式準確度在五個尺度下達79%,並可找出民眾搭乘不同公共運具所關注的變數。研究結果顯示:不論通勤或商務旅次皆關注是否能準時到達目的地,可見民眾最為重視搭乘公共運具之效率;而搭乘火車類、公車類、客運類之通勤族皆關注駕駛員及排班,可見民眾重視資訊的掌握與服務及乘車的安全性。根據自社群媒體挖掘而產生的公共運輸滿意度結果,本研究經由相關文獻評析而研擬相對應的改善策略。若特定時間的班次常有誤點情況時,業者應適時發佈到站時間資訊,則可減少民眾的負面情感。而駕駛員的素質、服務態度、應對能力等,對於民眾的影響亦相當直接,因此業者應對駕駛員進行系統性的在職訓練,亦有望提升民眾的正面情感;當前所有通勤族群對於費率的關注程度皆不明顯,顯示目前我國公共運具在費率制定尚受民眾肯定。本研究之建立之社群媒體挖掘與情感分析通用程序具有擴展性,此可供決策者藉由模型的修正與改良而能快速掌握網路輿情正、負面情感趨勢之即時資訊。
英文摘要 This study aims at proposing a generalized process of social media mining and sentiment analysis to sense commuters’ daily travel satisfaction. Firstly, available social media websites are chosen to perform text mining and filtered text database related to daily travel topics by using crawler systems. Secondly, a sentiment analysis is conducted to propose a multiple emotion recognition model which can be used to sense commuters’ emotions about public transportation vehicles including high speed rail, commuter rail, mass rapid transit, urban bus, intercity bus, specific bus and taxi by using Convolutional Neural Networks (CNN) algorithm from deep learning. Thirdly, an empirical study is performed to validate commuters’ daily travel satisfaction towards different public transportation vehicles with a five-grade-scale emotion recognition survey. Finally, influence factors depicting interrelationships among critical topics concerned public transportation services in social media mining are clustered with K-means algorithm and corresponding strategies to improve negative emotions against certain public transportation services are also provided. Empirical results show that the precision percentage of proposed model to verify critical variables of commuter’s public transportation satisfaction approximates 79% under five-grade scales. Either commuter or commercial trip purpose arrivals at destinations on time are much concerned by public transportation commuters. Driver behavior and timetable are also valued by public transportation commuters. It is recommended that operators should pay more attention to adjusting timetable and conducting systematical driver training programs for better emotions. In addition, fare topic is not significant for public transportation commuters that means current fare structures of public transportation are relatively acceptable by commuters. The proposed generalized process of social media mining and sentiment analysis in this study can be expanded with adequate modifications or improvements to grasp real-time information about net citizens’ emotion trends for decision makers.
論文目次 目錄
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 4
1.3 研究範圍與流程 5
第二章 文獻回顧 8
2.1 社群媒體文本挖掘 8
2.1.1 社群媒體 8
2.1.2 文本挖掘 10
2.2 情感識別 11
2.2.1 輿情定義 11
2.2.2 情感分析 12
2.2.3 情感識別 13
2.3 日常交通滿意度 14
2.4 深度學習 17
2.4.1 人工神經網路 18
2.4.2 深度學習 19
2.5 小結 21
第三章 研究方法 22
3.1 文本斷詞系統 23
3.2 詞頻演算法 24
3.3 卷積神經網路 25
3.4 K-means集群演算法 32
第四章 實證分析 33
4.1 實證分析流程架構 33
4.2 爬蟲流程 34
4.2.1 爬蟲流程說明 34
4.2.2 資料內容說明 39
4.3 結巴(jieba)斷詞 40
4.4 情感值計算 41
4.5 卷積神經網路 48
4.5.1 輸入層 49
4.5.2 卷積層 50
4.5.3 激活函數 51
4.5.4 池化層 52
4.5.5 全連接層 53
4.5.6 丟棄層 54
4.5.7 模式建構 55
4.5.8 模式驗證 64
4.6 詞頻演算法 68
4.7 K-means集群結果 69
4.8 管理意涵 74
第五章 結論 75
5.1 結論 75
5.2 建議 78
參考文獻 79
附錄A模式驗證結果 84


圖目錄
圖1.1 國人擁有社群帳號比例 2
圖1.2 研究流程圖 7
圖2.1 民眾外出旅次目的占比 15
圖2.2 民眾對於搭乘公共運具服務的滿意度 16
圖2.3 文字辨識函數表示方式 (李弘毅) 17
圖2.4 圖片識函數表示方式 (iker) 18
圖2.5 神經元結構 19
圖2.6 人工神經架構 19
圖3.1 情感分析模式建構流程圖 22
圖3.2 結巴斷詞成果 23
圖3.3 CNN基本架構 26
圖3.4 常用激活函數及其函數圖像 29
圖3.5 傳遞神經網路架構 30
圖4.1 實證分析流程圖 34
圖4.2 爬蟲程式(第一層關鍵詞) 35
圖4.3 爬蟲程式(第二層關鍵詞) 36
圖4.4 爬蟲程式(輸入情緒詞) 37
圖4.5 爬蟲程式(結果) 38
圖4.6 安裝結巴套件 40
圖4.7 結巴斷詞執行結果 41
圖4.8 訓練矩陣結果 41
圖4.9 情感區間尺度 44
圖4.10 情感值區間長條圖 44
圖4.11 捷運類情感趨勢圖 45
圖4.12 火車類情感趨勢圖 46
圖4.13 公車客運類情感趨勢圖 47
圖4.14 其他類情感值趨勢 48
圖4.15 Tensorflow運算流程 49
圖4.16 卷積神經網路架構 50
圖4.17 卷積運算示意圖 51
圖4.18 線性整流函數 52
圖4.19 Max pooling操作 53
圖4.20 全連接層示意圖 54
圖4.21 Dropout機制示意圖 55
圖4.22 CNN參數設計 56
圖4.23 CNN執行過程(jieba斷詞) 56
圖4.24 CNN執行過程(訓練1) 57
圖4.25 CNN執行過程(訓練2) 58
圖4.26 CNN執行過程(訓練3) 59
圖4.27 CNN執行過程(訓練4) 60
圖4.28 CNN執行過程(訓練5) 61
圖4.29 CNN執行過程(評估1) 62
圖4.30 CNN執行過程(評估2) 62
圖4.31 CNN執行過程(評估3) 62
圖4.32 CNN模式訓練測試震盪圖 63
圖4.33 模式驗證結果(非常滿意) 64
圖4.34 模式驗證結果(滿意) 65
圖4.35 模式驗證結果(普通) 65
圖4.36 模式驗證結果(不滿意) 66
圖4.37 模式驗證結果(非常不滿意) 66
圖4.38 擴增特徵詞 69


表目錄
表2.1 外出旅次目的之主運具類別占比 16
表2.2 民眾搭乘各項公共運具之滿意度 17
表4.1 資料型態 39
表4.2 部分情緒詞彙 42
表4.3 日常通勤情感值區間門檻 43
表4.4 設計情感值區間相關參數 43
表4.5 情感區間計算 44
表4.6 捷運類情感值 45
表4.7 火車類情感值 46
表4.8 公車客運類情感值 47
表4.9 其他類情感值 48
表4.10 新資料預測分類準確度 67
表4.11 混淆矩陣 67
表4.12 部分篩選完特徵詞 68
表4.13 合併後部分資料 70
表4.14 華德法凝聚過程表 71
表4.15 分群比較表(*表示平均值是最大或最小的一群) 72
表4.16 K-means分群特徵分布(粗體表示該變數最大或最小值) 73
表4.17 各運具滿意度之改善方案 74

參考文獻 中英文文獻
1. 劉文良(2007),網際網路行銷(第二版),台北:碁峰資訊。
2. 張斐章、張麗秋(2015),類神經網路導論原理與應用,蒼海圖書資訊股份有限公司(第二版) 。
3. 鄭捷(2016),機器學習-算法原理與編程實踐,北京:電子工業出版社。
4. 陳亭愷(2015),國道計程電子收費實施後之網路社群媒體文本情感分析研究,淡江大學運輸管理學系運輸科學碩士班碩士論文。
5. 蔡易辰(2016),三元決策理論應用於國道計程收費議題之情感分析研究,淡江大學運輸管理學系運輸科學碩士班碩士論文。
6. 洪士耕(2011),社群媒體之關係行銷研究-以7-Eleven之Facebook粉絲專頁使用者為例,中國文化大學新聞暨傳播學院學新聞學系碩士論文。
7. 交通部統計處(2017),民眾日常使用運具狀況調查摘要分析。
8. 交通部統計處(2017),交通部施政措施滿意度調查摘要分析。
9. 楊雅惠(2011),使用媒體豐富理論與網路互動理論解釋企業使用社群媒體行為,國立高雄第一科技大學資訊管理系碩士論文。
10. 李嘉洲(2016),應用深度學習於財經新聞來源對股價趨勢預測之研究,淡江大學資訊管理學系碩士在職專班碩士論文。
11. 李宏毅(2016),「什麼是深度學習」,數理人文,第十期。
12. 伊寶才, 王文通, 王立春(2015),「深度學習綜述」,北京工業大學學報 ,Vol.41,No.1。
13. 孫志軍, 薛磊, 許陽明, 王正(2012),「深度學習研究綜述」,計算機應用研究 ,Vol.29,No.8。
14. 郭俊桔(2012),使用情緒分析於圖書館使用者滿意度評估之研究,國立中興大學圖書資訊學研究所碩士學位論文。
15. 謝衫蒂(2014),應用機器學習與多辭典的中英雙語意見分析之研究,淡江大學資訊管理學系在職專班碩士論文。
16. 蔡國永, 夏彬彬(2016),「基於卷積神經網路的圖文融合媒體情感預測」,計算機應用,第二期,頁428-431。
17. 梁軍, 柴玉梅, 原慧斌, 昝紅英, 劉銘(2014),「基於深度學習的微博情感分析」,中文信息學報,第五期,頁155-161。
18. 孫瑛澤, 陳建良, 劉峻杰, 劉昭麟, 蘇豐文(2010),中文短句之情緒分類,第12屆自然語言與語音處理研討會中華民國計算語言學學會、國立國際暨南大學資工系與電機系。
19. 方濱興、許進、李建華(2014),在線社交網路分析,北京:電子工業出版社。
20. 于冬梅(2009),情感計算關鍵技術研究,東華大學信息科學與技術學院博士論文。
21. 鄒以勤(2012),顧客滿意、服務特性與回購意願關係之研究:以台灣高速鐵路為例,國立成功大學交通管理科學系碩士論文。
22. 陳建成(2008),「台灣高鐵服務品質及服務價值與顧客滿意度關係之實證研究」,數據分析期刊,3卷3期,頁95-116。
23. Arisoy, E., Sainath, T., Kingsbury, B., Ramabhadran, B. (2012), “Deep
Neural Network Language Models,” In Proceeding of the Joint Human
Language Technology Conference and the North American Chapter of the Association of Computational Language (HLT-NAACL) Workshop.
24. Cambria, E. and White, B. (2014), “Jumping NLP curves: A Review of
Natural Language Processing Research,” IEEE Computational Intelligence Magazine, Vol. 9, No. 2, 48–57.
25. Chen, Y.(2015),“Convolutional Neural Networks for Sentence Classification,”A thesis presented to the University of Waterloo in fulfillment of the
thesis requirement for the degree of Master of Mathematics in Computer Science.
26. Ellison, N. B.(2007),“The Benefits of Face book Friends: Social Capital
and College Students Use of Online Social Network Sites,” Journal of
Computer-Mediated Communication, 12, 1143-1168.
27. Kim, Y. M., N.W. G.(2008),“Politics as Friendship: The Impact of OnlineSocial Networks on Young Voters' Political Behavior,” Proceeding of Conference on International Communication Association, 22-26 May 2008, Montreal: TBA.
28. Kushin, M. J.(2010),“Did Social Media Really Matter? College Students' Use of Online Media and Political Decision Making in the 2008 Election,”Mass Communication and Society,13, 5: 608-630.
29. Severyn, A. & Moschitti, A. (2015), “Training Deep Convolutional NeuralNetwork for Twitter Sentiment Classification,” The 9th International
Workshop on Semantic Evaluation Proceedings of SemEval, 2015, 464-469.
30. Soujanya, P., Erik, C., Iti, C. & Amir, H. (2017), “Convolutional MKL
Based Multimodal Emotion Recognition and Sentiment Analysis”, 2016
IEEE 16th International Conference on Data Mining.
31. Strapparava, C. & Mihalcea, R. (2008),“Learning to Identify Emotions in Text,” SAC '08 Proceedings of the 2008 ACM symposium on Applied
Computing, 1556-1560.
32. Wu, C.-H. and Liang, W.-B. (2011), “Emotion Recognition of Affective
Speech based on Multiple Classifiers Using Acoustic-prosodic Information and Semantic Labels,” IEEE Transactions on Affective Computing, Vol. 2,No. 1, 10–21.
33. Yassine, M. & Hajj, H. (2010),“A Framework for Emotion Mining from
Text in Online Social Networks,” ICDMW '10 Proceedings of 2010 IEEEInternational Conference on Data Mining Workshops,1136-1142.
34. Zuo, Z., Shuai, B., Wang, G., Liu, X., Wang, X., Wang, B., & Chen, Y.(2015), ”Convolutional Recurrent Neural Networks: Learning Spatial
Dependencies or Image Representation,” 2015 IEEE Conference on
Computer Vision and Pattern Recognition Workshops, CVPR Workshops,
Boston, MA, USA, 18–26.
網路文獻
1. Brandon(2016),卷積神經網路的運作原理,https://brohrer.mcknote.com/zh-Hant/how_machine_learning_works/how_convolutional_neural_networks_work.html
2. 王十二的(2017),NLP與文本分類跟我們有什麼關係,http://www.jianshu.com/p/12de34cec389
3. 紅黑聯盟(2017),深度學習筆記五:卷積神經網絡CNN,https://read01.com/zh-tw/RE37gy.html#.WgktBWiCxhF
4. CSDN博客(2016),對卷積神經網絡(CNN)的簡單理解,https://read01.com/zh-tw/2zA0Po.html#.Wgktw2iCxhF
5. 維基百科,深度學習,https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0
6. 中研院智財技轉處,中文斷詞系統,http://ckipsvr.iis.sinica.edu.tw/
7. 資策會創研所(2017),台灣人特愛用FB、Line平均擁4個社群帳號,https://www.find.org.tw/market_info.aspx?n_ID=9095
8. 林志傑(2015),結巴中文斷詞,https://speakerdeck.com/fukuball/jieba-jie-ba-zhong-wen-duan-ci
9. Denny Britz(2015),Implementing a CNN for Text Classification in TensorFlow,http://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/
10. 陳勇汀(2011),Weka的K-Means分群演算法使用教學,http://blog.pulipuli.info/2016/12/wekak-meanssimplekmeans-clustering-with.html
11. Mr. Opengate(2016),AI-Ch16.5類神經網路實作-TensorFlow-介紹與入門教學,http://mropengate.blogspot.tw/2016/10/ai-ch165-tensorflow.html
12. 王浩全(2015),社群運算兩三事,https://www.facebook.com/notes/hao-chuan-wang/%E7%A4%BE%E7%BE%A4%E9%81%8B%E7%AE%97-social-computing-%E5%85%A9%E4%B8%89%E4%BA%8B/10153032839723256/
13. Kobe Chen(2016),3分鐘搞懂深度學習到底在深什麼,https://panx.asia/archives/53209
14. 大數據文摘(2017),手把手範例+代碼:一文帶你上手Python網頁抓取神器BeautifulSoup庫,https://buzzorange.com/techorange/2017/08/04/python-scraping/
15. 詹雨安(2018),Deep Learning with Python by François Chollet,https://www.facebook.com/permalink.php?story_fbid=2244278798932232&id=100000504010703
16. 中國雲計算(2017),用深度學習(CNN RNN Attention)解決大規模文本分類問題-綜述和實踐,https://kknews.cc/zh-tw/tech/85qkzrq.html
17. YG(2017),Tensorflow文本分類-Python深度學習,https://hk.saowen.com/a/d1306fa248106f8af843fc2b16dbb73374e12a1055bbf5af878e0faeaf074580
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2018-07-31公開。
  • 同意授權瀏覽/列印電子全文服務,於2018-07-31起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2486 或 來信