§ 瀏覽學位論文書目資料
  
系統識別號 U0002-1808202114371700
DOI 10.6846/TKU.2021.00445
論文名稱(中文) 社群媒體大數據分析應用於臺鐵安全績效與網路輿情對照之研究
論文名稱(英文) Mapping TRA's Safety Performance with Internet Public Opinion by Social Media Analytics
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 運輸管理學系運輸科學碩士班
系所名稱(英文) Department of Transportation Management
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 109
學期 2
出版年 110
研究生(中文) 邱柏元
研究生(英文) Po-Yuan Chiu
學號 608660188
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2021-07-03
論文頁數 73頁
口試委員 指導教授 - 陶治中
委員 - 杜微
委員 - 賴勇成
委員 - 陶治中
關鍵字(中) 社群媒體挖掘
情感分析
安全績效
網路輿情
關鍵字(英) Social media mining
Sentiment analysis
Safety performance
Internet public opinion
第三語言關鍵字
學科別分類
中文摘要
近年來隨著社群媒的蓬勃發展,民眾經常使用社群媒體網路來表達自己的觀點,社群媒體儼然成為民眾發表意見、抒發情緒、彰顯自身觀點與立場的重要平臺。再加上大數據分析的流行,衍生出社群媒體挖掘技術,藉由大數據挖掘,分析民眾觀點與情感傾向,可更快速理解民眾需求。
本研究欲建立一網路輿情情感分析模式,透過蒐集社群媒體言論,運用文本分類與資料探勘技術,並將評論主題分為「車站設施」、「員工權益」、「餐飲服務」、「票證系統」、「列車運轉」五大類相關文本,分析民眾關注之臺鐵服務相關議題與輿情情感趨勢,再經由情感分析結果計算社群媒體留言之情感值,最後與臺鐵提供的安全績效(亦即事件發生資料)進行對照,以驗證本研究結果之正確性。
經由實證分析結果得知,五類評論中僅有列車運轉類別在關聯模型中最具有顯著性。平均情感分數最低的評論類別為票證系統,餐飲服務雖表現最好,但平均情感分數仍為負數,顯示臺鐵的服務仍有改善空間。
本研究借助視覺化技術,將安全績效與網路輿情兩者合併成對照圖,以時間軸檢視安全績效與網路輿情資料,探討相同時間點兩者資料的相關聯,亦即當事件或事故發生時,是否會對網路輿情的情感趨勢產生變化,以供相關單位參考之用。
英文摘要
In recent years, people have used social media networks frequently to express their opinions because of vigorous development of social media. Therefore, social media mining with big data analytics can be applied to overview public opinions and sentiment tendencies for the purpose of intelligent decision making.
This study aims at establishing an internet public opinion analysis model with text mining technologies. Firstly, social media comments on popular websites are collected. Text classification approaches are then used to divide TRA‘s  (Taiwan Railway Administration) service related comments into "station facilities", "employee rights", "catering services", "tickets system" and "train operation" types of topics. And then emotional values of daily comments on these five topics are calculated based on sentiment analysis. Finally, safety performance data provided by TRA (I.e. incident data) are chosen for mapping with internet public opinion results.
    Empirical results showed that only "train operation" is the most significant category in the correlation with safety performance. And the lowest average sentiment score is "tickets system" category. Although "catering services" category shows positive comments, its average sentiment score is negative. It indicates that TRA’s services need more active improvements.
A comparison chart can be visualized to map TRA’s safety performance with internet public opinions. It is proven to be helpful for TRA’s decision makers to monitor public opinion changes by using social media mining when accidents or incidents happen.
第三語言摘要
論文目次
第一章 緒論	1
1.1 研究背景與動機	1
1.2研究目的	4
1.3 研究範圍	5
1.4 研究流程	6
第二章 文獻回顧	8
2.1鐵路事故相關文獻	8
2.2鐵路安全績效相關文獻	12
2.3社群媒體文本挖掘相關文獻	14
2.4情感分析相關文獻	17
2.5文獻評析與小結	18
第三章 研究方法	20
3.1 文本挖掘	21
3.1.1文本斷詞	22
3.1.2文本詞向量轉換	24
3.1.3機器學習	25
3.2 情感分析	29
3.2.1 情感語料庫建立	30
3.2.2 權重設計	33
3.2.3 情感辨識分類	33
3.3安全績效與網路輿情關聯模型	34
第四章 實證分析	36
4.1 以臺鐵為本體的社群媒體資料庫建立	37
4.1.1爬蟲系統設計	37
4.1.2資料內容說明	38
4.2 安全績效資料	40
4.3 網路輿情資料	42
4.3.1 車站設施類別	42
4.3.2 員工權益類別	44
4.3.3 餐飲服務類別	46
4.3.4 票證系統類別	48
4.3.5 列車運轉類別	50
4.3.6 網路輿情結果分析	52
4.4 安全績效與網路輿情關聯模型	54
4.4.1 車站設施類別	54
4.4.2 員工權益類別	55
4.4.3 餐飲服務類別	56
4.4.4 票證系統類別	57
4.4.5 列車運轉類別	58
4.4.6安全績效與網路輿情關聯模型小結	59
4.5 安全績效與網路輿情之視覺化對照圖	60
4.6 管理意涵	62
第五章 結論與建議	63
5.1 結論	63
5.2 建議	65
參考文獻	66

圖目錄
圖1.1 臺鐵行車事故與事件趨勢圖	3
圖1.2 本研究流程圖	7
圖3.1 研究方法建構流程圖	20
圖3.2 文本挖掘模式	21
圖3.3 CKIPtagger斷詞結果	23
圖3.4 CBOW 和Skip-gram 架構示意圖	25
圖3.5 DNN神經網路層架構圖	26
圖3.6 線性整流函數ReLu	27
圖3.7 Softmax 激活函數	28
圖3.8 正向情感語料庫	30
圖3.9 負向情感語料庫	31
圖3.10 SnowNLP套件情感訓練過程	32
圖3.11 情感區間尺度	33
圖4.1 實證分析流程圖	36
圖4.2 收集到的貼文總數占比	39
圖4.3 收集到的留言總數占比	39
圖4.4 臺鐵輿情文本列表範例	40
圖4.5 行車異常事件與行車事故統計	41
圖4.6 事故傷亡人數統計	41
圖4.7 車站設施類別留言數	42
圖4.8 車站設施類別情感分數	43
圖4.9 員工權益類別留言數	44
圖4.10 員工權益類別留言情感分數	45
圖4.11 餐飲服務類別留言數	46
圖4.12 餐飲服務類別留言情感分數	47
圖4.13 票證系統類別留言數	48
圖4.14 票證系統類別留言情感分數	49
圖4.15 列車運轉類別留言數	50
圖4.16 列車運轉類別留言情感分數	51
圖4.17 五大評論類別情感分數分布圖	52
圖4.18 車站設施類別情感分數與總事件數相關分析	54
圖4.19 員工權益類別情感分數與總事件數相關分析	55
圖4.20 餐飲服務類別情感分數與總事件數相關分析	56
圖4.21 票證系統類別情感分數與總事件數相關分析	57
圖4.22 列車運轉類別情感分數與總事件數相關分析	58
圖4.23 留言情感總分與總留言數相關分析	59
圖4.24 安全績效與網路輿情對照圖	60

表目錄
表1.1 臺鐵事故與事件統計表	2
表2.1 鐵路事故與事件名詞說明	9
表3.1 推文例句訓練前後情感分數比較	32
表4.1 爬蟲關鍵字詞庫	38
表4.2 五大類評論結果統整	62
參考文獻
1.Das, S. and Chen, M. (2001).“Yahoo! for Amazon: Extracting Market Sentiment from Stock Message Boards”, Proceedings of the Asia Pacific Finance Association Annual Conference (APFA), pp.1367-1373.
2.Dave, K., Lawrence, S., and Pennock, D. M.(2003), “Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews”, Proceedings of WWW, pp.519-528.
3.Chan, S. M., Cho, M., and Lee, S.(2013), “User Perceptions of Social Media: A Comparative Study of Perceived Characteristics and User Profiles by Social Media”, Journal of Communication and Media Technologies, pp. 149-178.
4.Wilson, K., Fornasier, S., and White, K. M.(2013), “Psychological Predictors of Young Adults' Use of Social Networking Sites”, Cyberpsychology, Behavior and Social Networking, Vol. 13, pp. 173-177.
5.Eva Nedeliaková, Jana Sekulová, Ivan Nedeliak, Martin Loch.(2014).
Methodics of identification level of service quality in railway ransport. Procedia - Social and Behavioral Sciences,110,320-329.
6.José Luis Machado-Leóna , Rocío de Oñaa, Tahar Baounib ,Juan de Oña.(2017). Railway transit services in Algiers: priority improvement actions based on users perceptions. Transport Policy,53,175-185.
7.Yan, Z., Jing, X., & Pedrycz, W. (2017). Fusing and mining opinions for reputation generation. Information Fusion, 36, 172-184.
8.Wencheng Huanga , Bin Shuai , Yan Sun , Yang Wang , Eric Antwi.(2018). Using entropy-TOPSIS method to evaluate urban rail transit system operation performance: The China case. Transportation Research Part A: Policy and Practice,111,292-303.
9.Francisco Díez-Mesa, Rocio de Oña, Juan de Oña.(2018).Bayesian networks and structural equation modelling to develop service quality models: Metro of Seville case study. Transportation Research Part A: Policy and Practice,118,1-13.
10.Heike Link.(2019).The impact of including service quality into efficiency analysis: The case of franchising regional rail passenger serves in Germany. Transportation Research Part A: Policy and Practice,119,284-300.
11.Luis Oliveira, Claudia Bruen, Stewart Birrell, Rebecca Cain.(2019). What passengers really want: Assessing the value of rail innovation to improve experiences. Transportation Research Interdisciplinary Perspectives,1,100014.
12.Madan Lal Yadav, Basav Roychoudhury.(2019).Effect of trip mode on opinion about hotel aspects: A social media analysis approach. International Journal of Hospitality Management,80,155-165.
13.Jose Agustin Vallejo-Borda, Daniel Rosas-Satizabal,Alvaro Rodriguez-Valencia.(2020).Do attitudes and perceptions help to explain cycling infrastructure quality of service? Transportation Research Part D: Policy and Practice,87, 102539.
14.Ivo Sousa, Maria Paula Queluz, Antonio Rodrigues.(2020). A survey on QoE-oriented wireless resources scheduling. Journal of Network and Computer Applications,158, 102594.
15.Gabriela Gongora Svartzman, Jose E. Ramirez-Marquez, Kash Barker.(2020). Social media analytics to connect system performability and quality of experience, with an application to Citibike. Computers & Industrial Engineering,139, 106146.
16.Jyoti Mandhani , Jogendra Kumar Nayak, Manoranjan Parida.(2020). Interrelationships among service quality factors of Metro Rail Transit System: An integrated Bayesian networks and PLS-SEM approach. Transportation Research Part A: Policy and Practice,140,320-336.
17.Shan-sheng ZHU, Yu-ning DONG, Cheng XU.(2020).A Statistical QoE-QoS Model of Video Streaming Services. 2020 The 6th International Conference on Computing and Data Engineering,195-199.
18.Liming Wu, Haishan Xia, Xianfeng Wang, Qingfeng Dong, Chunxiang Lin,
19.Xiaotong Liu, Rui Liang.(2020).Indoor air quality and passenger thermal comfort in Beijing metro transfer stations. Transportation Research Part D,78, 102217.
20.Joaquín Osorio-Arjona, Jiri Horak, Radek Svoboda, Yolanda García-Ruíz.(2021). Social media semantic perceptions on Madrid Metro system: Using Twitter data to link complaints to space. Sustainable Cities and Society,64,102530.
21.Fajar Fathur Rachmana , Rani Nooraenia , Lia Yuliana.(2021). Public Opinion of Transportation integrated (Jak Lingko), in DKI Jakarta, Indonesia. Procedia Computer Science 179, 696–703.
22.李治綱、鍾志成、林杜寰、張仕龍、張恩輔、陳一昌、張開國、吳熙仁(2009),公共運輸之安全績效:臺灣鐵路管理局之個案分析。運輸計劃季刊,38(4)期,381-405。
23.蕭穎謙(2009),服務品質、顧客滿意度與忠誠度關係之研究-以臺灣高速鐵路股份有限公司為例。全球管理與經濟期刊,5(2),50-61。
24.賴淑芳(2012),公共自行車接受度與滿意度研究─以臺北微笑單車為例。運輸學刊,24(3), 379-406。
25.吳吉祥、李凡、夏靖波、王愷(2012),基於廣義線性模型的QoE評估方法研究。計算機應用研究,29(10)。
26.周瑞生、葉竣賓(2013),從旅客觀點探討影響高速鐵路營運績效購念暨其中介與調節效果。營建管理季刊,94,1-23。
27.劉歡、高月紅、林言超、桑林、楊大成(2014),一種研究QoE與QoS關系的數學模型方法。廣東通信技術,34(10)。
28.施伯燁(2014),社群媒體-使用者研究之概念、方法與方法論初探。傳播研究與實踐,4(2),207-227。
29.朱斌妤、黃東益、洪永泰、李仲彬、曾憲立(2015),「數位國家治理(2):國情追蹤與方法整合」,電子治理研究中心委託研究報告。
30.游綉雯(2015),使用情緒分析於社群論壇消費者評論滿意度評估之研究—以TripAdvisor旅遊網站為例。中興大學行銷學系所碩士學位論文。
31.陳亭愷(2015),社群運算應用於網路輿情情感傾向分析之研究-以實施國道計程電子收費政策為例,淡江大學運輸管理學系碩士論文。
32.陶治中、簡睿志(2016),三元決策理論應用於社群媒體挖掘之情感分析-以UBER在臺營運話題為例。運輸計劃季刊 ,45(4),301-330。
33.蔡易辰(2016),三元決策理論應用於國道計程收費議題之情感分析研究,淡江大學運輸管理學系碩士論文。
34.陳克罕(2016),臺灣高鐵行車事件風險管理之研究,逢甲大學運輸科技與管理學系碩士在職專班碩士論文。
35.朱連章、李然然、張紅霞、郭加樹、張泉(2017),基於QoS 量化用戶體驗質量的評價模型。計算機系統應用,26(5)。
36.洪敬政(2017),情感分析研究的知識結構,淡江大學資訊管理學系碩士在職專班學位論文。
37.趙玉娟與陶振超(2018),政治網路口碑的情感分析:語意關連性之觀點。傳播研究與實踐,8(2),75-107。
38.陳翰(2018),從社群媒體挖掘以感測日常交通滿意度之研究,淡江大學運輸管理學系碩士論文。
39.林彥伯(2018),捷運系統服務指標─以臺中捷運綠線為例,逢甲大學運輸與物流學系碩士論文。
40.鄭永祥(2019),臺鐵普悠瑪列車事故之反思。消費者報導雜誌,453期,P25-30。
41.楊竑昕(2019),運用自然語言處理工具實作貼文分析系統觀察網路論壇, 以 Dcard為例,國立中山大學資訊管理研究所碩士論文。
42.張悅朗(2020),視覺語意深度學習方法應用於社群媒體意見挖掘之研究-以軌道運輸場站服務評論為例,淡江大學運輸管理學系碩士論文。
43.簡信立(2020),鐵路運輸緊急應變處理之研析-以臺鐵局人為疏失出軌事故為例,成功大學交通管理科學系碩士在職專班學位論文。
44.徐倩文、韋健華、吳忠宏、董二為(2020),休閒產業管理學刊,13(1),51 - 62。
45.徐任宏、林杜寰、孫千山、張開國、葉祖宏、吳熙仁(2021),國內外鐵道安全保證機制之回顧與展望。中興工程,150期, 21-30。
46.國家運輸安全調查委員會(2020),1021臺鐵第6432次車新馬站重大鐵道事故-補強-調查報告-第一冊,國家運輸安全調查委員會(編號:TTSB-ROR-20-10-001)。
47.國家運輸安全調查委員會(2020),1021臺鐵第6432次車新馬站重大鐵道事故-補強-調查報告-第二冊,國家運輸安全調查委員會(編號:TTSB-ROR-20-10-001)。
48.林杜寰、孫干山、李治綱、陳桂豪、吳明軒、胡仲瑋、張開國、萘祖宏、吳熙仁、洪憲忠(2019),鐵路運輸安全管理系統(SMS)制度化策略之趼擬,交通部運輸研究所。
49.孫千山、鍾志成、李治綱、薛強、林杜寰、張仕龍、張恩輔、林蓁、黃笙玹、李永強、陳一昌、張開國、賴靜慧、吳熙仁(2011),風險管理應用於鐵路運輸安全之初探-以臺鐵風險辨識為例,交通部運輸研究所。
50.孫千山、鍾志成、李治綱、林杜寰、張仕龍、張恩輔、林蓁、黃笙玹、黃宏仁、張開國、賴靜慧、吳熙仁(2012),風險管理應用於鐵路運輸安全之初探-以臺鐵風險分析與評量為例,交通部運輸研究所。
51.孫千山、鍾志成、李治綱、林杜寰、張仕龍、張恩輔、林蓁、黃笙玹、黃宏仁、張開國、賴靜慧、吳熙仁(2013),風險管理應用於鐵路運輸安全之初探-以臺鐵風險處理、管理監督、管理改善為例,交通部運輸研究所。
52.孫千山、鍾志成、李治綱、林蓁、施佑林、吳明軒、張開國、葉祖宏、賴靜慧、吳熙仁(2016),鐵路安全之風險管理推動研究—發展鐵路系統之安全管理實務與報告,交通部運輸研究所。
53.國家運輸安全調查委員會(2019),重大鐵道事故通報表,擷取自2021/05。https://www.ttsb.gov.tw/media/3280/marine-occurrence-report-form.pdf?mediaDL=true
54.國家運輸安全調查委員會(2019),運輸事故調查法,擷取自2021/05。https://www.ttsb.gov.tw/1133/1206/25253/25260/25296/post
55.國家運輸安全調查委員會(2020),重大鐵道事故調查作業處理規則,擷取自2021/05。https://www.ttsb.gov.tw/1133/1206/25253/25260/25305/post
56.中華民國交通部網站,鐵路行車規則,擷取自2021/05。https://motclaw.motc.gov.tw/webMotcLaw2018/Law/ArticleContent?type=-1&LawID=D0006010
57.臺灣鐵路管理局網站,事故資料月報表,擷取自2021/05。https://www.railway.gov.tw/tra-tip-web/adr/about-public-info-6-2
58.Ptt實業坊Railway版,擷取自2021/05。https://www.ptt.cc/bbs/Railway/index.html
59.中央研究院(2020), CkipTagger 中文說明,擷取自2021/05。https://github.com/ckiplab/ckiptagger/wiki/Chinese-README
60.PPT情感分析,擷取自2021/05。GitHub - kuo23/PTT-Stock
61.GitHub - PPT股票版爬文與情感分析,擷取自2021/05。https://github.com/wellgary/PTT-Crawler-and-Emotional-Analysis/blob/master/PTT%20Crawler%20and%20Emotion%20Analysis.ipynb
62.讓電腦聽懂人話: 直觀理解 Word2Vec 模型,擷取自2021/05。https://tengyuanchang.medium.com/%E8%AE%93%E9%9B%BB%E8%85%A6%E8%81%BD%E6%87%82%E4%BA%BA%E8%A9%B1-%E7%90%86%E8%A7%A3-nlp-%E9%87%8D%E8%A6%81%E6%8A%80%E8%A1%93-word2vec-%E7%9A%84-skip-gram-%E6%A8%A1%E5%9E%8B-73d0239ad698
63.相關係數與共變異數(Correlation Coefficient and Covariance) ,擷取自2021/05。https://chih-sheng-huang821.medium.com/%E7%9B%B8%E9%97%9C%E4%BF%82%E6%95%B8%E8%88%87%E5%85%B1%E8%AE%8A%E7%95%B0%E6%95%B8-correlation-coefficient-and-covariance-c9324c5cf679
64.統計學: 皮爾森相關係數為什麼小於等於1,擷取自2021/05。https://chih-sheng-huang821.medium.com/%E7%B5%B1%E8%A8%88%E5%AD%B8-%E7%9A%AE%E7%88%BE%E6%A3%AE%E7%9B%B8%E9%97%9C%E4%BF%82%E6%95%B8%E7%82%BA%E4%BB%80%E9%BA%BC%E5%B0%8F%E6%96%BC%E7%AD%89%E6%96%BC1-180de90df79d
65.皮爾森積動差相關係數,維基百科,擷取自2021/05。https://zh.wikipedia.org/zh-tw/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%A7%AF%E7%9F%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0
66.DNN — 深度神經網路,擷取自2021/05。https://medium.com/%E4%B8%80%E4%BA%BA%E5%A4%9A%E5%B7%A5%E5%B7%A5%E4%BD%9C%E5%AE%A4/dnn-%E6%B7%B1%E5%BA%A6%E7%A5%9E%E7%B6%93%E7%B6%B2%E8%B7%AF-cf892cbb06d5
67.深度神經網路(DNN)模型與前向傳播演算法,擷取自2021/05。https://www.cnblogs.com/pinard/p/6418668.html
68.利用SnowNLP 訓練自己的情感分析庫,擷取自2021/05。https://www.itread01.com/content/1541222413.html
69.[Python] [snownlp]基於情感詞典的情感分析,擷取自2021/05。http://corina.cc/article/217/
論文全文使用權限
校內
校內紙本論文延後至2023-09-01公開
同意電子論文全文授權校園內公開
校內電子論文延後至2023-09-01公開
校內書目立即公開
校外
同意授權
校外電子論文延後至2023-09-01公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信