§ 瀏覽學位論文書目資料
  
系統識別號 U0002-2607201612123000
DOI 10.6846/TKU.2016.00892
論文名稱(中文) 三元決策理論應用於國道計程收費議題之情感分析研究
論文名稱(英文) Internet Public Opinion Sentiment Analysis on Topic of Taiwan Freeway’s Distance-based Toll Collection Using Three-way Decisions Theory
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 運輸管理學系運輸科學碩士班
系所名稱(英文) Department of Transportation Management
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 104
學期 2
出版年 105
研究生(中文) 蔡易辰
研究生(英文) Yi-Chen Tsai
學號 603660092
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2016-06-25
論文頁數 115頁
口試委員 指導教授 - 陶治中
委員 - 顏上堯
委員 - 張堂賢
關鍵字(中) 三元決策理論
情感分析
情感認知迴歸分析
國道計程電子收費
關鍵字(英) Three-way decisions
Sentiment Analysis
Sentiment Cognition Regression Analysis
Distance-based Electronic Toll Collection
第三語言關鍵字
學科別分類
中文摘要
交通運輸一直是人類生活需求當中不可或缺之環節,各種交通政策執行績效的成敗與否,使用者網路意見蒐集與即時化解民怨的變化往往影響整體政策的發展大局。實施國道高速公路計程電子收費政策之後, ETC整體用路人滿意度在2015年雖達七成,政策執行過程仍產生諸多爭議及問題,短期間網路上常湧現大量的評論,使得部分民眾消極使用;同時新興媒體的出現,也使得輿情更加多元更具時效性,政府應當正視並避免危機擴大,對ETC使用者之想法、意見與經驗等資訊進行有效的蒐集與分析,將有利於營運管理者能即時掌握重要議題,進而擬訂相對應之策略並有效化解無法預期的危機。
	
有鑒於此,本研究係使用爬蟲系統蒐集輿情文本,以網路評論意見為資料基礎,進行意見挖掘並建構三元決策情感分析模式。本研究運用三元決策理論於情感分析,輿情文本情感傾向將可具有正面情感、中立情感與負面情感,以較精準的分類方法,輿情文本依其內容計算情感值,並根據情感區間門檻值劃分正面、負面與中立區域。輿情文本情感值計算以正、負面情感詞庫為情感值計算之依據,利用詞頻演算法計算輿情文本的情感值,透過三元決策情感分析模型進行情感分析,最終計算出三元決策情感分析模型之通用模型與情感區間門檻值。在與遠通電收公司達成保密協定下取得客服語音資料,進行ETC使用者對ETC服務項目抱怨程度之分析。

本研究利用三元決策情感分析模型對網路評論文本進行分析,而客服語音資料僅藉由計算情感值以探討民眾抱怨之情感程度。研究結果顯示,ETC網路輿情八大構面與主題之情感分析部分,正面情感傾向之主題以交管措施為主,中立情感傾向之主題以申裝異動/車輛過戶與供裝,負面情感傾向之主題絕大多數為收費員議題;ETC客服語音六大構面與主題之負面情感程度分析部分,繳費服務構面之繳費逾期主題跟平信掛號與通知主題,以及申辦服務構面之查詢管道與流程主題,其為遠通電收公司較需注意與改善之服務項目。ETC網路輿情與客服語音之情感認知迴歸分析,網路輿情之檢定結果係以政策構面為特別顯著構面,而客服語音之檢定結果顯示繳費服務構面為特別顯著構面,其為半年期間內特別會影響ETC整體情感趨勢變化之構面。建議後續情感認知迴歸式之更新計算宜以年度為時間單位,將使整體分析結果更為完整。
英文摘要
Transportation has always played as a significant role of modern human life, however, the acceptance of public transportation policy is evaluated by user satisfaction. User’s opinion, satisfaction and problem-solving efficiency should be taken into consideration by policies making department. In 2015, the user satisfaction of Freeway's Distance-based Toll Collection( ETC) of Taiwan was higher than 70%, however, there are bias and dispute existed during the implementation of policy. Users easily are affected by negative comments through internet to boycott using ETC, meanwhile various electronic media allow public opinion spreading quickly. Minisrty of Communication and Communications(MOTC) should avoid the gap between polices and users expectation by collecting and analyzing opinion into reference for policy making department and reduce the unpredictable problems caused by public opinions. 

  This study used text data mining for collecting data and analyzing the public opinions, comments and sentiment tendency and providing suggestions to policy making and operation management teams. The data collected from opinion text were by Crawler system. The opining text based on user’s comments on network is for opinion mining and sentiment analysis. This research used three-way decisions sentiment analysis model by using three-way decision theory to analysis sentiment analysis, opinion text emotional tendencies which include : positive, boundary and negative, which categorized by calculating the sentiment value, divided into 3 sentiment zones ; positive, negative and neutral zone . The calculation of sentiment values were based on positive and negative sentiment dictionary and words frequency algorithm opinion text. By using three-way decision model for sentiment analysis and calculated universal of three-way decisions sentiment analysis model, and “threshold of sentiment zone”. Finally, this study obtained privacy agreement and authorized using customer’s voice data from FETC to analysis ETC users complaint problems.

  The results show that , regarding ”eight of ETC Internet sentiment dimensions” and “sentiment analysis”, the topic of positive sentiment is”traffic control” , the topic of neutral sentiment is “install and modify/transfer of vehicle ownership and Installation”, the topic of negative sentiment is “toll collector issue”. The six voice dimensions of ETC customer service center and topic of negative sentiment ; “late payment”, “ordinary mail” , ”notification”, “application service” and “discover the pipeline and process” need to be improved. According to results of sentiment cognition regression analysis, ETC Internet opinion, voice public opinion and customer voice , the “policy” is significant dimension, the test result of “customer voice” shows “payment service” is significant dimension, which has significant effect on ETC overall sentiment dimensions in following 6 months. This study suggests that using annual sentiment cognition regression updated calculations will obtain more detailed results.
第三語言摘要
論文目次
目錄
第1章	緒論	1
1.1	研究背景與動機	1
1.2	研究目的	3
1.3	研究範圍與流程	4
第2章	文獻回顧	7
2.1	巨量資料	7
2.1.1	巨量資料定義	7
2.1.2	社群巨量資料	8
2.1.3	巨量資料應用實例	9
2.1.4	巨量資料相關研究	9
2.2	網路輿情分析	10
2.2.1	輿情定義	11
2.2.2	輿情系統	11
2.2.3	情感分析	12
2.2.4	情感分類演算法	14
2.2.5	情感傾向分析方法	14
2.3	三元決策理論	15
2.3.1	三元決策理論應用於情感傾向分類	15
2.3.2	三元決策之應用	17
2.3.3	三元決策相關研究	17
2.4	模糊集合理論	18
2.4.1	解模糊化	19
2.4.2	相關研究	19
2.5	資料視覺化工具	20
2.5.1	R語言	20
2.5.2	Power View	22
2.5.3	Power BI	24
2.5.4	Microsoft Strategy	25
2.6	文獻評析小節	27
第3章	研究方法	28
3.1	詞頻演算法	28
3.2	三元決策理論	29
3.2.1	三元決策-約略集合理論	30
3.2.2	基於傳統約略集合理論的三元決策模型	30
3.2.3	基於區間值模糊集合的三元決策	32
3.3	模糊門檻值	32
3.3.1	重心法(Center oh Gravity Method)	33
3.4	準確率與召回率	34
3.5	多元迴歸分析	35
第4章	實證分析	37
4.1	實證分析流程架構	37
4.2	資料預處理	42
4.3	三元決策模型之情感區間門檻值	42
4.3.1	刪除不相關之文本內容	45
4.4	國道計程電子收費輿情構面、主題與關鍵字	46
4.4.1	構面之定義與衡量	46
自動感應	47
4.5	輿情文本分析-資料視覺化	53
4.5.1	主題討論度視覺化	53
4.5.2	文字雲(word cloud)	63
4.5.3	ETC主題與關鍵字之情感分析	93
4.6	ETC情感認知迴歸分析	101
4.7	研究小結	106
第5章	結論與建議	109
5.1	結論	109
5.2	未來研究建議	110
參考文獻	112

 

表目錄
表 2.1三元決策應用領域表	17
表 4.1情感區間之門檻值	43
表 4.2情感值區間狀態	43
表 4.3 Pmax-Nmin情感狀態之準確率與召回率	44
表 4.4 Pavg-Nmin情感狀態之準確率與召回率	44
表 4.5 Pmin-Nmin情感狀態之準確率與召回率	45
表 4.6三元決策情感分析模型之通用門檻值	45
表 4.7產品功能與特性構面	46
表 4.8申辦服務構面	47
表 4.9儲值服務構面	48
表 4.10繳費服務構面	48
表 4.11餘額查詢服務構面	49
表 4.12客服中心構面	50
表 4.13企業形象構面	52
表 4.14政策構面	53
表 4.15 ETC八大構面之主題分類表	54
表 4.16 ETC網路輿情文本資料來源	58
表 4.17ETC客服語音抱怨資料	61
表 4.18 e-parking關鍵字次數統計	64
表 4.19 e-parking關鍵字次數統計	65
表 4.20 eTag功能完整度關鍵字次數統計	66
表 4.21 eTag功能完整度關鍵字次數統計	66
表 4.22申裝異動、車輛過戶供裝關鍵字次數統計	67
表 4.23申裝異動、車輛過戶供裝關鍵字次數統計	68
表 4.24申辦流程關鍵字次數統計	69
表 4.25申辦流程關鍵字次數統計	70
表 4.26儲值服務關鍵字次數統計	70
表 4.27儲值服務關鍵字次數統計	71
表 4.28繳費逾期關鍵字次數統計	72
表 4.29繳費逾期關鍵字次數統計	73
表 4.30 繳費管道與流程關鍵字次數統計	73
表 4.31繳費管道與流程關鍵字次數統計	74
表 4.32自動扣繳通行費關鍵字次數統計	75
表 4.33自動扣繳通行費關鍵字次數統計	76
表 4.34手續費關鍵字次數統計	76
表 4.35手續費關鍵字次數統計	77
表 4.36平信通知與掛號關鍵字次數統計	78
表 4.37平信通知與掛號關鍵字次數統計	79
表 4.38 查詢管道與流程關鍵字次數統計	80
表 4.39 查詢管道與流程關鍵字次數統計	81
表 4.40 帳戶紀錄關鍵字次數統計	82
表 4.41 帳戶紀錄關鍵字次數統計	83
表 4.42 語音系統與電話等候時間關鍵字次數統計	83
表 4.43 語音系統與電話等候時間關鍵字次數統計	84
表 4.44客服人員服務態度與專業度關鍵字次數統計	85
表 4.45服務據點關鍵字次數統計	86
表 4.46 服務據點關鍵字次數統計	87
表 4.47 收費員議題關鍵字次數統計	88
表 4.48 企業活動關鍵字次數統計	89
表 4.49 品牌認知關鍵字次數統計	90
表 4.50計程收費關鍵字次數表	91
表 4.51擁擠稅、高乘載關鍵字次數表	92
表 4.52交管措施關鍵字次數表	93
表 4.53 ETC八大構面情感認知迴歸分析表	104
表 4.54 ETC六大構面情感認知迴歸分析	105
表 4.55 三元決策情感傾向分析之通用模型	106
表 4.56構面、主題與關鍵字情感傾向彙整	107
表 4.57客服語音主題情感程度彙整表	108

 
圖目錄
圖 1.1研究流程與架構	6
圖 2.1 R語言操作示意圖	21
圖 2.2 R語言操作示意圖	21
圖 2.3 R語言操作示意圖	22
圖 2.4 Power View圖表	22
圖 2.5Power View圖表	23
圖 2.6Power View圖表	23
圖 2.7 Power View圖表	24
圖 2.8 Power BI應用流程圖	25
圖 2.9 Power BI圖表	25
圖 2.10 Microsoft Strategy視覺化圖表	26
圖 2.11 Microsoft Strategy視覺化圖表	26
圖 3.1結合Three-Way Decisions的文本情感分類方法	30
圖 3.2三角形模糊數重心示意圖	34
圖 3.3準確率和召回率示意圖	35
圖 4.1實證研究架構圖	38
圖 4.2 實證研究架構四階段	41
圖 4.3網路文本主題樹狀群組圖	55
圖 4.4網路文本主題樹狀群組圖單位表	55
圖 4.5網路文本主題樹狀群組圖	56
圖 4.6網路文本主題樹狀群組圖單位表	56
圖 4.7網路文本之主題散佈圖	58
圖 4.8網路文本之主題散佈圖單位表	58
圖 4.9ETC主題資料來源之情感傾向網路圖	59
圖 4.10客服語音資料主題樹狀群組圖	60
圖 4.11客服語音資料主題樹狀群組圖單位表	61
圖 4.12客服語音資料之主題情感強度分析散佈區域圖	62
圖 4.13客服語音資料之主題情感強度分析單位表	63
圖 4.14 e-parking文字雲	64
圖 4.15 e-parking文字雲	65
圖 4.16 eTag功能完整度文字雲	65
圖 4.17 eTag功能完整度文字雲	66
圖 4.18 申裝異動、車輛過戶供裝文字雲	67
圖 4.19 申裝異動、車輛過戶供裝文字雲	68
圖 4.20 申辦流程文字雲	69
圖 4.21 申辦流程文字雲	69
圖 4.22 儲值服務文字雲	70
圖 4.23 儲值服務文字雲	71
圖 4.24 繳費逾期文字雲	72
圖 4.25 繳費逾期文字雲	73
圖 4.26 繳費管道與流程文字雲	74
圖 4.27 自動扣繳通行費文字雲	75
圖 4.28 自動扣繳通行費文字雲	76
圖 4.29 手續費文字雲	76
圖 4.30 手續費文字雲	77
圖 4.31 平信通知與掛號文字雲	78
圖 4.32 平信通知與掛號文字雲	79
圖 4.33 查詢管道與流程文字雲	80
圖 4.34 查詢管道與流程文字雲	81
圖 4.35 帳戶紀錄文字雲	82
圖 4.36 帳戶紀錄文字雲	83
圖 4.37 語音系統與電話等候時間文字雲	84
圖 4.38客服人員服務態度與專業度文字雲	85
圖 4.39服務據點文字雲	86
圖 4.40 服務據點文字雲	87
圖 4.41 收費員議題文字雲	88
圖 4.42 企業活動文字雲	89
圖 4.43 品牌認知文字雲	90
圖 4.44 計程收費文字雲	91
圖 4.45擁擠稅、高乘載文字雲	92
圖 4.46交管措施文字雲	93
圖 4.47 e-parking關鍵字與情感值之趨勢變化	94
圖 4.48 儲值管道與流程關鍵字與情感值之趨勢變化	94
圖 4.49 繳費逾期關鍵字與情感值之趨勢變化	95
圖 4.50 查詢管道與流程關鍵字與情感值之趨勢變化	96
圖 4.51 關鍵字與情感值之趨勢變化	96
圖 4.52 收費員議題關鍵字與情感值之趨勢變化	97
圖 4.53 交管措施關鍵字與情感值之趨勢變化	97
圖 4.54 eTag功能完整度關鍵字與情感值之趨勢變化	98
圖 4.55 申裝異動與車輛過戶、供裝關鍵字與情感值之趨勢變化	99
圖 4.56 繳費逾期關鍵字與情感值之趨勢變化	100
圖 4.57 查詢管道與流程關鍵字與情感值之趨勢變化	100
圖 4.58 服務據點關鍵字與情感值之趨勢變化	101
圖 4.59 ETC網路輿情八大構面	101
圖 4.60 ETC客服語音六大構面	102
參考文獻
參考文獻
中文文獻
1.于洪(2015),三支決策:複雜問題求解方法與實踐,第一版,科學出版社。
2.王磊、黃河笑、吳兵、鄭任兒(2015),「基於主題與三支決策的文本情感分析」,計算機科學,第四十二卷第六期,頁93-96。
3.朱瑀馨(2007),運用資料挖掘技術於人壽保險業顧客關係管理之研究,淡江大學保險經營研究所碩士論文。
4.邢航(2014),基於構造性覆蓋演算法的三支決策模型,安徽大學計算機應用技術所碩士論文。
5.邱皓政(2010),量化研究與統計分析: SPSS (PASW)資料分析範例解析,五版,台北市: 五南。
6.吳怡真(2003),應用資料挖掘技術於證劵顧客關係管理之研究,實踐大學企業管理研究所碩士論文。
7.余尚武、賴佩君(2007),「灰色系統、模糊理論與約略集理論於權變投資組合保險策略之應用」,中華管理評論,第十卷第四期,頁1-31。
8.吳國樑(2012),資料採礦於臉書商業模式探勘之研究,淡江大學管理科學學系碩士論文。
9.呂建億(2015),民眾對政府輿情分析方法之信任研究─民意調查與網路輿情分析的比較,國立政治大學公共行政學系碩士論文。
10.林千斐(2009),使用R軟體計算Simon二階段第二期癌症臨床試驗設計的樣本數,中原大學應用數學系碩士學位論文。
11.周芊、康力平(2014),「網路社會動員的新研究取徑:社群巨量資料分析」,空大人文學報,第二十三期,頁29-45。
12.周哲、商琳(2015),「一種基於動態詞典和三支決策的情感分析方法」,山東大學學報(工學版),第四十五卷第一期,頁19-23。
13.姚天昉、聶青陽、李建超、李林琳、婁德成、陳珂、付宇(2006),「一個用於漢語汽車評論的意見挖掘系統」,中文信息處理前沿進展-中國中文信息學會二十五週年學術會議論文集,頁260-281。
14.孫瑛澤、陳建良、劉峻傑、劉昭麟、蘇豐文(2010),「中文短句之情緒分類」,自然語言與語音處理研討會,頁184-198。
15.唐宜傑(2015),意在言外?微文本中情緒、合法性與反諷之辨識與分析,國立台灣大學電機資訊學院資訊工程學研究所博士論文。
16.陳亭愷(2015),國道計程電子收費實施後之網路輿情文本情感分析研究,淡江大學運輸管理學系運輸科學碩士班碩士論文。
17.許中川、陳景揆(2001),「探勘中文新聞文件」,資訊管理學報,第7卷第2期,頁103-122。
18.張紹勳(2012),模糊多準則評估法及統計,第一版,五南圖書出版股份有限公司。
19.莊依珊(2015),滿意度指數為基礎之國道計程電子收費服務預警機制研究,淡江大學運輸管理學系運輸科學碩士班碩士論文。
20.遊和正(2012),領域相關詞彙極性分析及檔情緒分類之研究,臺灣大學資訊工程研究所碩士論文。
21.童啟晟(2014),台灣發展巨量資料產業之機會與挑戰,資訊工業策進會產業研究報告。
22.楊惠淳(2011),以主客觀分析與相互資訊檢索探討情感分析之準確度─以電影評論為例,國立台北科技大學資訊與運籌管理研究所碩士論文。
23.劉盾、李天瑞、李華雄(2013),「粗糙集理論:基於三支決策視角」,南京大學學報(自然科學),第四十九卷第五期,頁574-581。
24.楊昌樺、陳信希(2006),「以部落格文本進行情緒分類之研究」,第十八屆自然語言處理與語音處理研討會論文集,頁253~269。
25.蕭乃沂、陳敦源、廖洲棚(2015),政府應用巨量資料精進公共服務與政策分析之可行性研究,電子治理研究中心委託研究報告。
26.簡之文(2012),部落格文章情感分析之研究,淡江大學資訊管理學系碩士班碩士論文。
27.蘇詠翔(2002),資料挖掘應用於股票電子交易客戶之特性,成功大學統計研究所碩士論文。
英文文獻
28.AGRAWAL, Rakesh, et al(1994). Fast algorithms for mining association rules. In: Proc. 20th int. conf. very large data bases, VLDB,487-499.
29.AGRAWAL, Rakesh; IMIELIŃSKI, Tomasz(1993); SWAMI, Arun. Mining association rules between sets of items in large databases. In: ACM SIGMOD Record. ACM, 254-259. 
30.Fernback, J. (1999). There is a there: Notes toward a definition of cyber-community. In S.G. Jones (Ed.), Doing internet research: Critical issues and  methods for examine the net,203-220. 
31.Turney (2002). Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Review, Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics(ACL), 417-424.
32.Bo Pang, Lilian Lee (2002). Thumbs up? Sentiment Classification using Machine Learning Techniques, Department of Computer Science Cornell University. 
33.Kahn, R., & Kellner, D. (2003). Internet subcultures and oppositional politics. In D. Muggleton (Ed.). The post-subcultures reader ,299-314.
34.Kahn, R. & Kellner, D.(2004). New media and internet activism: From the'Battle of Seattle'to blogging. New Media & Society, 87-95.
35.Chavolit, P. & Zhou, L. (2005). Movie review Mining: a comparison between supervised and unsupervised.In proceedings of the 38th Hawaii International Conerence on System Sciences.
36.Tan, S. & Zhang, J. (2008). An empirical study of sentiment analysis for Chinesedocuments. Expert System with Applications, 2622-2629.
37.Drury, G. (2008). Opinion piece: Social media: Should marketers engage and how can it be done effectively, Journal of Direct, Data and Digital Marketing Practice, 274-277.
38.Manovich, L. (2011). Trending: The promises and the challenges of big social data. Debates in the digital humanities, 2, 460-475.
39.Yao Y Y (2012).An outline of a theory of three-way decisions/Proceedings of the 8th the International RSCTC conference, 1-17.
40.Chan, S. M., Cho, M., & Lee, S. (2013). User perceptions of social media: A comparative study of perceived characteristics and user profiles by social media. Online Journal of Communication and Media Technologies, 149-178.
41.Liang D, Liu D, Pedrycz W, et al (2013). Triangular fuzzy decision-theoretic rough sets. International Journal of Approximate Reasoning, 1087-1106.
42.Liang D, Liu D(2015). Deriving three-way decisions from intuitionistic fuzzy decision-theoretic rough sets under linguistic assessment with the aid of group decision making. Applied Soft Computing , 256-259.
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信