§ 瀏覽學位論文書目資料
  
系統識別號 U0002-1608201511263600
DOI 10.6846/TKU.2015.00463
論文名稱(中文) 針對單一領域中文意見探勘系統之研究與實作
論文名稱(英文) Research and Implementation of Single Domain Chinese Opinion Mining System
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊工程學系碩士在職專班
系所名稱(英文) Department of Computer Science and Information Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 103
學期 2
出版年 104
研究生(中文) 林憲嘉
研究生(英文) Hsien-Chia Lin
學號 702410043
學位類別 碩士
語言別 繁體中文
第二語言別 英文
口試日期 2015-07-01
論文頁數 122頁
口試委員 指導教授 - 蔣璿東
委員 - 王鄭慈
委員 - 葛煥昭
委員 - 蔣璿東
關鍵字(中) 意見探勘
中文意見探勘
單一領域
關鍵字(英) Opinion Mining
Chinese Opinion Mining
Single Domain
第三語言關鍵字
學科別分類
中文摘要
由於現今行動設備的進步及網路的普及,也因此越來越多人習慣在網路上發表各種評價及參與各類討論,在這些網路言論中往往隱含了很多有價值的資訊,若能有效蒐集這些資訊將有助於相關人員做出有效決策,然而透過人工蒐集資料與分析需要消耗相當大的人力與時間,因此發展意見探勘系統能有效改善此問題。
  我們可將中文意見探勘系統分為爬文、分析、及報表三大部份,在設計系統時我們會遇到幾個問題如:1.在爬文時若過度頻繁送出請求取得文章,可能導致對方主機暫時拒絕提供服務。2.網路上不斷地有新興用語誕生,在此狀況下要建立完整的詞庫變得相當有挑戰性。3.每個領域都有屬於自己的特殊用語需要處理。4.由於單一領域使用的詞庫有限,如何找到有用的詞彙,來縮減詞彙的數量,以達到效能的提升。5.因分析的結果必須符合一般的句型用法,因此,必須考慮到詞彙間的對應關係問題,使分析的結果具有可讀性。6.由於主題討論目標明確,回文者慣性省略這些詞彙進行發文,導致意見難以回收。
  本研究將針對上述問題進行後續討論及提出相關解決辦法,並實作一為單一領域設計之中文意見探勘系統。
英文摘要
More and more people share their discussions on the Internet due to the spreading of internet and mobile devices. There is always much valuable information among the discussions. And if we can collect the information effectively, it will help researchers to make more efficient decisions. Developing Opinion Mining System can resolve this problem more efficiently for collecting and analyzing data by people consume too much human resources and time.
  We can divide Opinion Mining System into three parts: researching the data on the Internet, analyzing and reporting statistics. And we encounter some problems in designing the system:1. The server on the Internet might decline to provide services while sending too many requests in the process of researching the data. 2. It’s a big challenge to establish a full word database for there are new words and phrases pop up all the time on the Internet. 3. There are specific sentiment words in each domain and all of them have to be processed. 4. There is limitation for the word database of each domain. Therefore, it’s necessary to find useful words and reduce the amount of words to raise the efficiency. 5. The results of analyses should fit for normal sentence usages. Therefore, it’s necessary to consider the context dependent among words to enhance the readability of the results. 6. People who reply on the Internet usually omit the words in their posting because the topics for discussions are always clear. Therefore, the opinions are hard to collect.
  Our research focuses on the above-mentioned problems for further discussions and providing ways of solution, and also implements a Chinese Opinion Mining System for a single domain.
第三語言摘要
論文目次
第一章 緒論 1
1-1 研究動機與目的 1
1-2 論文架構 5
第二章 文獻探討 6
2-1 意見元素定義 6
2-2 中文意見探勘系統相關研究 8
2-2-1 CopeOpi 9
2-2-2 Chien-Liang’s work 10
2-2-3 飯店評價系統 11
2-2-4 Evaluation Index System 12
2-2-5 其他研究 14
第三章 研究方法 15
3-1 問題及需求陳述 15
3-2 特殊用語問題 17
3-3 單一領域詞彙設定的問題 18
3-3-1 單一領域忽略詞 18
3-3-2 其他領域名詞 19
3-3-3 意見元素同義字處理 20
3-4 預設特徵詞 23
第四章 系統架構與實作 24
4-1 系統架構與環境 24
4-2 系統爬文流程與功能說明 26
4-2-1 篩選參數及關鍵字的設定 27
4-2-2 排程設定 31
4-2-3 下載記錄與結果 33
4-2-4 下載中斷回復 37
4-3 文章分析流程與功能說明 39
4-3-1 建立單一領域詞庫與初始化 41
4-3-2 建立單一領域詞彙間的對應關係 44
4-3-3 預設特徵值分析與設定 48
第五章 系統操作流程介紹 50
5-1 爬文模組 50
5-1-1 關鍵字設定操作說明 51
5-1-2 排程設定操作說明 52
5-2 分析模組 54
5-2-1 領域詞庫管理 55
5-2-1-1 領域詞彙群組設定操作說明 55
5-2-1-2 Topic設定操作說明 56
5-2-1-3 Feature設定操作說明 58
5-2-1-4 Item設定操作說明 59
5-2-1-5 OP設定操作說明 60
5-2-1-6 忽略詞設定操作說明 62
5-2-2 領域詞庫關聯管理 63
5-2-2-1 Topic-Feature關聯設定操作說明 63
5-2-2-2 Feature-Item關聯設定操作說明 65
5-2-2-3 Item-OP關聯設定操作說明 67
5-2-2-4 Feature-OP關聯設定操作說明 70
5-2-2-5 Topic階層設定操作說明 72
5-2-3 半自動分析 73
5-2-3-1 討論主題分析與詞庫維護操作說明 74
5-2-3-2 文章分析與詞庫維護操作說明 76
5-2-3-3 完整句查詢操作說明 84
第六章 報表呈現 86
6-1 熱門程度分析 86
6-1-1 Topic熱門程度分析操作說明 87
6-1-2 Feature熱門程度分析操作說明 88
6-1-3 Item熱門程度分析操作說明 89
6-1-4 Topic-Feature熱門程度分析操作說明 90
6-1-5 Topic-Item熱門程度分析操作說明 92
6-1-6 Topic-Feature-Item熱門程度分析操作說明 93
6-2 評價趨勢分析 95
6-2-1 整體評價趨勢分析操作說明 95
6-2-2 Topic評價趨勢分析操作說明 97
6-2-3 Feature評價趨勢分析操作說明 98
6-2-4 Item評價趨勢分析操作說明 99
6-2-5 Item綜合評價趨勢分析操作說明 100
6-3 綜合評價分析 102
6-3-1 Topic綜合評價分析操作說明 102
6-3-2 Feature綜合評價分析操作說明 106
6-3-3 整體評價分析操作說明 110
第七章 結論 112
參考文獻 113
附錄A 英文論文 115
圖目錄
Figure1. CopeOpi分析條件設定示意圖 9
Figure2. CopeOpi分析結果示意圖 9
Figure3. CopeOpi 文章列表示意圖 10
Figure4. Chien-Liang的電影評等系統手機畫面示意圖 10
Figure5. 飯店評價系統示意圖 11
Figure6. 飯店評價系統畫面-飯店間比較示意圖 11
Figure7. Evaluation Index System Pegueot 307評價分析結果示意圖 12
Figure8. Evaluation Index System Focus、Pegueot 307及CIVIC正面評價示意圖 13
Figure9. Evaluation Index System Focus及Pegueot 307在各面相的比較示意圖 13
Figure10. 意見元素階層及對應關係範例 20
Figure11. 系統架構 25
Figure12. 文章下載與配置流程圖 26
Figure13. 篩選參數設定XML 29
Figure14. 關鍵字設定列表頁面 30
Figure15. 關鍵字新增Dialog 30
Figure16. 排程設定列表頁面 31
Figure17. 排程設定編輯頁面 32
Figure18. 排程設定列表頁面-啟用行動通訊 32
Figure19. 下載明細列表頁面 33
Figure20. 至2014/11/21止Mobile01 Toyota討論區累計896頁之主題列表 34
Figure21. 主題列表HTML與目錄清單index.csv 35
Figure22. 文章列表HTML 35
Figure23. 討論主題列表頁面 36
Figure24. 透過討論主題列表進入的文章列表頁面 36
Figure25. 文章列表頁面 36
Figure26. 下載明細列表頁面 38
Figure27. 修改目錄清單提供重新下載參考 38
Figure28. 詞庫維護與文章分析流程 40
Figure29. 領域詞彙群組設定列表頁面 42
Figure30. Topic設定列表頁面 42
Figure31. Topic新增Dialog 43
Figure32. Topic設定列表頁面 44
Figure33. Item-OP關聯設定列表 45
Figure34. 對應關係極性調整確認Dialog 46
Figure35. Topic階層設定列表頁面 46
Figure36. OP設定列表頁面 47
Figure37. OP新增Dialog 47
Figure38. 討論主題分析與詞庫維護頁面 48
Figure39. 預設Topic編輯Dialog 49
Figure40. 系統模組功能快速切換按鈕 50
Figure41. 爬文模組相關目錄與功能 51
Figure42. 關鍵字設定功能 51
Figure43. 新增關鍵字Dialog 51
Figure44. 關鍵字設定結果 52
Figure45. 排程設定功能 52
Figure46. 立即下載執行結果 53
Figure47. Mobile01-行動通訊下載明細 53
Figure48. Mobile01-行動通訊文章列表 54
Figure49. 分析模組相關目錄 54
Figure50. 領域詞庫管理功能 55
Figure51. 領域詞彙群組設定功能 55
Figure52. 新增領域詞彙群組Dialog 56
Figure53. 領域詞彙群組新增結果 56
Figure54. Topic設定功能 57
Figure55. 新增Topic Dialog 57
Figure56. Topic新增結果 57
Figure57. Feature設定功能 58
Figure58. 新增Feature Dialog 58
Figure59. Feature新增結果 59
Figure60. Item設定功能 59
Figure61. 新增Item Dialog 60
Figure62. Item新增結果 60
Figure63. OP設定功能 61
Figure64. 新增OP Dialog 61
Figure65. OP新增結果 62
Figure66. 忽略詞設定功能 62
Figure67. 忽略詞更新結果 63
Figure68. Topic-Feature關聯設定Dialog 64
Figure69. 編輯Topic-Feature關聯Dialog 64
Figure70. Topic-Feature關聯編輯結果 65
Figure71. Feature-Item關聯設定功能 65
Figure72. 編輯Feature-Item關聯Dialog 66
Figure73. Feature-Item關聯編輯結果 67
Figure74. Item-OP關聯設定功能 67
Figure75. 編輯Item-OP關聯Dialog 68
Figure76. Item-OP關聯編輯結果 69
Figure77. Feature-OP關聯設定功能 70
Figure78. 編輯Feature-OP關聯Dialog 71
Figure79. Feature-OP關聯編輯結果 71
Figure80. Topic階層設定功能 72
Figure81. 新增Topic階層Dialog 72
Figure82. Topic階層新增結果 73
Figure83. 半自動分析功能 73
Figure84. 討論主題分析與詞庫維護功能 74
Figure85. 新增主題分析與詞庫維護工作Dialog 75
Figure86. 討論主題分析結果-I 75
Figure87. 討論主題分析結果-II 76
Figure88. 文章分析與詞庫維護功能 76
Figure89. 新增文章分析與詞庫維護工作Dialog 78
Figure90. Step1分析結果提醒 78
Figure91. Step1編輯功能 78
Figure92. Step1編輯頁面 79
Figure93. Step2與Step3分析結果提醒 79
Figure94. 文章分析與詞庫維護Step3編輯功能 80
Figure95. Step3.編輯頁面 80
Figure96. 領域詞庫外-OP不OP分析結果提醒 81
Figure97. 文章分析與詞庫維護Step6編輯功能 81
Figure98. Step6.領域詞庫外-OP了編輯頁面 82
Figure99. Step7分析結果提醒 82
Figure100. Step7編輯頁面 83
Figure101. 語意分析結果提醒 83
Figure102. 完整句查詢功能 84
Figure103. 文章與完整句Dialog 85
Figure104. 報表模組相關目錄 86
Figure105. 熱門程度分析功能 87
Figure106. Topic熱門程度分析功能 87
Figure107. Topic熱門程度分析歷史趨勢 88
Figure108. Topic熱門程度分析統計資料 88
Figure109. Feature熱門程度分析功能 88
Figure110. Feature熱門程度分析歷史趨勢 89
Figure111. Feature熱門程度分析統計資料 89
Figure112. Item熱門程度分析功能 90
Figure113. Item熱門程度分析歷史趨勢 90
Figure114. Item熱門程度分析統計資料 90
Figure115. Topic-Feature熱門程度分析功能 91
Figure116. 台灣之星Feature熱門程度分析歷史趨勢 91
Figure117. 台灣之星Feature熱門程度分析統計資料 92
Figure118. Topic-Item熱門程度分析功能 92
Figure119. 台灣之星Item熱門程度分析歷史趨勢 93
Figure120. 台灣之星Item熱門程度分析統計資料 93
Figure121. Topic-Feature-Item熱門程度分析功能 94
Figure122. 台灣之星網路面相Item熱門程度分析歷史趨勢 94
Figure123. 台灣之星網路面相Item熱門程度分析統計資料 94
Figure124. 評價趨勢分析功能 95
Figure125. 整體評價趨勢分析功能 96
Figure126. 整體評價趨勢分析歷史趨勢 96
Figure127. 整體評價趨勢分析統計資料 96
Figure128. Topic評價趨勢分析功能 97
Figure129. 台灣之星評價趨勢分析歷史趨勢 97
Figure130. 台灣之星評價趨勢分析統計資料 98
Figure131. Feature評價趨勢分析功能 98
Figure132. 台灣之星網路面相評價趨勢分析歷史趨勢 99
Figure133. 台灣之星網路面相評價趨勢分析統計資料 99
Figure134. Item評價趨勢分析功能 100
Figure135. Item評價趨勢分析歷史趨勢 100
Figure136. Item評價趨勢分析統計資料 100
Figure137. Item綜合評價趨勢分析功能 101
Figure138. 台灣之星Item綜合評價趨勢分析歷史趨勢 101
Figure139. 台灣之星Item綜合評價趨勢分析統計資料 101
Figure140. 綜合評價分析功能 102
Figure141. Topic綜合評價分析功能 103
Figure142. Topic綜合評價分析正負評價與文章比例 103
Figure143. Topic綜合評價分析歷史趨勢 104
Figure144. Topic綜合評價分析10月份正負評價Dialog 104
Figure145. Topic綜合評價分析文章列表 105
Figure146. 台灣之星Feature評價比例 105
Figure147. 台灣之星Item評價比例 106
Figure148. Feature綜合評價分析 107
Figure149. 網路面相綜合評價分析正負評價與文章比例 107
Figure150. 網路面相綜合評價分析歷史趨勢 108
Figure151. Feature綜合評價分析10月份正負評價Dialog 108
Figure152. Feature綜合評價分析文章列表 109
Figure153. 整體評價分析 110
Figure154. 整體評價分析正面評價與負面評價雷達圖 111
Figure155. 整體評價分析雷達圖 111 
表目錄
Table1. 意見元素定義 6
Table2. Topic簡稱、別名及同義詞對照表 21
Table3. Feature簡稱、別名及同義詞對照表 22
Table4. Item簡稱、別名及同義詞對照表 22
Table5. OP簡稱、別名及同義詞對照表 23
參考文獻
[1]	B. Liu and L. Zhang, "A Survey of Opinion Mining and Sentiment Analysis," in Mining Text Data, C. C. Aggarwal and C. Zhai, Eds., ed: Springer US, 2012, pp. 415-463.
[2]	G. Xu, C.-R. Huang, and H. Wang, "Extracting Chinese Product Features: Representing a Sequence by a Set of Skip-Bigrams," in Chinese Lexical Semantics. vol. 7717, D. Ji and G. Xiao, Eds., ed: Springer Berlin Heidelberg, 2013, pp. 72-83.
[3]	G. Qiu, B. Liu, J. Bu, and C. Chen, "Expanding domain sentiment lexicon through double propagation," presented at the Proceedings of the 21st international jont conference on Artifical intelligence (pp.1199-1204), Pasadena, California, USA, 2009.
[4]	M. Chen and T. Yao, "Combining dependency parsing with shallow semantic analysis for Chinese opinion-element relation identification," in Universal Communication Symposium (IUCS), 2010 4th International (pp. 299-305), 2010, pp. 299-305.
[5]	T.-C. Peng and C.-C. Shih, "Using Chinese part-of-speech patterns for sentiment phrase identification and opinion extraction in user generated reviews," in Digital Information Management (ICDIM), 2010 Fifth International Conference on (pp. 120-127), 2010, pp. 120-127.
[6]	S. Zhang, W.-J. Jia, Y. Xia, Y. Meng, and H. Yu, "Extracting Product Features and Sentiments from Chinese Customer Reviews " presented at the LREC (pp.1142-1145), 2010.
[7]	W. Wei, L. Hongyan, H. Jun, Y. Hui, and D. Xiaoyong, "Extracting Feature and Opinion Words Effectively from Chinese Product Reviews," in Fuzzy Systems and Knowledge Discovery, 2008. FSKD '08. Fifth International Conference on, 2008, pp. 170-174.
[8]	Z. Li, M. Zhang, S. Ma, B. Zhou, and Y. Sun, "Automatic Extraction for Product Feature Words from Comments on the Web Information Retrieval Technology." vol. 5839, G. Lee, D. Song, C.-Y. Lin, A. Aizawa, K. Kuriyama, M. Yoshioka, et al., Eds., ed: Springer Berlin / Heidelberg, 2009, pp. 112-123.
[9]	Z. Shanzong, L. Yuanchao, L. Ming, and T. Peiliang, "Research on Feature Extraction from Chinese Text for Opinion Mining," in Asian Language Processing, 2009. IALP '09. International Conference on, 2009, pp. 7-10.
[10]	X. Bing, Z. Tie-Jun, Z. De-Quan, and W. Shan-Yu, "Product features mining based on Conditional Random Fields model," in Machine Learning and Cybernetics (ICMLC), 2010 International Conference on, 2010, pp. 3353-3357.
[11]	Z. Haiping, Y. Zhengang, X. Ming, and S. Yueling, "Feature-level sentiment analysis for Chinese product reviews," in Computer Research and Development (ICCRD), 2011 3rd International Conference on, 2011, pp. 135-140.
[12]	Z. Zhai, B. Liu, L. Zhang, H. Xu, and P. Jia, "Identifying evaluative sentences in online discussions," in Proceedings of National Conf. on Artificial Intelligence (AAAI-2011), 2011.
[13]	王天煜, "中文意見探勘系統之新增意見詞演算法," 淡江大學資訊工程學系資訊工程學系碩士在職專班碩士論文, 2013.
[14]	吳冠陞, "中文句法規則搭配意見元素之研究," 淡江大學資訊工程學系資訊工程學系資訊網路與通訊碩士班碩士論文, 2013.
[15]	陳子龍, "中文意見探勘系統之句法分析," 淡江大學資訊工程學系資訊網路與通訊研究所碩士論文, 2012.
[16]	林漢望, "中文意見探勘系統之文法句型規則整合," 淡江大學資訊工程學系資訊工程學系碩士在職專班碩士論文, 2013.
[17]	A.-M. Popescu and O. Etzioni, "Extracting product features and opinions from reviews," presented at the Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing, Vancouver, British Columbia, Canada, 2005.
[18]	X. Ding, B. Liu, and P. S. Yu, "A holistic lexicon-based approach to opinion mining," presented at the Proceedings of the international conference on Web search and web data mining, Palo Alto, California, USA, 2008.
[19]	C. C. Yang and Y. C. Wong, "MINING CONSUMER OPINIONS FROM THE WEB," 2008.
[20]	王百祿, "中文意見探勘系統之優化及應用研究," 淡江大學資訊工程學系資訊工程學系碩士在職專班碩士論文, 2014.
[21]	Mobile01. Available: http://www.mobile01.com/
[22]	L.-W. Ku, H.-W. Ho, and H.-H. Chen, "Opinion mining and relationship discovery using CopeOpi opinion analysis system," Journal of the American Society for Information Science and Technology, vol. 60, pp. 1486-1503, 2009.
[23]	L. Chien-Liang, H. Wen-Hoar, L. Chia-Hoang, L. Gen-Chi, and E. Jou, "Movie Rating and Review Summarization in Mobile Environment," Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 42, pp. 397-407, 2012.
[24]	謝鎮宇, "意見探勘在中文評鑑語料之應用," 國立交通大學資訊學院資訊學程碩士論文, 2010.
[25]	Q. W. Xinzhou Xie, Anqi Chen, "Analysis of Competition in Chinese Automobile Industry based on an Opinion and Sentiment Mining System," Journal of Intelligence Studies in Business 2, 2012.
[26]	W. C. Li Guolin, Bian Hairong,Yang Li,Zhong Minjuan, "Emotional Detection of Text in the Financial Domain Based-Morpheme," Journal of Computer Research and Development, 2011.
[27]	Y.-T. L. a. H.-H. C. Lun-Wei Ku, "Opinion Extraction, Summarization and Tracking in News and Blog Corpora " 2006.
[28]	Z. L. Wanxiang Che, Ting Liu, "LTP: A Chinese Language Technology Platform," 2010.
[29]	C. Jianping, Z. Ke, W. Hui, C. Jiajun, Q. Fengcai, W. Ding, et al., "Web-Based Traffic Sentiment Analysis: Methods and Applications," Intelligent Transportation Systems, IEEE Transactions on, vol. 15, pp. 844-853, 2014.
論文全文使用權限
校內
紙本論文於授權書繳交後5年公開
同意電子論文全文授權校園內公開
校內電子論文於授權書繳交後5年公開
校外
同意授權
校外電子論文於授權書繳交後5年公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信