淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-2906201323205400
中文論文名稱 網路意見分析與意見調查比較之研究─以公共議題為例
英文論文名稱 A Study of Comparing Techniques of Online Textual Opinion Analysis and Public Opinion Poll:A Case Study of the Public Issue
校院名稱 淡江大學
系所名稱(中) 資訊管理學系碩士班
系所名稱(英) Department of Information Management
學年度 101
學期 2
出版年 102
研究生中文姓名 陳維君
研究生英文姓名 Wei-Chun Chen
電子信箱 irene78e618@gmail.com
學號 600630148
學位類別 碩士
語文別 中文
口試日期 2013-06-14
論文頁數 62頁
口試委員 指導教授-蕭瑞祥
委員-翁頌舜
委員-戴敏育
委員-蕭瑞祥
中文關鍵字 網路意見分析  意見調查  公共議題  CopeOpi 
英文關鍵字 Online Textual Opinion Analysis  Public Opinion Poll  Public Issue  CopeOpi 
學科別分類
中文摘要 意見調查指透過詢問的回答方式,蒐集回答者感覺或意見的資料蒐集方法,具有花費時間與成本高等缺點;網路意見分析指從網路資訊中進行意見分析能夠自動分析大量的資料,比起意見調查具有效率較高等優勢。因此本研究主旨於利用部落格與微網誌進行網路意見分析,並與意見調查比較以公共議題為例,除了比較傳統民調並將網路意見製成意見摘要,期望本研究能提供未來社會公共議題研究者之參考。研究方法為系統發展研究法,建置網路意見分析的雛型系統,發展各系統功能包含網頁擷取技術、資料前處理、CopeOpi網路意見分析工具進行意見分析與意見摘要步驟。研究結果顯示「廢除死刑」議題的結果與民調結果的意見傾向趨勢相同,且系統評估的結果為負面意見效能最好,可推知網友有負面情緒時較易於發表在網路平台上。總結而言,此研究希望能透過將網路意見分析技術運用於公共議題上期望能達到輔助民調的效果,聆聽網路上之意見聲音。
英文摘要 Opinion poll is a survey of public opinion from a particular sample which has time wasting and high cost problem; Online textual opinion analysis is a text mining technique to analyze the sentiment of the writer or the topic written about, which is more efficient than opinion poll. Therefore, this article aims on the effectiveness of using online textual opinion analysis technique from blogs and micro-blogs for public issue. Apart from comparing to the opinion poll of telecommunications, we look forward to offering the public issue researchers a reference in the future. This study adopts Systems Development Methodology, and it uses a web crawler, data preprocessor, CopeOpi online textual opinion analysis and opinion summarization to build an online textual opinion analysis system. Results of this study showed that the tendency of "death penalty" is close to that of a telephone interview; moreover, the negative emotions seem to trigger expressions of opinions on the web platform. In conclusion, this study may be important in assisting opinion poll to increase efficiency on the internet.
論文目次 第1章、 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 3
1.3 論文架構 3
第2章、 文獻探討 5
2.1 網路意見探勘與應用 5
2.2 CopeOpi中文意見分析工具 6
2.2.1 Word Level 7
2.2.2 Sentence Level 8
2.2.3 Document Level 9
2.3 CopeOpi意見分析工具之應用 10
2.4 意見摘要 11
2.5 意見調查 11
2.6 台灣網路使用與公共議題發展 14
2.6.1 部落格與微網誌使用 14
2.6.2 網路使用趨勢 15
2.6.3 公共政策議題發展 18
第3章、 研究方法 20
第4章、 雛型系統 22
4.1 系統架構 22
4.2 資料蒐集 23
4.3 資料前處理 23
4.3.1 文章過濾 23
4.3.2 標點符號格式化 24
4.3.3 斷詞系統 24
4.4 CopeOpi網路意見傾向結果 26
4.5 意見摘要步驟 27
4.5.1 意見程度排名 27
4.5.2 文件關鍵字分句 28
4.5.3 NTUSD意見詞詞典比對 30
4.5.4 意見摘要呈現結果 31
第5章、 實驗與討論 34
5.1 實驗資料集 34
5.2 系統評估 35
5.2.1 Kappa值分析 36
5.2.2 同意度分析 38
5.2.3 系統評估結果 39
5.3 實驗結果與民調結果之比較 41
5.3.1 實驗結果 41
5.3.2 與廢除死刑民調結果比較 43
5.3.3 與核四興建民調結果比較 45
5.3.4 時間性分析 47
5.3.5 意見摘要之事件分析 49
5.3.6 新聞關鍵字擷取討論 52
第6章、 結論與未來展望 55
6.1 結論 55
6.2 研究貢獻 56
6.3 未來展望 57

圖目錄

圖 1句子層級(Sentence Level)演算法概述 9
圖 2文件層級(Document Level)演算法概述 10
圖 3無線網民之最常使用功能 15
圖 4無線網民之最常使用功能 16
圖 5行動網民之最常使用功能 17
圖 6系統發展研究流程 20
圖 7本研究自動化意見分析系統架構圖 22
圖 8中文語料斷詞結果截圖 26
圖 9利用CopeOpi工具進行意見分析結果片段 26
圖 10意見傾向之正面、負面分類依意見程度排序之結果片段 28
圖 11部落格實驗語料為例,未做文件關鍵字分句內容片段 29
圖 12關鍵字分句步驟之結果片段 29
圖 13「廢除死刑」議題中一摘要句 30
圖 14廢除死刑正面意見摘要結果片段 32
圖 15廢除死刑負面意見摘要結果片段 32
圖 16 TVBS廢除死刑民調 43
圖 17 TVBS核四興建民調 45



表目錄

表 1 GI、CNSD字典之正面情緒詞與負面情緒個數 7
表 2意見調查之比較 12
表 3中研院平衡語料庫詞類標記集(摘錄) 25
表 4分句後僅包含關鍵字及包含關鍵字與意見詞之結果 31
表 5實驗資料集蒐集 35
表 6 Kappa值分析 37
表 7同意度分析 38
表 8核四興建公共議題評估測量結果 39
表 9廢除死刑公共議題評估測量結果 40
表 10分析公共議題之正面意見、負面意見與中立意見之比率 42
表 11本研究實驗結果與廢除死刑民調結果比較 44
表 12本研究實驗結果與核四興建民調結果比較 46
表 13部落格自動化意見分析時間切割 48
表 14新聞時事訂關鍵字結果 50
表 15意見摘要查找事件關鍵字之結果 51
表 16新聞關鍵字擷取結果比較節錄 53
參考文獻 [1] TVBS民意調查中心,〈核能發電民調〉,網址: http://www1.tvbs.com.tw/FILE_DB/PCH/201210/ubyjmlk05n.pdf, 上網日期:2012年11月。
[2] TVBS民意調查中心,〈死刑議題與治安滿意度民調〉,網址:http://www1.tvbs.com.tw/FILE_DB/DL_DB/doshouldo/201004/doshouldo-20100413191826.pdf, 上網日期:2012年11月。
[3] 內田治、陳耀茂,《意見調查的統計分析SPSS使用手冊》,鼎茂,2007。
[4] 余民寧、李仁豪,《調查方式與議題熟悉度對問卷回收率與內容的影響》,教育學刊 30期: 101 -140,2008。
[5] 林偉揚、陸承志,《應用種子詞彙延伸方式於 BBS 電影評論之口碑分析》,元智大學資訊管理系碩士論文,2011。
[6] 周韻采、陳俊明,《政府重大議題網路輿論趨勢調查研究-以死刑為例》,電子治理研究中心,2010。
[7] 洪永泰,《民意調查的挑戰:瞎子摸的是什麼象?》,研考雙月刊30(4): 39-48,2006。
[8] 施嘉峻、彭鼎鈞,〈另類網路民調-利用文字探勘 分析大眾觀感〉,創新發現誌第24期,網址:http://ideas.org.tw/magazine_article.php?f=780/, 上網日期:2012年11月。
[9] 徐鳳謙、陳玉惠,《微網誌與部落格之差異》,資訊傳播學報-網路中介傳播 2010期: 63 -70,2010。
[10] 孫瑛澤、陳建良、劉峻杰、劉昭麟、蘇豐文,《中文短句之情緒分類》,ROCLING論文集:184-198,2010。
[11] 張育蓉、郭俊桔,《使用情緒分析於圖書館使用者滿意度評估之研究》,中興大學圖書資訊學研究所碩士論文,2012。
[12] 崔懷芝,〈量表信度的測量:kappa 統計量之簡介〉,網址:http://biostatistics.cmu.edu.tw/online/teaching_corner_011.pdf, 上網日期:2013年5月。
[13] 楊盛帆、陸承志,《以整合式規則來做網路論壇上的3C產品口碑分析》,元智大學資訊管理系碩士論文,2009。
[14] 楊昌樺、高虹安、陳信希,《以部落格語料進行情緒趨勢分析》,2007自然語言語音處理研討會,頁205-218,台北,2007。
[15] 簡之文、蕭瑞祥,《部落格情感分析之研究》,淡江大學資訊管理系碩士論文,2012。
[16] Choi, Y., Cardie, C., Riloff, A., and Patwardhan, S., "Identifying sources of opinions with conditional random fields and extraction patterns," Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing (HLT '05), Association for Computational Linguistics, Stroudsburg, PA, USA, pp.355-362, 2005.
[17] Lee, D., Jeong, O. R., and Lee, S. G., "Opinion mining of customer feedback data on the web," In Proceedings of the 2nd international conference on Ubiquitous information management and communication (ICUIMC 2008), ACM, New York, pp. 230-235, 2008.
[18] Kane, G. C., and Fichman, R. G., "The shoemaker's children: Using Wikis for information systems teaching, research, and publication (includes comments and editorial note), " MIS Quarterly, 33(1), pp.1-22, 2009.
[19] Ku, L.-W., and Chen, H.-H., "Mining opinions from the Web: Beyond relevance retrieval," Journal of the American Society for Information Science and Technology, 58(12), pp. 1838–1850, 2007.
[20] Ku, L.-W., Liu, I.-C., Lee, C.-Y., Chen, K.-h., and Chen, H.-H., "Sentence-level opinion analysis by CopeOpi in NTCIR-7, " Proceedings of the 7th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering, and Cross-Lingual Information Access, Tokyo, Japan, pp. 260-267, 2008.
[21] Ku, L.-W., Liang, Y.-T., and Chen, H.-H., "Opinion extraction, summarization and tracking in news and blog corpora," AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs 2006, pp.100-107, 2006.
[22] Liu, B., "Web data mining: Exploring hyperlinks, contents, and usage data (2nd ed.), " Springer Publishing Company, Incorporated, New York, NY, 2011.
[23] Lee, J., Ryu, H., Mon, L., and Park, S. J., "Citizens’ use of Twitter in political information sharing in South Korea," iConference 2013 Proceedings, pp. 351-365, 2013.
[24] Liu, Z., Liu, J., Yao, W., and Wang, C., "Keyword extraction using pagerank on synonym networks," E-Product E-Service and E-Entertainment (ICEEE), 2010 International Conference on, pp.1-4, 2010.
[25] Lee, S., and Kim, H. J., "News keyword extraction for topic tracking," 4th International Conference on Networked Computing and Advanced Information Management (NCM 2008) , 2, pp. 554-559, 2008.
[26] Nunamaker, J. R., Chen, J. F., and Purdin, T. D. M., "Systems development in information systems research," Journal of Management Information Systems, 7(3), pp. 89-106, 1991.
[27] Ounis, I., Rijke, M., Macdonald, C., Mishne, G., and Soboroff, I., "Overview of the TREC-2006 Blog Track," Proceedings of TREC-2006, USA, 2007.
[28] Robertson, S. P., Vatrapu, R. K, and Medina, R., "The social life of social networks: Facebook linkage patterns in the 2008 U.S. presidential election," Proceedings of the 10th Annual International Conference on Digital Government Research: Social Networks: Making Connections between Citizens, Data and Government, Soon Ae Chun, Rodrigo Sandoval, and Priscilla Regan (Eds.), Digital Government Society of North America, pp. 6-15, 2009.
[29] Schwarzer, L. d. V. P. C. S., "Do social media affect public discourses? A sentiment analysis of political tweets during the French Presidential election campaign," 67th AAPOR, 2012.
[30] Sim J., and Wright CC., "The kappa statistic in reliability studies: use, interpretation, and sample size requirements," Physical Therapy, 85(3), pp. 257–268, 2005.
[31] Tan, A.-H., "Text mining: The state of the art and the challenges," Proceedings of the Pacific Asia Conf on Knowledge Discovery and Data Mining PAKDD'99 workshop on Knowledge Discovery from Advanced Databases, 1999.
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2013-07-04公開。
  • 同意授權瀏覽/列印電子全文服務,於2013-07-04起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2281 或 來信