§ 瀏覽學位論文書目資料
  
系統識別號 U0002-1706201720295700
DOI 10.6846/TKU.2017.00563
論文名稱(中文) 基於社群媒體訊息的事件偵測與追蹤之研究
論文名稱(英文) A study of the event detection and tracking based on social media
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊管理學系碩士班
系所名稱(英文) Department of Information Management
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 105
學期 2
出版年 106
研究生(中文) 李琳
研究生(英文) Lin Lee
學號 604630045
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2017-06-02
論文頁數 51頁
口試委員 指導教授 - 蕭瑞祥(rsshaw@mail.tku.edu.tw)
共同指導教授 - 施盛寶(sbao@mail.tku.edu.tw)
委員 - 翁頌舜(wengss@ntut.edu.tw)
委員 - 戴敏育(myday@mail.tku.edu.tw)
關鍵字(中) 事件偵測
事件追蹤
社群媒體
關鍵字(英) Event Detection
Event Tracking
Social Media
第三語言關鍵字
學科別分類
中文摘要
隨著網際網路的發展與社群網站的興起,使用者產製的內容日趨增多,對於發生事件的討論也越來越多,更有使用者在社群媒體上揭發不為人知的事件與行為,形成俗稱的「爆料」,如2016年的復興航空停飛事件。若是想瞭解在社群網站上之討論事件的來龍去脈,使用者需逐一檢視大量的貼文、搜尋相關資訊、並且自行整理事件的過程,較為耗費時間與人力成本。鑑於此,本研究希望提出一套在社群媒體中進行事件偵測與追蹤的流程,降低使用者在搜尋與整理事件的負擔。
本研究進行相關文獻探討,整理其中的問題後,先研擬事件偵測與追蹤的演算法,並依此建構雛形系統,將文章以事件進行群聚與排序後呈現,再設計實驗以驗證雛形系統之準確率與使用者的滿意度。實驗結果發現約有78%的受測者給予系統4分以上的滿意度,改進建議包含希望議題多元化與系統個人化;而F-measure為0.64,推測可能因事件本身的討論發散程度,而影響系統分析的準確度,最後提出系統貢獻與可改進之處,為後續研究的參考。
英文摘要
As more and more people use social networking website, the user-generated content is increasing, and if somebody wants to know the context of the discussion on the community website, users need to review a large number of posts and self-collate events. Thus, the research objective is developing a system of event detection and tracking in the social media, reducing the burden on users to understand the events.
In this study, the relevant literatures are discussed and the algorithm of event detection and tracking is developed after finishing the problem. The prototype system is constructed and the experiment is designed to verify the system performance and user satisfaction. The results of the experiment show that about 78% of the subjects to give the system more than 4 points of satisfaction, improve the proposal to enhance the issue about issue diversification and system personalization, and the average F-measure is 0.64. Finally, make research contributions and future development for the follow-up study reference.
第三語言摘要
論文目次
目錄
================================
第一章 導論1
1.1 研究背景與動機1
1.2 研究目的2
第二章 文獻探討4
2.1 主題偵測與追蹤4
2.1.1 主題偵測與追蹤的緣起4
2.1.2 新聞中的事件偵測與追蹤5
2.1.3 新聞事件與社群媒體的關係7
2.1.4 網路新媒體來源的事件偵測與追蹤9
2.1.5 批踢踢實業坊(Ptt)與八卦版(Gossiping)10
2.2 字詞處理技術11
2.2.1 中文斷詞技術11
2.2.2 字詞權重計算12
2.3 資訊檢索15
2.4 分群技術16
2.5 分類技術17
第三章 研究方法18
第四章 雛形系統19
4.1 雛形系統架構19
4.2 文章預處理20
4.2.1 文章斷詞20
4.2.2 文章特徵值計算20
4.3 事件偵測21
4.4 事件追蹤22
4.5 結果呈現23
第五章 實驗設計與結果25
5.1 新聞與社會事件接收管道問卷調查25
5.1.1 問卷設計與實驗流程25
5.1.2 問卷調查結果26
5.2 系統實驗31
5.2.1 實驗資料集31
5.2.2 特徵值選取33
5.2.3 事件偵測(文章分群)系統效能評估34
5.2.4 事件偵測與追蹤(文章分群與分類)系統效能評估36
5.3 系統滿意度問卷調查39
5.3.1 問卷設計與實驗流程39
5.3.2 問卷調查結果40
第六章 結論及未來發展43
6.1結論43
6.2管理意涵44
6.3研究貢獻44
6.4未來發展45
參考文獻46

表目錄
================================
表5-1實驗名稱與主要實驗目的25
表5-2受測者資訊統計26
表5-3受測者曾使用過的媒體管道統計27
表5-4傳統媒體管道與社群媒體管道之比較28
表5-5實驗目標事件31
表5-6新聞網站列表34
表5-7事件偵測系統效能評估結果35
表5-8評估準則36
表5-9Kappa值一致性表現解釋37
表5-10系統效能結果與一致性結果38
表5-11受測者基本資料40
表5-12受測者網路服務使用頻率41
表5-13受測者常使用的平台41
表5-14三種模式的個別滿意度41

圖目錄
================================
圖2-1歷年美國民眾以網路作為取得總統大選消息之比例7
圖4-1系統架構圖19
圖4-2斷詞結果20
圖4-3分群流程圖21
圖4-4部分分類結果23
圖4-5系統介面23
圖5-1受測者最喜歡用於接收消息的管道統計27
圖5-2受測者最不喜歡用於接收消息的管道統計28
圖5-3受測者是否看過記者轉載社群媒體上的內容29
圖5-4受測者是否認為社群網站在某些議題中扮演重要角色30
圖5-5受測者是否認為網路社群對知名人物的支持度具有參考價值30
圖5-6文章說明圖33
圖5-7特徵詞比率判定結果34
參考文獻
[1]王毓莉,〈台灣報社記者使用INTERNET作為消息來源之研究〉,行政院國科會研究計畫(編號NSC 89-2412-H- 034-004-SSS),1999。
[2]吳偉銘,《基於語意及時間因素之主題偵測法》,碩士論文,成功大學資訊管理研究所,2008。
[3]李華、朱荔,〈基於影響力的微博新興熱點事件檢測〉,電腦應用與軟體,第33卷,第5期,頁98-101,2016。
[4]林國維,《新媒體與民意:理論與實證》,台北市:五南出版,2012。
[5]林意仁,《網路群眾文化及其民主意涵-以PTT Gossiping看板為例》,碩士論文,國立政治大學社會研究所,2010。
[6]邱惠恩,〈另類媒體的議題溢散效果—以苗栗大埔農地徵收事件為例〉,中華傳播學會年會論文,2011年10月。
[7]侯則瑜,《MDS文字雲:以Ptt八卦版為例》,碩士論文,國立東華大學應用數學研究所,2016。
[8]席耀一、林琛、李弼程等,〈基於語義相似度的論壇話題追蹤方法〉,計算機應用,第31卷,第1期,頁93-96,2011。
[9]張駿德,《新聞傳播實務研究》,台北市:紅螞蟻出版,2006。
[10]張耀仁,〈跨媒體議題設定之探析:整合次領域研究的觀點〉,傳播與管理研究,第5卷,第2期,頁73-129,2006年1月。
[11]莊庭瑋,《適用於網路論壇之新事件偵測技術之研究》,碩士論文,臺灣大學資訊管理研究所,2007。
[12]郭益豪,《以改良式N-Gram斷詞法結合潛在語意分析進行網頁影像加註》,碩士論文,國立雲林科技大學資訊管理研究所,2013。
[13]陳柏均,《文件距離為基礎kNN分群技術與新聞事件偵測追蹤之研究》,碩士論文,國立政治大學資訊管理研究所,2010。
[14]陳崇正,《應用網路書籤與VSM相似度演算法於強化實踐社群的形成》,碩士論文,國立中央大學資訊工程在職專班,2009。
[15]陳敬哲、莊伯仲,〈社群網站Facebook議題溢散效果初探-川島茉樹代醉歐事件〉,KC 2012第八屆知識社群研討會論文集,頁368-378,2012。
[16]陳聰宜,《新聞事件偵測與追蹤結合時間區間之分群分類演算法評比》,碩士論文,國立雲林科技大學資訊管理研究所,2012。
[17]陳聰宜、詹雅筑,〈新聞事件偵測與追蹤之分群分類演算法研究〉,資訊科技國際期刊,第8卷,第1期,頁1-9,2014年6月。
[18]〈結巴中文斷詞〉,網址:https://speakerdeck.com/fukuball/jieba-jie-ba-zhong-wen-duan-ci,上網日期:2017年1月16日。
[19]楊佳寧,《網路八卦文類之初探—以PTT Gossiping版為例》,碩士論文,國立政治大學新聞研究所,2007。
[20]楊曜年,《基於廣義知識本體及先驗演算法修正中文資訊檢索問題之實作系統》,碩士論文,元智大學資訊工程研究所,2013。
[21]詹天晟、陳德華、樂嘉錦等〈基於海量搜索歷史資料的使用者興趣模型〉,電腦應用,第34卷,第S2期,頁126-129,2014年12月。
[22]鄭宇君、施旭峰,〈探索2012台灣總統大選社交媒體之新聞來源引用〉,中華傳播學刊,第29期,頁109-135,2016年6月。
[23]鄭家鳳,《以大學生觀點探討教育大學學校網站服務品質之滿意度》,碩士論文,國立屏東教育大學教育科技研究所,2009。
[24]魏揚,《太陽花盛開後回看躁動年代:青年社運行動者社群網絡的生成與實踐(2007-2016)》,碩士論文,國立清華大學社會學研究所,2016。
[25]Allan, J., Carbonell, J. G., Doddington, G. et al., “Topic detection and tracking pilot study final report”, Proceedings of the DARPA Broadcast News Transcription and Understanding Workshop, 1998.
[26]Allan, J., Harding, S., Fisher, D. et al., “Taking topic detection from evaluation to practice”, System Sciences, 2005. HICSS'05. Proceedings of the 38th Annual Hawaii International Conference, pp. 101a-101a, 2005.
[27]Becker, H., Naaman, M., and Gravano, L, “Beyond Trending Topics: Real-World Event Identification on Twitter”, ICWSM, vol. 11, pp. 438-441, 2011.
[28]Becker, L. B., and McCombs, M. E. “The role of the press in determining voter reactions to presidential primaries1”, Human Communication Research, vol. 4, no. 4, pp. 301-307, 1978.
[29]Bernard, C, The press and foreign policy, 1963.
[30]C. C. Chang and C. J. Lin, LIBSVM : a library for support vector machines,  Software available at http://www.csie.ntu.edu.tw/~cjlin/libsvm, accessed 2017/01/02
[31]Chowdhury, G, Introduction to modern information retrieval. Facet publishing, 2010.
[32]Cordón, O., Herrera-Viedma, E., López-Pujalte, C. et al., ” A review on the application of evolutionary computation to information retrieval”, International Journal of Approximate Reasoning, vol. 34, no. 2-3, pp. 241-264, 2003.
[33]Dong, A., Zhang, R., Kolari, P. et al., “Time is of the essence: improving recency ranking using twitter data”, Proceedings of the 19th international conference, pp. 331-340, 2010.
[34]Goswami, A., and Kumar, A, “A survey of event detection techniques in online social networks”. Social Network Analysis and Mining, vol. 6, no. 1, pp. 107, 2016.
[35]Gu, H., Xie, X., Lv, Q. et al., “Etree: Effective and efficient event modeling for real-time online social media networks”. In Web Intelligence and Intelligent Agent Technology (WI-IAT), 2011 IEEE/WIC/ACM International Conference , vol. 1, pp. 300-307, 2011.
[36]Hohman, E. L., and Marchette, D. J, “A dynamic graph model for analyzing streaming news documents”, Computational Intelligence and Data Mining, 2007. CIDM 2007. IEEE Symposium, pp. 462-469, 2007.
[37]Katragadda, S., Benton, R., and Raghavan, V, “Framework for Real-Time Event Detection using Multiple Social Media Sources”, Proceedings of the 50th Hawaii International Conference on System Sciences, 2017.
[38]Landis, J. and Koch, G. G. “The Measurement of Observer Agreement for Categorical Data”, Biometrics, vol. 33, no. 1, pp. 159-174, 1977.
[39]Li, C., Sun, A., and Datta, A, “Twevent: segment-based event detection from tweets”, Proceedings of the 21st ACM international conference on Information and knowledge management, pp. 155-164, 2012.
[40]Likert, R. “A Technique for the Measurement of Attitudes”, Archives of Psychology, vol. 140, pp. 1–55, 1932.
[41]Lin, Z., Jin, H., Robinson, B. et al., “Towards an accurate social media disaster event detection system based on deep learning and semantic representation”, the Fourteenth Australasian Data Mining Conference, Canberra, Australia. Conferences in Research and Practice in Information Technology, vol. 170, 2016.
[42]Madani, A., Boussaid, O., and Zegour, D. E, “What’s happening: a survey of tweets event detection”, Proceedings of the Third International Conference on Communications, Computation, Networks and Technologies, pp. 16-22, 2014.
[43]Mathes, R., and Pfetsch, B, “The role of the alternative press in the agenda-building process: Spill-over effects and media opinion leadership”, European Journal of Communication, vol. 6, no. 1, pp. 33-62, 1991.
[44]McCombs, M. E., and Shaw, D. L, “The agenda-setting function of mass media”, Public opinion quarterly, vol. 36, no. 2, pp. 176-187, 1972.
[45]Metzler, D., Cai, C., and Hovy, E, “Structured event retrieval over microblog archives”, Proceedings of the 2012 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pp. 646-655, 2012.
[46]Morgado, I. C, “Classification of sentiment polarity of portuguese on-line news”,  Proceedings of the 7th Doctoral Symposium in Informatics Engineering, pp. 139-150, 2012.
[47]Nisbet, M. C, “Knowledge into action”, Doing news framing analysis: Empirical and theoretical perspectives, pp. 43-83, 2010.
[48]Nunamaker Jr, J. F., Chen, M., and Purdin, T. D., “Systems development in information systems research”, Journal of management information systems, vol. 7, no. 3, pp. 89-106, 1990.
[49]Olteanu, A., Vieweg, S., and Castillo, C., “What to expect when the unexpected happens: Social media communications across crises”, Proceedings of the 18th ACM Conference on Computer Supported Cooperative Work & Social Computing, pp. 994-1009, 2015.
[50]Poria, S., Cambria, E., Winterstein, G. et al., “Sentic patterns: Dependency-based rules for concept-level sentiment analysis”, Knowledge-Based Systems, vol. 69, pp. 45-63, 2014.
[51]Salton, G., and McGill, M. J., “Introduction to modern information Philadelphia, PA. American Association for Artificial Intelligence retrieval”, 1983.
[52]Sun, Y., Ma, H., Jia, M. et al, “An Efficient Microblog Hot Topic Detection Algorithm Based on Two Stage Clustering”, International Conference on Intelligent Information Processing, pp. 90-95, 2014.
[53]Ting, X., and Jufang, L., “A Comparative Study between Single-Pass Algorithm and K-means Algorithm in Web Topic Detection”, Advanced Information and Communication Technology for Education, pp. 109-195, 2014.
[54] Tong, S., and Koller, D., “Support vector machine active learning with applications to text classification”, Journal of machine learning research, vol. 2,  pp. 45-66, 2001.
[55]van Rijsbergen, C. J., Chapter 7. Information Retrieval, pp. 178-180, 1979.
[56]Wang, C., Zhang, M., Ma, S. et al., “Automatic online news issue construction in web environment”, Proceedings of the 17th international conference, pp. 457-466, 2008. 
[57]Wang, X., Yang, L., Wang, D.et al., “Improved TF-IDF keyword extraction algorithm”, Computer Science & Application, vol. 3, no. 1, pp. 64-68, 2013.
[58]Weng, J., and Lee, B. S., “Event detection in twitter”, ICWSM, vol. 11, pp. 401-408, 2011.
[59]White, D. M., “The “gate keeper”: A case study in the selection of news”, Journalism & Mass Communication Quarterly, vol. 27, no. 4, pp. 383-390, 1950.
[60]Zhao, Q., and Mitra, P., “Event Detection and Visualization for Social Text Streams”, ICWSM, 2007.
[61] Zhou, X., and Chen, L., “Event detection over twitter social media streams”, The VLDB journal, vol. 23, no. 3, pp. 381-400, 2014.
論文全文使用權限
校內
紙本論文於授權書繳交後5年公開
同意電子論文全文授權校園內公開
校內電子論文於授權書繳交後5年公開
校外
同意授權
校外電子論文於授權書繳交後5年公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信