§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0808202416102900
DOI 10.6846/tku202400650
論文名稱(中文) 文字探勘應用於詐騙行為之研究
論文名稱(英文) A Study of Text Mining for Fraudulent Behavior
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 統計學系應用統計學碩士班
系所名稱(英文) Department of Statistics
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 112
學期 2
出版年 113
研究生(中文) 施瓊雯
研究生(英文) Chiung-Wen Shih
學號 612650084
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2024-07-19
論文頁數 40頁
口試委員 指導教授 - 楊文(071972@mail.tku.edu.tw)
口試委員 - 高君豪
口試委員 - 楊適伃
關鍵字(中) 詐騙行為
文字探勘
主題模型
文本共現分析
關鍵字(英) Fraudulent Behavior
Text Mining
Topic Model
Word Co-occurrence Analysis
第三語言關鍵字
學科別分類
中文摘要
詐騙行為在台灣已成為嚴重的社會問題,隨著科技發展,詐騙手法日趨多樣化和隱蔽化,例如:電信詐騙、網路詐騙、郵件詐騙及求職詐騙等。特別是金融交易類型詐騙,如投資詐欺、解除分期付款詐欺(ATM)及假網路拍賣(購物),在詐騙案件中占有顯著比例。為應對詐騙手法的更新,相關警政機關如165反詐騙諮詢專線、科技犯罪防制中心及打詐國家隊相繼成立,加強對詐騙集團的追捕和宣導工作。內政部警政署設立的165全民防騙網,提供識別詐騙行為、檢舉與協助管道,並發布相關新聞,幫助民眾識別和預防詐騙。
  本研究利用165全民防騙網上的新聞文本內容,結合文字探勘技術進行分析,並透過對文本數據的斷詞、分類和文本共現分析,挖掘詐騙行為的關鍵字及其關聯性,藉此提高民眾對詐騙行為的識別,減少詐騙對個人和社會的損害。研究結果顯示,詐騙手法可分為八大類: ATM解除分期付款詐騙、假投資、釣魚連結、假愛情交友、假冒機構(公務員) 、假網拍詐騙、盜(冒)用網路帳號、假冒官方,此外LINE、臉書常與帳戶、好友、投資、匯款等語詞出現,簡訊、電話常與電信、檢察官、點擊連結等語詞出現。
英文摘要
Fraudulent activities have become a serious social issue in Taiwan, with increasingly diverse and covert methods such as telecom fraud, online fraud, email fraud, and job fraud. Financial transaction frauds, including investment scams, installment payment scams (ATM), and fake online auctions, constitute a significant portion of cases. In response, police agencies like the 165 Anti-Fraud Consultation Hotline and the National Anti-Fraud Team have been established to enhance fraud prevention and capture efforts. The 165 Anti-Fraud Network offers identification tools, reporting channels, and news to help the public prevent fraud.
  This study uses news text from the 165 Anti-Fraud Network and text mining techniques to analyze and extract keywords and their associations related to fraudulent activities. By examining word segmentation, classification, and text co-occurrence, the study aims to improve public awareness and reduce the harm caused by fraud. The research categorizes fraud methods into eight types: ATM installment payment fraud, fake investments, phishing links, fake romantic relationships, impersonating institutions (civil servants), fake online shopping scams, account hijacking, and impersonating officials. Keywords like LINE, Facebook, account, friends, investment, remittance frequently appear together, while SMS, and phone often appear with telecom, prosecutor, and click link.
第三語言摘要
論文目次
目錄
目錄	I
圖目錄	III
表目錄	V
第一章 緒論	1
1.1 研究背景與動機	1
1.2 研究目的	3
1.3 章節結構	3
第二章 文獻探討	4
2.1詐騙行為相關研究	4
2.2中文斷詞	6
2.3文字探勘	7
2.3.1詞頻與逆向文件頻率	8
2.3.2主題模型	8
2.3.3文本共現分析	9
第三章 研究方法	10
3.1 研究流程	10
3.2 資料整理	10
3.3 中文斷詞	12
3.3.1 Jieba中文斷詞系統	12
3.3.2 斷詞流程	13
3.4 文字探勘	13
3.4.1 詞頻-逆向文件頻率(TF-IDF)	14
3.4.2 非負矩陣分解模型	15
3.4.3 文本共現分析	15
3.5 視覺化呈現	16
第四章 實例分析	17
4.1 資料前處理	17
4.2 敘述統計	19
4.3 關鍵詞分析	21
4.4 主題模型-NMF分析	22
4.5 文本共現分析	29
4.6 時間對詐騙關鍵詞之影響	34
第五章 結論與建議	36
5.1 結論	36
5.2 未來研究方向	37
參考文獻	38

圖目錄
圖1-1 2015-2023詐騙案件發生數與破獲數數據	2
圖3-1研究流程圖	10
圖3-2資料結構以及欄位內容	11
圖3-3語詞之共現矩陣	16
圖4-1資料清理流程	18
圖4-2 JIEBA斷詞結果(部分資料)	18
圖4-3各年份詐騙文章篇數長條圖	19
圖4-4各文章前20關鍵詞之文字雲	21
圖4-5各主題之一致性趨勢圖	22
圖4-6 「ATM解除分期付款詐騙」關鍵詞文字雲	25
圖4-7 「假投資」關鍵詞文字雲	25
圖4-8「釣魚連結」關鍵詞文字雲	26
圖4-9「假愛情交友」關鍵詞文字雲	26
圖4-10「假冒機構(公務員)」關鍵詞文字雲	27
圖4-11「假網拍詐騙」關鍵詞文字雲	27
圖4-12「盜(冒)用網路帳號」關鍵詞文字雲	29
圖4-13「假冒官方」關鍵詞文字雲	29
圖4-14「ATM解除分期付款詐騙」關鍵詞共現矩陣熱圖	30
圖4-15「假投資」關鍵詞共現矩陣熱圖	30
圖4-16「釣魚連結」關鍵詞共現矩陣熱圖	31
圖4-17「假愛情交友」關鍵詞共現矩陣熱圖	31
圖4-18「假冒機構(公務員)」關鍵詞共現矩陣熱圖	32
圖4-19「假網拍詐騙」關鍵詞共現矩陣熱圖	32
圖4-20「盜(冒)用網路帳號」關鍵詞共現矩陣熱圖	33
圖4-21「假冒官方」關鍵詞共現矩陣熱圖	33
圖4-22 疫情前關鍵詞共現矩陣熱圖	35
圖4-23 疫情後關鍵詞共現矩陣熱圖	35

表目錄
表3-1各變數名稱及意義	11
表3-2  JIEBA斷詞模式	13
表4-1 出現篇數前100名的語詞	20
表4-2 TF-IDF分數前30名語詞	21
表4-3不同主題數與NMF一致性	22
表4-4 各主題及出現次數前10名的詞語	23
表4-5 2017-2023不同詐騙主題次數配表	24

參考文獻
中文文獻
王芊昀 (2023)。以文字探勘技術探討社群媒體使用者之容貌焦慮。南臺科技大學資訊傳播系碩士論文。
吳俊緯 (2021)。整合網路爬蟲與文字探勘於分析顧客導向之旅遊規劃以 Dcard 為例。東海大學電機工程學系碩士論文
翁俊能 (2024)。警察人員執行宣導民眾認識詐騙犯罪困境之探討。國立中正大學犯罪防治碩士在職專班碩士論文
張貞瑩 (2012)。運用詞彙權重技術於自動文件摘要之研究。南台科技大學資訊管理系碩士論文。
黃士豪 (2023)。文本分析的基礎建設:臺灣國會研究詞庫的建置與測試。台灣政治學刊,27(1),119-177。 https://doi.org/10.6683/tpsr.202306_27(1).0003 
黃雪蘭 (2010)。政府防制詐騙犯罪政策行銷之研究-以「警政署165反詐騙諮詢專線」為例。世新大學行政管理學研究所碩士論文
黃鈺婷、卓珈郁 (2021)。中英文檔案學專業期刊文獻之計量分析及其視覺化呈現。圖資與檔案學刊,99,67-105。
英文文獻
Bera, D., Ogbanufe, O., & Kim, D. J. (2023). Towards a thematic dimensional framework of online fraud: An exploration of fraudulent email attack tactics and intentions. Decision Support Systems, 171, 113977. 
Buil-Gil, D., & Zeng, Y. (2022). Meeting you was a fake: investigating the increase in romance fraud during COVID-19. Journal of Financial Crime, 29(2), 460-475. 

Button, M., Nicholls, C. M., Kerr, J., & Owen, R. (2014). Online frauds: Learning from victims why they fall for these scams. Australian & New Zealand Journal of Criminology, 47(3), 391-408. https://doi.org/10.1177/0004865814521224 
DeLiema, M., Deevy, M., Lusardi, A., & Mitchell, O. S. (2020). Financial Fraud Among Older Americans: Evidence and Implications. The Journals of Gerontology: Series B, 75(4), 861-868. https://doi.org/10.1093/geronb/gby151  
DeLiema, M., Li, Y., & Mottola, G. (2023). Correlates of responding to and becoming victimized by fraud: Examining risk factors by scam type. International Journal of Consumer Studies, 47(3), 1042-1059. 
Rb, A., & Kr, S. K. (2021). Credit card fraud detection using artificial neural network. Global Transitions Proceedings, 2(1), 35-41. https://doi.org/https://doi.org/10.1016/j.gltp.2021.01.006 
Egger, R., & Yu, J. (2022). A topic modeling comparison between lda, nmf, top2vec, and bertopic to demystify twitter posts. Frontiers in sociology, 7, 886498. 
Tan, A.-H., Ridge, K., Labs, D., & Terrace, H. (2000). Text Mining: The state of the art and the challenges. 
Yu, S.-J., & Rha, J.-S. (2021). Research trends in accounting fraud using network analysis. Sustainability, 13(10), 5579. 
Zaeem, R. N., Manoharan, M., Yang, Y., & Barber, K. S. (2017). Modeling and analysis of identity threat behaviors through text mining of identity theft stories. Computers & Security, 65, 50-63. 
Zaki, M., & Theodoulidis, B. (2013). Analyzing financial fraud cases using a linguistics-based text mining approach. Available at SSRN 2353834. 



Zhu, Y., Xi, D., Song, B., Zhuang, F., Chen, S., Gu, X., & He, Q. (2020). Modeling Users’ Behavior Sequences with Hierarchical Explainable Network for Cross-domain Fraud Detection Proceedings of The Web Conference 2020, Taipei, Taiwan. https://doi.org/10.1145/3366423.3380172
論文全文使用權限
國家圖書館
同意無償授權國家圖書館,書目與全文電子檔於繳交授權書後, 於網際網路立即公開
校內
校內紙本論文立即公開
同意電子論文全文授權於全球公開
校內電子論文立即公開
校外
同意授權予資料庫廠商
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信