系統識別號 | U0002-2708201511165800 |
---|---|
DOI | 10.6846/TKU.2015.00991 |
論文名稱(中文) | 線上商品交易之不誠實賣家偵測 |
論文名稱(英文) | Detection of dishonest sellers for online commodity trading |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 資訊管理學系碩士班 |
系所名稱(英文) | Department of Information Management |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 103 |
學期 | 2 |
出版年 | 104 |
研究生(中文) | 王凱郁 |
研究生(英文) | Kai-Yu Wang |
學號 | 602630039 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2015-05-30 |
論文頁數 | 47頁 |
口試委員 |
指導教授
-
張昭憲(jschang@mail.im.tku.edu.tw)
委員 - 周清江(cjou@mail.tku.edu.tw) 委員 - 詹前隆(clchan@saturn.yzu.edu.tw) |
關鍵字(中) |
異常偵測 分類樹 線上購物 電子商務 |
關鍵字(英) |
Anomaly Detection Decision Trees Online Shopping Electronic Commerce |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
線上購物改變了現代人在實體商店購物的消費習慣,是電子商務成功的典範之一。然而,購物網站之部分賣家會利用操作或策略的方式來影響評價,以累積信用,提升銷售量。此類包裝評價的行為看似平常,但卻潛藏不安全的交易危機。例如,有許多高評價賣家夾雜販售不良商品,甚至是假貨,讓消費者在不知情狀況下蒙受損失。因此,面對真假參半的評價分數,除了提醒交易者小心謹慎外,需有更積極的因應對策。有鑑於此,本研究針對電子商務網站中的不誠實賣家,發展一套有效的偵測方法。首先,我們歸納蒐集一套龐大的屬性集合,以精確描述不誠實賣家的特質,內容涵蓋評價機制、營業現況、歷史評價與售後服務共105種屬性。其次,我們探討賣家何種方式影響評價建立方式,以決定賣家的分類標籤。接著,再利用x-means群聚演算法對不誠實賣家進行分群,根據群心來了解其各種典型,並據以建立不同的偵測模型。為驗證提出方法之有效性,本研究由淘寶網下在實際交易資料進行驗證。當使用不誠實與誠實做為分類標籤時,平均偵測準確率低於50%。但配合不誠實賣家分群來建立偵測模型時,則準確率可提升至70%~78%,顯示本研究提出方法之可行性。若將不同類型不誠實賣家混合塑模,偵測準確便明顯下降,印證誠實與不誠實賣家之間具有高度相似性。 |
英文摘要 |
One of the successful experiences for e-commerce has been online shopping and its changes to the modern consumer patterns in the market. However, some sellers on shopping websites use strategies to impact evaluation, in order to accumulate credit and enhance sales. This impact evaluation appears to be normal, but becomes a potentially unsafe trading crisis. For example, there are many merchandise sellers with high evaluations that will even sell fakes and make consumers suffer unknowingly. When faced with half-truthed evaluation points, traders not only need to be cautious, but also need to have a faster response with better countermeasures. Because of this, this research found an effective method to detect dishonest sellers on e-commerce sites. First, we collected a huge attribute set to accurately describe the nature of dishonest sellers, covering Rating ,Current ,History and Service of 105 kinds of attributes. Second, we explore the many ways sellers impact evaluations in order to classify the ways sellers impact the evaluations. Next, we use x-means clustering algorithm to separate honest sellers and dishonest sellers. According to the cluster centroids, we can analyze the data and create different detection models. To verify the effectiveness of the proposed method, this present study uses actual transaction data from the Taobao for validation. When using attribute sets of dishonest and honest sellers, the average detection rate is less than 50% accurate. But when using attribute sets of only dishonest sellers, the accuracy rate can be increased to 70% to 78%, indicating the feasibility of the method proposed in this study. When mixing different types of methods of dishonest sellers, accurately detecting dishonest sellers decrease significantly. To conclude, honest and dishonest sellers have very similar methods of selling their merchandise. |
第三語言摘要 | |
論文目次 |
目錄 第一章 緒論 1 1.1研究背景 1 1.2研究動機 3 1.3研究目的 5 1.4章節架構 6 第二章 相關技術與背景知識 7 2.1線上購物 7 2.2電子商務交易異常偵測 8 2.3詐騙偵測相關文獻 9 2.4偵測模型的建立 11 第三章 線上購物不誠實賣家偵測流程 13 3.1不誠實賣家偵測屬性集 13 3.2建立分類類別 18 3.3以分群方式提升偵測準確率 19 3.4資料蒐集 24 第四章 實驗結果 28 5.1實驗設定 28 5.2實驗步驟 29 5.2.1各不誠實賣家與誠實賣家之偵測 29 5.2.2不誠實賣家相互混合與誠實賣家之偵測 30 5.2.3混合樣本之各種屬性組合 31 5.3實驗結果 32 5.3.1各不誠實賣家與誠實賣家之偵測 32 5.3.2不誠實賣家相互混合與誠實賣家之偵測 33 5.3.3混合樣本之各種屬性組合 35 第五章 結論及未來展望 37 參考文獻 39 附錄一、偵測屬性集 42 附錄二、人工資料採集之標準文件 45 附錄三、樣本比例改成H:DH=2:1之實驗結果 46 表目錄 表 2-1: 詐騙偵測相關文獻 10 表 2-2: Chau等人(2005)提出之詐騙偵測屬性集 10 表 3-3: 屬性分類表-評分機制(R) 14 表 3-4: 屬性分類表-營業狀況(C) 15 表 3-5: 屬性分類表-歷史評分(H) 16 表 3-6: 屬性分類表-售後服務(S) 17 表 3-7:不誠實賣家類型之分群的中心數據 21 表 3-8:樣本的挑選條件 25 表 3-9:與淘寶評分系統之相關屬性 26 表 3-10:與商品頁面相關之屬性 26 表 3-11:人工採集資料之相關屬性 27 表 4-12:樣本個數與比例分布圖 29 表 4-13:混合不誠實賣家之所有排列組合 31 表 4-14:屬性類別與其排列組合 32 表 4-15:各不誠實賣家與誠實賣家之偵測結果 33 表 4-16:不誠實賣家相互混合與誠實賣家之偵測結果一 34 表 4-17:不誠實賣家相互混合與誠實賣家之偵測結果二 34 表 4-18:不誠實賣家相互混合與誠實賣家之偵測結果三 35 表 4-19:混合樣本之各種屬性組合偵測結果 36 圖目錄 圖 2-1:典型的網路交易異常偵測流程 9 圖 3-2:某淘寶賣家利誘買家給予正評 18 圖 3-3:某淘寶賣家宣示中差評的處置 19 圖 3-4: 分群塑模以建立分類樹 24 |
參考文獻 |
參考文獻 1. Aha, D. W. (1991). Instance-based learning algorithms. Machine learning, 6(1), pp. 37-66. 2. Chang, E. a. (2006). Trust and reputation for service-oriented environments: technologies for building business intelligence and consumer confidence. John Wiley & Sons. 3. Chang, J.-S. a.-H. (2009). An Early Fraud Detection Mechanism for Online Auctions Based on Phased Modeling. Pervasive Computing (JCPC), 2009 Joint Conferences on (pp. 743-748). IEEE. 4. Chang, J.-S. a.-H. (2014). Analysis of fraudulent behavior strategies in online auctions for detecting latent fraudsters. Electronic Commerce Research and Applications, 13(2), pp. 79-97. 5. Chang, W.-H. a.-S. (2010). An online auction fraud screening mechanism for choosing trading partners. Education Technology and Computer (ICETC), 2010 2nd International Conference on. 5, pp. V5-56. IEEE. 6. Chang, W.-H. a.-S. (2010). Using clustering techniques to analyze fraudulent behavior changes in online auctions. Networking and Information Technology (ICNIT), 2010 International Conference on (pp. 34-38). IEEE. 7. Chang, W.-H. a.-S. (2012). An effective early fraud detection method for online auctions. Electronic Commerce Research and Applications, 11(4), pp. 346-360. 8. Chau, D. H. (2005). Fraud detection in electronic auction. European Web Mining Forum at ECML/PKDD, (pp. 87-97). 9. Chau, D. H. (2006). Detecting fraudulent personalities in networks of online auctioneers. Knowledge Discovery in Databases: PKDD (pp. 103-114). Springer. 10. Chouchoulas, A. a. (2001). Rough set-aided keyword reduction for text categorization. Applied Artificial Intelligence, 15(9), pp. 843-873. 11. Dash, M. a. (1997). Feature selection for classification. Intelligent Data Analysis, 1(3), pp. 131-156. 12. eBay. (2013). eBay交易安全 網上拍賣自保招數─詐騙賣家的特徵. 擷取自 eBay台灣: http://pages.ebay.com.hk/securitycenter/education/fraud_traits.html 13. Liu, H. a. (1998). Feature extraction, construction and selection: A data mining perspective. Norwell, MA: Kluwer Academic Publishers. 14. Liu, H. a. (1998). Feature selection for knowledge discovery and data mining. Norwell, MA: Kluwer Academic Publishers. 15. Pandit, S. a. (2007). Netprobe: a fast and scalable system for fraud detection in online auction networks. Proceedings of the 16th international conference on World Wide Web (pp. 201-210). ACM. 16. Quinlan, J. R. (2014). C4. 5: programs for machine learning. Elsevier. 17. Michelle, T. M., "Machine Learning", McGrow Hill 1997. 18. Smith, M. G. and L. Bull, “Genetic programming with a genetic algorithm for feature construction and selection,” Genet. Program. Evol. Mach., vol. 6, no. 3, pp. 265–281, Sep. 2005. 19. Kohavi, Ron and John, H.George, "Wrappers for feature subset selection", Artificial Intelligence 97 (1997), pp. 273-324 20. Frank, E. and Witten, I. H. Generating Accurate Rule Sets Without Global Optimization. In Proceedings of the Fifteenth international Conference on Machine Learning (July 24 - 27, 1998), 144-151. 21. Tomasz Kaszuba , Albert Hupa , Adam Wierzbicki. "Advanced Feedback Management for Internet Auction Reputation Systems." IEEE Computer Society, 2010. 22. Ludwig, S.A., Kersten, G.E., and Huang, X., (2006), Towards a Behavioural Agent-Based Assistant for e-Negotiations, in: Proceedings of the Montreal Conference on e-Technologies 23. Pelleg, D., Moore, A., (2000),"X-Means: Extending k-Means with Efficient Estimation of the Number of Clusters", Morgan Kaufmann Publishers,San Francisco, CA, pp. 727–734. 24. Kaszuba, T., Hupa, Al., and Wierzbicki, A. (2010), “Advanced Feedback Management for Internet Auction Reputation Systems, “ IEEE Internet Computing, Sep/Oct 2010, p. 31-37. 25. Wang, J., & Chiu, C. (2005). Detecting OnlineAuction Inflated-Reputation Behaviors using Social Network Analysis. Proceedings of NAACSOS Conference 2005, June 26-28. 26. Gavish, B., & Tucci, C. (2008). Reducing Internet Auction Fraud. Communications of the ACM, vo. 51, no. 5 , pp. 89-97. 27. 沈燕妮. (2015年1月28日). 網購一半是假貨? 淘寶小二舌戰工商總局. 擷取自 每日經濟新聞: http://www.nbd.com.cn/articles/2015-01-28/893867.html 28. 洪聖壹. (2014年11月12日). 淘寶天貓雙11單日破571億人民幣!小米賣出116萬支手機. 擷取自 ETtoday東森新聞雲: http://www.ettoday.net/news/20141112/425024.htm 29. 張昭憲, & 莊秉諺. (2013). 線上拍賣詐騙行為之時序分析, 淡江大學碩士論文, 102年. 30. 張碧暖. (2012). 信用評價制度與網路交易. 中央大學產業經濟研究所學位論文. 31. 淘寶網. (2015年3月31日). 淘寶網台灣:關於我們. 擷取自 淘寶網台灣: http://www.taobao.com/about/?spm=a213z.1224559.2014091600.43.kyJBK7 32. 曾憲雄; 蔡秀滿; 蘇東興; 曾秋蓉; 王慶堯. (2011). 資料探勘Data Mining. 施威銘. 33. 黃文貴. (2014年11月12日). 電子商務最重要的12個關鍵數據 (上). 擷取自 台灣經貿網: http://www.taiwantrade.com.tw/CH/bizsearchdetail/84779/I?keyword0=%E9%9B%BB%E5%AD%90%E5%95%86%E5%8B%99%E6%9C%80%E9%87%8D%E8%A6%81%E7%9A%8412%E5%80%8B%E9%97%9C%E9%8D%B5%E6%95%B8%E6%93%9A%20(%E4%B8%8A)&path=fulltext 34. 樂天市場新聞 (2014年12月29日). 擷取自 台灣樂天市場官網: http://www.rakuten.com.tw/info/release/2014/1229.html 35. 謝宜廷. (2013). 網路市集賣家影響下的評價分數與評論取向. 36. 蘇木春、張孝德. (1997). 機器學習 類神經網路、模糊系統以及基因演算法則. 台北市: 全華科技圖書股份有限公司. 37. 黃淳韋. 考量對手喜好變動之協商支援系統.淡江大學資訊管理學系碩士論文, 2012. 38. 劉祐宏. 線上拍賣詐騙偵測之屬性挑選與流程設計. 淡江大學資訊管理學系碩士論文, 2012. 39. 鄭孝儒. 線上拍賣潛伏期詐騙者之有效偵測. 淡江大學資訊管理學系碩士論文, 2011. |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信