| 系統識別號 | U0002-1401202414390100 |
|---|---|
| DOI | 10.6846/tku202400013 |
| 論文名稱(中文) | 以機器學習方法進行網路賣家評價之有效預測 |
| 論文名稱(英文) | Effective prediction of online seller feedback using machine learning |
| 第三語言論文名稱 | |
| 校院名稱 | 淡江大學 |
| 系所名稱(中文) | 資訊管理學系碩士班 |
| 系所名稱(英文) | Department of Information Management |
| 外國學位學校名稱 | |
| 外國學位學院名稱 | |
| 外國學位研究所名稱 | |
| 學年度 | 112 |
| 學期 | 1 |
| 出版年 | 113 |
| 研究生(中文) | 林子翔 |
| 研究生(英文) | Zih-Siang Lin |
| 學號 | 610630336 |
| 學位類別 | 碩士 |
| 語言別 | 繁體中文 |
| 第二語言別 | |
| 口試日期 | 2024-01-04 |
| 論文頁數 | 56頁 |
| 口試委員 |
指導教授
-
張昭憲(jschang@mail.tku.edu.tw)
口試委員 - 周清江 口試委員 - 壽大衛 口試委員 - 張昭憲(jschang@mail.tku.edu.tw) |
| 關鍵字(中) |
信用評估 屬性選擇 機器學習 電子商務 |
| 關鍵字(英) |
quality of service machine learning feature selection online shopping e-commerce |
| 第三語言關鍵字 | |
| 學科別分類 | |
| 中文摘要 |
隨著電子商務蓬勃發展,網路消費已成為社會大眾生活的日常模式。為協助消費者挑選更合適的交易對象,本研究將針對線上購物,發展有效的賣家服務品質預測方法。首先,我們設計了一套評價分數預測之屬性集,內容涵蓋與時間相關之分數累積方式,以及買方留言內容之極性分析。而後,我們使用多種不同學習方法來塑模,並以預測賣方未來的評價分數為主要目標。為提升屬性集的效能,塑模前也進行屬性篩選與維度縮減等流程,以進一步提升預測效能。為驗證提出方法之有效性,我們自蝦皮網站下載實際的交易資料。實驗時,使用Linear Regression, Random Forest Regression, XGBoost, MLP 等四種塑模方法,並配合四種不同的屬性挑選方法,建立多種評價分數預測模型。實驗結果顯示,本研究提出之屬性集確實有助於精準預測賣家在未來的評價分數。在眾多實驗組合中,若未使用屬性選擇,則以隨機森林演算法可獲得最佳預測結果。若考慮屬性選擇,則以線性迴歸演算法配合包裝器法(Wrapper)表現最佳。由上述結果可知,本研究提出之方法確實有助於消費者挑選合適的交易對象。同時,也發現當資料變動不大時,傳統的線性迴歸相較於其他複雜的塑模方法,更可獲得準確的預測結果。 |
| 英文摘要 |
With the vigorous development of e-commerce, online transactions have become an important part of public life. In order to assist consumers in selecting more suitable transaction partners, this study develops an effective seller service quality prediction method for online shopping. First, we designed a set of evaluation score prediction attributes, covering time-related score accumulation methods and polarity analysis of buyer message content. Then, we use a variety of different learning methods to shape the model, hoping to effectively predict the seller's future evaluation score. In addition, this study also performs attribute selection to reduce molding costs and further improve prediction performance. In order to verify the effectiveness of the proposed method, we downloaded Shopee's actual transaction data for experiments, and used four modeling methods such as Linear Regression, Random Forest, XGBoost, and MLP together with various attribute screening methods to generate model combinations. The results show that the attribute set proposed in this study can indeed help establish an accurate prediction model and effectively evaluate the seller's future evaluation score. When combined with attribute filtering, the accuracy can be further improved. The above results show that the method proposed in this study can help select suitable transaction partners and reduce unexpected transaction disputes. |
| 第三語言摘要 | |
| 論文目次 |
目錄 第一章 緒論 1 第二章 背景知識與相關技術 4 2.1 網路購物與線上交易糾紛 4 2.2 機器學習方法 5 2.3 屬性選取(Feature Selection) 7 第三章 以機器學習方法預測網路賣家評價 10 3.1 賣家品質預測之屬性設計 10 3.2 賣家品質預測屬性之產生方式 15 3.3 配合屬性篩選之賣家評價分數預測 17 3.4 資料蒐集 19 3.4.1 資料下載 19 3.4.2 資料處理 21 第四章 實驗結果 23 4.1 實驗設定 23 4.2 以機器學習方法進行評價分數預測 24 4.2.1 「iPhone保護殼」賣家預測結果 24 4.2.2 「冬季衣物」賣家預測結果 25 4.3 以屬性選取方法配合機器學習進行評價分數預測 26 4.3.1 「iPhone保護殼」賣家之預測結果 26 4.3.2 「冬季衣物」賣家之預測結果 30 4.4 實驗結果分析 34 4.4.1 「iPhone手機保護殼」賣家評價分數預測結果比較 34 4.4.2 「冬季衣物」賣家評價分數預測結果比較 35 4.4.3 綜合討論 37 第五章 結論與未來方向 38 參考文獻 40 附錄A: 對應各種學習方法之屬性選取結果 42 附錄B: 屬性計算公式 45 附錄C: 詞彙字典 48 表目錄 表1:本研究提之賣家交易品質預測屬性類型表 13 表2:預測標的Y值表 15 表3:與賣家評論相關屬性之產生方式範例 17 表4(a):「iPhone手機保護殼」賣家評價分數之預測結果比較 25 表4(b):「iPhone手機保護殼」賣家評價分數之預測結果比較 25 表5(a):「冬季衣物」賣家評價分數之預測結果比較 26 表5(b):「冬季衣物」賣家評價分數之預測結果比較 26 表6 (a):「iPhone手機保護殼」賣家評價分數之預測(LR +屬性選取) 27 表6 (b):「iPhone手機保護殼」賣家評價分數之預測(LR +屬性選取) 27 表7 (a):「iPhone手機保護殼」賣家評價分數之預測(RF-R+屬性選取) 28 表7 (b):「iPhone手機保護殼」賣家評價分數之預測(RF-R+屬性選取) 28 表8 (a):「iPhone手機保護殼」賣家評價分數之預測(XGB-R+屬性篩選) 29 表8 (b):「iPhone手機保護殼」賣家評價分數之預測(XGB-R+屬性篩選) 29 表9 (a):「iPhone手機保護殼」賣家評價分數之預測(MLP+屬性篩選) 30 表9 (b):「iPhone手機保護殼」賣家評價分數之預測(MLP+屬性篩選) 30 表10 (a):「冬季衣物」賣家評價分數預測結果(LR +屬性選取) 31 表10 (b):「冬季衣物」賣家評價分數預測結果(LR +屬性選取) 31 表11 (a):「冬季衣物」賣家評價分數之預測(RF-R+屬性選取) 32 表11 (b):「冬季衣物」賣家評價分數之預測(RF-R+屬性選取) 32 表12 (a):「冬季衣物」賣家評價分數之預測(XGB-R +屬性選取) 32 表12 (b):「冬季衣物」賣家評價分數之預測(XGB-R +屬性選取) 33 表13 (a):「冬季衣物」賣家評價分數之預測(MLP+屬性選取) 33 表13 (b):「冬季衣物」賣家評價分數之預測(MLP+屬性選取) 33 表14:「iPhone手機保護殼」賣家所有模型Y0之預測結果 34 表15:「冬季衣物」賣家所有模型Y0之預測結果 36 表A-1:以filter method進行屬性篩選之結果 42 表A-2:以wrapper method進行屬性篩選之結果 43 表B-1:賣家預測屬性公式設計表-評價星等相關屬性 45 表B-2:賣家預測屬性公式設計表-評論內容相關屬性 47 表B-3:預測標的公式設計表 48 圖目錄 圖1:屬性選擇技術介紹(圖片來源:Verónica et al. 2013) 8 圖2:研究流程圖 10 圖3:屬性篩選與降維重要性之說明範例 18 圖4:本研究建立賣家品質預測模型之流程架構圖 18 圖5:蝦皮賣家資訊頁面 20 圖6:開發人員工具頁面 20 圖7:爬蟲程式碼範例 21 圖8:彙整之賣家評論資料 22 圖9:蒐集資料經處理後所產生之屬性檔案 (Attribute-iPhone手機保護殼.csv) 22 圖10:蒐集資料經處理後所產生之屬性檔案 (Attribute-冬季衣物.csv) 22 圖11(a):「iPhone手機保護殼」賣家平均評價分數預測結果-RMSE(Y0) 35 圖11(b):「iPhone手機保護殼」賣家平均評價分數預測結果-MAE(Y0) 35 圖11(a):「冬季衣物」賣家平均評價分數預測結果-RMSE(Y0) 36 圖11(b):「冬季衣物」賣家平均評價分數預測結果-MAE(Y0) 36 |
| 參考文獻 |
參考文獻 1. TWO TREE TEAM (2022),台灣7大最有人氣的網路購物平台【2023年版】,發佈日期:2022年4月13日,https://twotreeteam.com/zh/living-in-taiwan/。 2. 行政院 (2023),「6大電商平台111年度被申訴案件減少22%」,行政院消費者保護處新聞稿,發佈日期:2023年4月10日,https://cpc.ey.gov.tw/Page/。 3. OOSGA消費者研究小組(2023),台灣電商市場概況:2023年電商市場發展、零售趨勢、平台分佈,最後更新於:2023年3月24日,https://zh.oosga.com/e-commerce/twn/。 4. 蝦皮購物,https://shopee.tw/, last Retrieved on 2023/10/16. 5. 張昭憲, 陳世軒(2021),「以模型融合為基礎之線上拍賣詐騙偵測」,資訊管理學報,28(4),419-444. (2021年10月)。 6. 維基百科,主成分分析,最後更新於:2023年8月26日https://zh.wikipedia.org/zh-tw/。 7. Filter methods (過濾器法),發佈日期:2020年9月28日,https://ithelp.ithome.com.tw/articles/10245037。 8. Wrapper Methods (包裝器法),發佈日期:2020年9月29日,https://ithelp.ithome.com.tw/articles/10246251。 9. Python爬蟲實例,如何爬取"蝦皮購物"的商品、評價資料?,發佈日期:2021年02月28日,https://blog.jiatool.com/posts/shopee_spider/。 10. Amrehn, M., Mualla, F., Angelopoulou, E., Steidl, S., & Maier, A. (2018, December19). The Random Forest Classifier in WEKA: Discussion and New Developments for Imbalanced Data.https://deepai.org/publication/the-random-forest-classifier-in-weka-discussion-and-new-developments-for-imbalanced-data. 11. eMarketer (2023). Worldwide Ecommerce Forecast 2023. Retrieved on Aug. 1, 2023, https://www.emarketer.com/topics/topic/retail-ecommerce. 12. Chang, J. S. & Chang, W. H. (2009) An early fraud detection mechanism for online auctions based on phased modeling. Proceedings of the 2009 International Workshop on Mobile Systems E-Commerce and Agent Technology, Taipei, Taiwan, December 3–5. 13. Chang, Wen-Hsi Chang, Jau-Shien Chang, (2012) "An effective early fraud detection method for online auctions," Electronic Commerce Research and Applications, Volume 11, Issue 4, July–August 2012, Pages 346-360 14. Chang, Jau-Shien, Wen-Hsi Chang, (2014) "Analysis of fraudulent behavior strategies in online auctions for detecting latent fraudsters, "Electronic Commerce Research and Applications, Volume 13, Issue 2, March–April 2014, Pages 79-97. 15. Chen, Tianqi, Carlos Guestrin, (2016) "XGBoost: A Scalable Tree Boosting System," Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD'16), August 2016, Pages 785–794 16. Chau, D. H. & Faloutsos, C. (2005). Fraud detection in electronic auction. Proceedings of European Web Mining Forum at ECML/PKDD 2005. 17. Chau, D.H., Pandit, S., & Faloutsos, C. (2006). Detecting fraudulent personalities in networks of online auctioneers. Proceedings of PKDD 2006, 103-144. 18. Chang, W. H. & Chang, J. S. (2012). An effective early fraud detection method for online auctions. Electronic Commerce Research and Applications, 11(4), 346-360 19. Noelia, S., Amparo, A. Amparo, A., & María, T.(2007). Filter Methods for Feature Selection – A Comparative Study. IDEAL 2007, p.178-187. 20. Taha, A. A. and Malebary, S. J., (2020), "An Intelligent Approach to Credit Card Fraud Detection Using an Optimized Light Gradient Boosting Machine," IEEE Access, Volume 8, Feb. 03, 2020. pp. 25579-25587. 21. Verónica, B.,Noelia, S., & Amparo, A. (2013). A review of feature selection methods on synthetic data. Knowledge and Information Systems, 34-3. 22. Xuan, S., Liu, G., Li, Z., Zheng, L., Wang, S., & Jiang, C. (2018). Random forest for credit card fraud detection. 2018 IEEE 15th International Conference on Networking, Sensing and Control (ICNSC). 23. Zamini, M., & Montazer, G. (2018). Credit card fraud detection using autoencoder based clustering. 2018 9th International Symposium on Telecommunications (IST). |
| 論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信