系統識別號 | U0002-2607202016013800 |
---|---|
DOI | 10.6846/TKU.2020.00760 |
論文名稱(中文) | 推薦系統之方法組合比較–以歌曲資料為例 |
論文名稱(英文) | Comparisons of the Combinations of Recommended System Algorithms with Application in Web Song Data |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 大數據分析與商業智慧碩士學位學程 |
系所名稱(英文) | Master's Program In Big Data Analytics and Business Intelligence |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 108 |
學期 | 2 |
出版年 | 109 |
研究生(中文) | 郭珮芝 |
研究生(英文) | Pei-Chih Kuo |
學號 | 608890058 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2020-07-01 |
論文頁數 | 34頁 |
口試委員 |
指導教授
-
陳景祥(steve@home.com.tw)
共同指導教授 - 陳怡如(133092@mail.tku.edu.tw) 委員 - 鄧文舜(121350@mail.tku.edu.tw) 委員 - 何宗武(tsungwu@gapps.ntnu.edu.tw) |
關鍵字(中) |
推薦系統 關聯規則 集群分析 |
關鍵字(英) |
Recommender Systems Association Rule Cluster Analysis |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
現在網路商店的設計越來越精細,時常在網頁的一旁能夠看見商家推薦給消費者的商品,但推薦的商品時常僅是當下較熱門的商品或是使用者曾經點選瀏覽過的商品,無法精準的推薦消費者需要的商品。 本研究利用歌曲收藏資料,比較集群分析搭配推薦系統、關聯規則搭配推薦系統,將使用者與歌曲之間的關係利用集群分析與關聯規則將其找出,協助後續的推薦系統能夠提出較準確的推薦依據。 用戶收藏資料分析結果顯示,關聯規則搭配推薦系統優於集群分析搭配推薦系統,且在關聯規則搭配推薦系統中,基於用戶的推薦(UBCF)是最適當的推薦方法,且只推薦前五首歌曲時準確度最高。另外關聯規則也可以解決推薦系統中冷啟動(Cold start)、資料稀疏性(Sparsity)的問題,例如:較少用戶收聽的新歌曲,或收聽率高但是無收藏、評分紀錄的歌曲。 |
英文摘要 |
Nowadays, the design of online stores is becoming more and more sophisticated, and it is often possible to see the products recommended by merchants to consumers on the side of the web page. However, the recommended products are often only the current popular products or the products that users have clicked and browsed, without accurately recommending the products that consumers need. This study uses the song collection data to compare the cluster analysis collocation recommendation system and association rules collocation recommendation system in order to assist the subsequent recommendation system to put forward more accurate recommendation basis. Analysis results of user collection data show that association rule collocation recommendation system is superior to cluster analysis collocation recommendation system, and in association rule collocation recommendation system, user-based recommendation (UBCF) is the most appropriate recommendation method, and the accuracy is the highest when recommending only the first five songs. Association rules can also solve the problems of cold start and sparsity problem in recommendation systems, such as new songs that are listened to by fewer users, or songs with high attendance but no collection of score records. |
第三語言摘要 | |
論文目次 |
目錄 第一章 緒論 1 第一節 研究背景與動機 1 第二節 研究目的 2 第三節 論文架構 2 第二章 文獻探討 3 第一節 推薦系統 3 1. 基於人口統計學的推薦 3 2. 內容導向式推薦 3 3. 協同式過濾推薦 4 4. 混合式推薦系統 5 5. 推薦系統問題討論 5 6. 推薦系統準確度評估 6 第二節 關聯規則分析 7 第三節 集群分析 10 1. K-平均演算法 10 2. K-中心演算法 12 第三章 研究方法 14 第一節 研究架構 14 第二節 資料轉換 16 第三節 關聯規則 17 第四節 集群分析 18 第五節 推薦系統 19 第四章 分析結果與成效評估 21 第一節 分析環境 21 第二章 資料敘述 21 第三節 關聯規則最適支持度與信賴度之結果評估 22 第四節 集群方法最佳分群數之結果評估 23 第五節 推薦系統精確度評估 24 1. 準確率(Precision) 25 2. 召回率(recall) 26 3. F-分數(F-Score) 28 4. ROC曲線 29 第五章 結論與未來展望 32 第一節 結論 32 第二節 建議與未來展望 32 參考文獻 33 中文文獻 33 英文文獻 33 表目錄 表2.1 User-Item Matrix矩陣 4 表2.2混淆矩陣 6 表2.3資料集 8 表2.4各項目出現次數與支持度 8 表2.5各項目出現次數與支持度 9 表2.6各項目出現次數與支持度 9 表2.7最終的高頻項目集(Large itemset) 9 表3.1原始資料(前10筆) 16 表3.2 User-Item Matrix矩陣資料型態(前五首歌曲、前十五位用戶) 17 表4 1 研究方法使用之R套件 21 表4.2 原始資料(前五筆) 22 表4.3 不同支持度之比較 22 表4.4 支持度=0.0003,信賴度=0.6 23 表4.5 支持度=0.0003,信賴度=0.7 23 表4.6 支持度=0.0003,信賴度=0.8 23 表4.7 R軟體vegan套件分群結果 24 表4.8 集群分析搭配推薦系統之準確率 25 表4.9 關聯規則搭配推薦系統之準確率 25 表4.10 推薦系統之準確率 25 表4.11 集群分析搭配推薦系統之F-Score 28 表4.12 關聯規則搭配推薦系統之F-Score 28 表4.13 推薦系統之F-Score 28 圖目錄 圖1.1 KKBOX電台推薦 1 圖1.2 MyMusic推薦歌單 2 圖2.1 k-means隨機選取資料中k個集群中心點 11 圖2.2 k-means產生初始k個集群 11 圖2.3 k-means從目前的集群中找尋新的中心點 11 圖2.4 K- medoids隨機設定k個聚類 12 圖2.5 K- medoids產生k個集群數 13 圖2.6 K- medoids從目前的集群中找尋新的中心點 13 圖3.1研究架構圖 15 圖3.2以用戶為單位的資料型態 16 圖4.1 集群分析搭配推薦系統之recall 26 圖4.2 關聯規則搭配推薦系統之recall 27 圖4.3 推薦系統之recall 27 圖4.4 集群分析搭配推薦系統之ROC曲線圖 29 圖4.5 關聯規則搭配推薦系統之ROC曲線圖 30 圖4.6 推薦系統之ROC曲線 31 |
參考文獻 |
中文文獻 羅健銘(2001), 協同過濾於網站推薦之研究, 國立台北科技大學商業自動化與管理研究所碩士論文. 蘇育群(2015), 應用平行關聯演算法於中式速食連鎖餐, 淡江大學資訊管理學系碩士班碩士論文. 林宜潔(2017), 應用於影片推薦系統的集群技術比較, 淡江大學統計學系應用統計學碩士班碩士論文. 英文文獻 Goldberg, D., Nichols. D., Oki, B. M. & Terry, D., (1992)Using Collaborative Filtering to Weave an Information Tapestry. Communications of the ACM - Special issue on information filtering, 35, pp. 61-70. Resnick, H., Acierno, R., Holmes, M., Kilpatrick, D.G., & Jager, N. (1999) Prevention of Post-Rape Psychopathology: Preliminary Findings of a Controlled Acute Rape Treatment Study. Journal of Anxiety Disorders, 13, pp. 359-370. Schafer, J. B., Konstan, J., & Riedl, J. (1999). Recommender systems in e-commerce. Paper presented at the Proceedings of the 1st ACM Conference on Electronic Commerce, pp. 158-166. Herlocker J. L., Konstan, J. A., & Riedl, J. (2000). Explaining collaborative filtering recommendations. CSCW '00 Proceedings of the 2000 ACM conference on Computer supported cooperative work. pp. 241-250. Adomavicius, G., & Tuzhilin, A. (2005). Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. IEEE Transactions on Knowledge and Data Engineering, B, pp. 734-749. Agrawal, Rakesh, Tomasz Imieliński, and Arun Swami. "Mining association rules between sets of items in large databases." ACM SIGMOD Record. Vol. 22. No. 2. ACM, 1993. Agrawal, Rakesh, and Ramakrishnan Srikant. "Fast algorithms for mining association rules." Proc. 20th int. conf. very large data bases, VLDB. Vol. 1215. 1994. |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信