淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-2507202018510400
中文論文名稱 比較遷移學習與推薦系統於電影資料上之應用
英文論文名稱 A Comparison between Transfer Learning and Recommended System with Application in Movie Data
校院名稱 淡江大學
系所名稱(中) 大數據分析與商業智慧碩士學位學程
系所名稱(英) Master's Program In Big Data Analytics and Business Intelligence
學年度 108
學期 2
出版年 109
研究生中文姓名 王鼎堯
研究生英文姓名 Ting-Yao Wang
學號 607890125
學位類別 碩士
語文別 中文
口試日期 2020-07-01
論文頁數 43頁
口試委員 指導教授-陳景祥
共同指導教授-陳怡如
委員-鄧文舜
委員-何宗武
中文關鍵字 iMDb資料庫  Movielens資料庫  推薦系統  遷移學習  交叉驗證 
英文關鍵字 Movielens Database  iMDb Database  Recommended System  Transfer Learning  Cross Validation 
學科別分類
中文摘要   本研究主要利用推薦系統演算法之中的基於使用者協同過濾演算法(user-based collaborative filtering),以及遷移學習演算法(transfer learning)來預測使用者對電影的評分,基於這個評分來決定是否要推薦此電影給使用者。在使用推薦系統演算法常會遇到冷啟動問題(cold start),導致模型預測及推薦效果不佳,遷移學習演算法的主要目的為解決數據標記不易或資料取得困難。在遷移學習訓練中,本研究加入電影的標籤基因組(tag genome)來當作變數,本研究嘗試利用遷移學習演算法來改善冷啟動的問題,提升推薦系統模型的效能。
  本研究模型為預測一連續型數值變數,因此評估模型表現優異之準則使用均方根誤差(Root Mean Square Error, RMSE)、平均絕對誤差(Mean Absolute Error, MAE)以及對稱平均絕對百分比誤差(Symmetric mean absolute percentage error, sMAPE)。本研究實證結果顯示,利用iMDb的平均評分來做遷移學習預測Movielens的評分,此種模型效果不佳,因此本研究建議先使用協同過濾演算法,如需要遷移學習演算法,須尋找其他資料來作為預訓練資料。
英文摘要   To predict the rating of movies by users, this study applies two techniques, which are User-based Collaborative Filtering and Transfer Learning. Recommendation of movies depends on its rating. Cold start problem usually happens when applying recommended system and it will affect the result of model predictions and recommendations. Nonetheless,Transfer Learning could tackle this problem and it also help to solve the difficulty of data labeling and the difficulty of collect data. For the training of transfer learning, this paper uses “tag genome” as variables. This study tries to use transfer learning to improve the problems with cold start so that it can upgrade the efficiency of transfer learning.
  We use Root Mean Square Error, Mean Absolute Error, and Symmetric Mean Absolute Percentage Error to evaluate the continuous target variable. The outcome of this study reveals that the performance is poor when we use transfer learning with average rating of iMDb database. Hence, this study recommends applying User-based Collaborative Filtering as priority. If Transfer Learning must be used, it needs to find more data other than target data for better pretraining.
論文目次 目錄
目錄 I
表目錄 III
圖目錄 IV
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機與目的 2
1.3 研究流程 3
第二章 文獻回顧 4
2.1 推薦系統(RECOMMENDER SYSTEM) 4
2.1.1 基於人口使用的推薦演算法 4
2.1.2 基於內容的推薦演算法 4
2.1.3 協同過濾推薦演算法 5
2.1.4 混和推薦 6
2.2 推薦系統常見問題 7
2.2.1 資料稀疏性: 7
2.2.2 可擴展性: 7
2.2.3 冷啟動: 7
2.3 遷移學習(TRANSFER LEARNING) 8
2.4 交叉驗證(CROSS-VALIDATION) 9
2.4.1 截留確認法: 9
2.4.2 K折交叉驗證法: 10
2.4.3 留一驗證法: 10
2.5 標籤基因(TAG-GENOME) 10
2.6 對稱平均絕對百分比誤差(SMAPE) 11
第三章 研究方法 12
3.1 資料預處理 12
3.2 推薦系統演算法 16
3.3 遷移學習應用於推薦系統 18
3.4 模型評估指標 22
3.4.1 均方根誤差(RMSE) 22
3.4.2 平均絕對誤差(MAE) 22
3.4.3 對稱平均絕對百分比誤差(sMAPE) 22
3.5 交叉驗證 23
第四章 實證結果與分析 25
4.1 分析環境 25
4.2 資料敘述 26
4.3 實驗結果 30
4.3.1 基於使用者的協同過濾推薦系統模型 30
4.3.2 遷移學習推薦系統模型 32
4.3.3 模型比較 38
第五章 結論 39
5.1 研究結果 39
5.2 研究限制 40
5.3 建議和未來展望 40
參考文獻 41












表目錄
表1 使用者及商品矩陣 6
表2 電影資料集 13
表3 TOY STORY電影類型 13
表4 電影基因標籤 14
表5 電影基因分數 14
表6 整理過後的電影基因資料集 14
表7 預訓練資料 15
表8 目標訓練資料 15
表9 電影評分 16
表10 電影評分矩陣 16
表11 協同過濾示意圖 17
表12 分析環境 25
表13 電影評分摘要 27
表14 基於使用者協同過濾推薦系統模之評估 30
表15 基於使用者協同過濾推薦系統模型之交叉驗證評估 31
表16 預訓練模型訓練過程迭代次數 33
表17 預訓練模型模型之交叉驗證評估 34
表18 類神經網路參數 35
表19 遷移模型訓練過程迭代次數 36
表20 遷移模型推薦系統模型之交叉驗證評估 37
表21 兩種推薦系統模型之評估指標 38




圖目錄
圖1 研究流程圖 3
圖2 KNN中K=3示意圖 18
圖3 類神經網路示意圖 19
圖4 遷移學習示意圖 21
圖5 交叉驗證示意圖 24
圖6 電影類別數量圖 29

參考文獻 參考文獻
中文文獻
方菲,2014。开放网络学习环境中的推荐系统研究,安徽大学。
洪崇富,2008。基於使用者行為之網頁推薦系統,淡江大學資訊工程學系碩士在
職專班碩士論文。
郭珉辰,2019。資料探勘技術在信用卡不平衡資料上之應用,淡江大學大數據分
析與商業智慧碩士學位學程碩士論文。
廖瑋婕,2018。串流資料演算法於推薦系統的應用,淡江大學統計學系應用統計
學碩士班碩士論文。

英文文獻
Adomavicius G., and Tuzhilin A., 2005. Toward the next generation of recommender
systems: A survey of the state-of-the-art and possible extensions, IEEE Transactions on Knowledge and Data Engineering, 17(6), pp. 734-749.
Biadsy N., Rokach L., and Shmilovici A., 2013. Transfer learning for content-based
recommender systems using tree matching, Availability Reliability and Security in Information Systems and HCI, Berlin, Germany:Springer, pp. 387-399.
Goldberg D., Nichols D., Oki BM., and Terry D., 1992. Using collaborative filtering to
weave an information tapestry, Communications of the ACM, 35(12), pp. 61-70.
Hahsler M., 2011. Recommenderlab: A framework for developing and testing
recommendation algorithms.
Herlocker J. L., Konstan J. A., and Riedl J., 2000. Explaining cooaborative filtering
recommendations, CSCW ’00 Proceedings of the 2000 ACM conference on Computer supported cooperative work, pp. 241-250.
Linden G., Smith B., and York J., 2003. Amazon.com recommendations: Item-to-Item
collaborative filtering, IEEE Internet Computing, 7(1), pp. 76-80.
Meade N., and Armstrong J.S., 1986. Long Range Forecasting: From Crystal Ball to
Computer (2nd Edition), The Journal of the Operational Research Society, 37, pp. 533.
Pan S., and Yang Q., 2010. A survey on transfer learning, IEEE Transactions on
Knowledge and Data Engineering, 22(10), pp. 1345-1359.
Perlich C., Dalessandro B., Raeder T., Stitelman O., and Provost F., 2014. Machine
learning for targeted display advertising: Transfer learning in action, Machine Learn, 95(1), pp. 103-127.
Resnick P., Iacovou N., Suchak M., Bergstrom P., and Riedl J., 1994. GroupLens: an
open architecture for collaborative filtering of netnews, Proceedings of the Conference on CSCW '94, pp. 175-186.
Schafer J. B., Konstan J., Riedl J., 1999. Recommender Systems in E-Commerce,
EC ‘99: Proceedings of the First ACM Conference on Electronic Commerce, Denver, CO, pp. 158-166.
Shin H., Roth H., Gao M., Lu L., Xu Z., Nogues I., Yao J., Mollura D., and Summers
R., 2016. Deep convolutional neural networks for computer-aided detection: CNN architectures, dataset characteristics and transfer learning, IEEE Transactions on Medical Imaging, 35(5), pp. 1285-1298.
Vig J., Sen S., and Riedl J., 2012. The tag genome: Encoding community knowledge to
support novel interaction, ACM Transactions on Interactive Intelligent Systems, 2(3), pp. 13:1-13:44.
Voumard A., and Beydoun G., 2019. Transfer learning in credit risk, ECML PKDD,
pp. 1-16.
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2020-07-27公開。
  • 同意授權瀏覽/列印電子全文服務,於2020-07-27起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2486 或 來信