§ 瀏覽學位論文書目資料
  
系統識別號 U0002-2608201910580000
DOI 10.6846/TKU.2019.00895
論文名稱(中文) 應用人工智慧於房價預測模型研究與分析
論文名稱(英文) Research and Analysis of the House Price Prediction using Artificial Intelligence Models
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊工程學系碩士在職專班
系所名稱(英文) Department of Computer Science and Information Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 107
學期 2
出版年 108
研究生(中文) 林育任
研究生(英文) Yu-Ren Lin
學號 706410031
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2019-06-29
論文頁數 55頁
口試委員 指導教授 - 陳建彰
委員 - 楊權輝
委員 - 洪文斌
委員 - 陳建彰
關鍵字(中) 房價預測
機器學習
深度學習
多層感知器
長短期記憶
關鍵字(英) House Price Prediction
Machine Learning
Deep Learning
Multi-layer perceptron
Long Short-Term Memory
第三語言關鍵字
學科別分類
中文摘要
台北市的房價議題時常成為大眾關注的焦點。一般來說,房屋成交價格取決於人們對過去交易價格的理解。在過去數十年中,許多研究人員透過電腦進行預測房價的研究。近年,一些研究也利用實價登錄資料集與不同的機器學習模型來分析、預測房價。
本研究利用實價登錄資料集,以線性回歸,多層感知器及LSTM長短期記憶模型進行房價預測,以不同的參數組合進行訓練並分析。實驗結果顯示,LSTM長短期記憶模型具有較好的預測結果。在優化器的選擇上,Adam優化函數表現出比SGD或RMSProp擁有更佳的效能。在本有限的實驗中,單層的深度神經網路比多層不同的深度神經網路具有較好的預測結果。
英文摘要
House price in Taipei city is a widely discussed issue. Generally, the price is decided by people’s understanding from past dealing-price. In the past decades, many researchers pay attention on the study of house price prediction by computer computation. Recently, different machine learning models are adopted to analyze the actual price registration dataset for predicting house price.
This study examines linear regression, MLP (Multi-layer perceptron), and LSTM (Long Short-Term Memory) models on prediction of  the actual price registration dataset. Various parameters and combinations are also test in our experiments. Experimental results show that LSTM deep neural network has better prediction than others. In the selection of optimizer, the Adam function exhibits better than SGD or RMSProp functions. In our limited experiments, single-layer deep neural network model leads to better results than different multi-layer deep neural network models.
第三語言摘要
論文目次
第一章、緒論 1
1.1 研究背景 1
1.2 研究動機 1
1.3 研究目的 1
1.4 研究架構 2
第二章、文獻探討 4
2.1 不動產估價 4
2.2 實價登錄 5
2.3 機器學習 6
2.4 深度學習 8
第三章、實驗與研究方法 10
3.1 資料收集 10
3.2 資料預處理(Data preprocessing) 10
3.2.1 價格單位轉換 10
3.2.2 新增屋齡欄位 10
3.2.3 行政區編碼	11
3.2.4 面積單位轉換 11
3.2.5 補齊缺失值	11
3.2.6 去除極端值	11
3.2.7 去除土地、車位交易資料 11
3.2.8 特徵正規化(regularization ) 11
3.3 資料探索 12
3.3.1 隨機取若干筆資料 12
3.3.2 相關性分析	14
3.3.3 觀察各行政區每坪單價 14
3.3.4 面積與總價關係 15
3.3.5 每坪價格與總價的關係 16
3.4 機器學習方法	16
3.5 深度學習方法	17
3.6 建立訓練模型	20
3.6.1 資料切分 20
3.6.2 深度學習訓練超參數設定 21
3.7 模型訓練 22
第四章 、實驗分析與結果 24
4.1 機器學習實驗結果 24
4.1.1 實驗一:簡單線性回歸 24
4.1.2 實驗二:多元線性回歸 25
4.2 深度學習實驗結果 29
4.2.1 實驗三:以優化函數為比較基準	29
4.2.2 實驗四:以單一特徵值預測總價	37
4.2.3 實驗五:以多層次神經網路訓練結果 38
4.2.4 實驗六:納入消費者物價指數(CPI)評估預測模型 39
4.3 本章小結 40
第五章、結論與建議 41
5.1 結論 41
5.2 研究限制 42
5.3 研究建議與方向 42
參考文獻	44
附錄 英文論文 47

圖目錄
圖 2-1機器學習分類 6
圖 2-2監督式學習	7
圖 2-3 Scikit-learn 試用情境參考圖 8
圖 2-4人工智慧、機器學習、深度學習關係圖 9
圖 3-1隨機讀取實價登錄資料 12
圖 3-2各行政區資料筆數 13
圖 3-3相關係數熱圖 14
圖 3-4各行政區每坪平均單價 15
圖 3-5面積與總價散點圖(總價單位:萬元) 15
圖 3-6每坪單價與總價的關係(單位:萬元) 16
圖 3-7 LSTM架構圖 18
圖 3-8 Optimizer 比較圖 20
圖 3-9資料切分示意圖 21
圖 3-10神經網路建構圖 22
圖 3-11研究架構圖 23
圖 3-12研究流程圖 23
圖 4-1簡單線性回歸訓練結果 25
圖 4-2多元線性回歸訓練結果(2 Features) 26
圖 4-3多元線性回歸訓練結果(3 Features) 27
圖 4-4多元線性回歸訓練結果(6 Features) 28
圖 4-5單層LSTM建構模型圖 29
圖 4-6用SGD優化函數下週期100次的Loss Function訓練狀態 30
圖 4-7使用SGD優化函數下週期100次的擬合結果	30
圖 4-8使用SGD優化函數下週期200次的Loss Function訓練狀態 31
圖 4-9使用SGD優化函數下週期200次下的擬合結果 31
圖 4-10使用RMSProp優化函數下週期100次的Loss Function訓練狀態 31
圖 4-11使用RMSProp優化函數下週期100次的擬合結果 32
圖 4-12使用RMSProp優化函數下週期200次的Loss Function 訓練狀態 32
圖 4-13使用RMSProp優化函數下週期200次的擬合結果 32
圖 4-14使用Adam優化函數下週期100次的Loss Function訓練狀態 33
圖 4-15使用Adam優化函數下週期100次的擬合結果 33
圖 4-16使用Adam優化函數下週期200次的Loss Function訓練狀態 34
圖 4-17使用Adam優化函數下週期200次的擬合結果 34
圖 4-18其他相關研究條件下之Loss Function訓練狀態(SGD) 35
圖 4-19其他相關研究條件下的擬合結果(SGD)	36
圖 4-20其他相關研究條件下之Loss Function訓練狀態(Adam) 36
圖 4-21其他相關研究條件下的擬合結果(Adam) 36
圖 4-22單一特徵下的Loss Function訓練狀態 37
圖 4-23單一特徵下的總價擬合結果 37
圖 4-24多層LSTM建構模型圖 38
圖 4-25多層神經網路Loss Function訓練狀態 38
圖 4-26多層LSTM神經網路擬合結果 39
圖 4-27納入消費者物價指數(CPI)擬合結果 39

表目錄
表 3-1 優化函數訓練組合 21
表 4-1 線性回歸模型評估表 28
表 4-2 實驗用硬體配備 29
表 4-3 以優化函數為基準實驗結果 34
參考文獻
[1] 中華民國內政部 (2013),不動產估價技術規則,內政部台內地字第 1020367113 號令修正。
[2] 卓輝華 (2010),不動產估價,五南圖書出版公司。
[3] 花敬群 (2010),電腦大量估價於實物應用之探討,金融聯合徵信月刊第十二期,p.27-p.36.
[4] 內政部地政司 (2012),實價登錄法規Q&A,中華民國內政部
[5] 林大貴 (2017),TensorFlow+Keras深度學習人工智慧實務應用,博碩出版。
[6] 劉立民、吳建華譯 (2018),Python機器學習. 第二版 : 使用Python的scikit-learn和TensorFlow進行機器學習和深度學習,博碩出版。
[7] 謝梁/魯穎/勞虹嵐 (2018),Python深度學習實作:Keras快速上手,博碩出版。
[8] 邱司杰 (2014),基於實價登錄的房價模型研究,碩士論文,國立交通大學。
[9] 黃惠芬 (2017),以類神經網路方法建構房價估價模型-以高雄市實價登錄資料為例,碩士論文,國立高雄應用科技大學。
[10] 陳敬筌 (2019),應用深度學習預測區域住房平均價格-以台北市實價登錄為例,碩士論文,銘傳大學。
[11] S. Hochreiter &J. Schmidhuber (1997), LONG-SHORT-TERM MEMORY,Neural Computation, Vol.9, No.8, p.1735-1780.
[12] Diederik P. Kingma & Jimmy Lei Ba (2015), ADAM: A METHOD FOR STOCHASTIC OPTIMIZATION, 3rd International Conference for Learning Representations, San Diego, 2015.
[13] Sifei Lu & Zengxiang Li & Zheng Qin & Xulei Yang & Rick Siow Mong Goh (2017), A Hybrid Regression Technique for House Prices Prediction, Institute of High Performance Computing, IEEE International Conference on Industrial Engineering and Engineering Management 2017.
[14] Wan Teng Lim & Lipo Wang & Yaoli Wang & Qing Chang (2016), Housing Price Prediction Using Neural Networks, International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery, ICNC-FSKD 2016.
[15] Li Yu & Chenlu Jiao & Hongrun Xin & Yan Wang & Kaiyang Wang (2018), Prediction on Housing Price Based on Deep Learning, International Journal of Computer and Information Engineering, Vol.12, No.2. p.90-99.
[16] Stan Salvador & Philip Chan (2007), FastDTW: Toward Accurate Dynamic Time Warping in Linear Time and Space, Journal Intelligent Data Analysis, Vol.11 Issue 5, p.561-580.
[17] 中華民國內政部實價登錄相關法規
https://land.gov.taipei/cp.aspx?n=7DA1A07FBA752909
[18] Boston Housing
https://www.kaggle.com/c/boston-housing
[19] Scikit-learn official site
https://scikit-learn.org/stable/
[20] Keras official site - Chinese
https://keras.io/zh/
[21] A Beginner's Guide to LSTMs and Recurrent Neural Networks
https://skymind.ai/wiki/lstm
[22] A diagram for a one-unit Long Short-Term Memory (LSTM)
https://commons.wikimedia.org/wiki/File:Long_Short-Term_Memory.svg
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文於授權書繳交後1年公開
校外
同意授權
校外電子論文於授權書繳交後1年公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信