§ 瀏覽學位論文書目資料
  
系統識別號 U0002-1701201813433300
DOI 10.6846/TKU.2018.00466
論文名稱(中文) 應用文字探勘技術於房屋租賃產業之研究
論文名稱(英文) Text Mining Applied on Housing Rental Market
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 管理科學學系碩士班
系所名稱(英文) Master's Program, Department of Management Sciences
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 106
學期 1
出版年 107
研究生(中文) 王得霖
研究生(英文) Tick-Lim Heng
學號 603620666
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2018-01-11
論文頁數 47頁
口試委員 指導教授 - 婁國仁
委員 - 廖啟順
委員 - 吳家齊
關鍵字(中) 房屋租賃
文字探勘
主題模型
關鍵字(英) Housing Rental
Text Mining
Topic Model
第三語言關鍵字
學科別分類
中文摘要
近數十年來,有大量的研究顯示台灣房價不斷的高漲,這對於台灣民眾購屋的負擔已造成嚴峻的考驗。有鑑於此,為了解決台灣民眾居住的問題,政府相繼投入了相當多的資源,甚至是訂立法條來維護民眾的居住正義,其中的一個例子是,中華民國內政部於民國106年4月擬定了「住宅租賃市場發展條例草案」,務求能夠透過此條例活化房屋租賃市場,屆時房屋租賃產業將因此法條而得到有利的推動。

    然而在房屋租賃市場相關的研究上,目前多數的研究多為問卷調查或電話訪談,鮮少有非介入性的研究,在此背景下,本研究透過文字探勘技術從消費者所發的大量房屋租賃相關文章中,找出在房屋租賃產業裡消費者所面對的議題,以降低研究過程中人為因素的干擾,以期房屋租賃公司未來在策略的擬定上能有多一個借鑒。

    本研究根據Blei等學者(Blei, Ng & Jordan, 2003)所提出的Latent Dirichlet Allocation主題模型為主要的研究工具,並從3794個文本中找出了300個主題。經過本研究進行命題後,得217個有意義的主題,其中重複率佔前10的議題為契約(11.47%)、押金(4.59%)、價格(3.21%)、水電費(3.21%)、房屋格局(3.21%)、租屋糾紛(3.21%)、吵鬧(2.75%)、合租(2.29%)、溝通(2.29%)、房東態度(2.29%)。
英文摘要
In the past few decades, a large number of studies demonstrated Taiwan commercial houses price level tends to rise rapidly. Therefore, in order to solve this issue, government of R.O.C. put a lot of resource in related policy, and even legislate new law to protect the right of residential. In April, 2017, R.O.C. Executive Yuan proposed the draft of「Residential leasing market development regulations」to Legislate Yuan, this means once the act registered, housing rental market will be motivated at once.

        However, as of today, most of the research related to this field were composed with quantitative research, those research were constructed with structured questionnaire, but seldom to seek information with non-interventional. Therefore, this research aim on the articles posted by housing rental consumer, and applied Text Mining technique to those articles to figure out which problem consumer facing. Through this technique, it was able to decrease the intervention of data collecting.

       The foundation of this research was structured by Latent Dirichlet Allocation, which published by Blei et al. (Blei, Ng & Jordan, 2003). The results analysis with 3794 articles with 300 topics deducted meaningless topics obtained 217 topics show that, top 10 repeated topic are show by the following, contract (11.47%), deposit (4.59%), pricing (3.21%), utilities expense (3.21%), housing pattern (3.21%),  rental dispute (3.21%), hubbub (2.75%), co-renting (2.29%), communication (2.29%), landlord manner (2.29%)
第三語言摘要
論文目次
目錄
目錄………………………………………………………………………..I
表目錄……………………………………………………………………III
圖目錄…………………………………………………………………….IV
第一章 緒論……………………………………………………………….1
	1.1研究背景………………………………………………….…1
	1.2研究目的…………………………………………………….3
	1.3研究流程…………………………………………………….3
第二章 文獻探討………………………………………………………….5
	2.1台灣住宅租賃產業概述…………………………………….5
	2.2住宅租賃市場發展條例草案之概述……………………….7
		2.2.1住宅租賃市場發展條例草案擬定原因……….9
		2.2.2住宅租賃市場發展條例草案擬定的預期效益10
	2.3文字探勘技術之概述……………………………………..11
第三章 研究方法………………………………………………………..13
	3.1研究架構設計….………………………………………….13
	3.2批踢踢實業坊概述…………………………………………16
	3.3 R語言概述…………………………………………………16
	3.4中文斷詞概述….………………………………………….17
	3.5 LDA主題模型原理概述……………………………………18
第四章 資料分析與結果………………………………………………..21
	4.1系統環境配置………………………………………………21
	4.2資料處理結果與主題數設定………………………………21
	4.3資料分析結果與命題………………………………………28
	4.4主題之命題分配……………………………………………39
第五章 結論與建議………………………………………………………42
	5.1實證結果分析與管理議題建議……………………………42
	5.2研究限制……………………………………………………43
	5.3未來研究方向………………………………………………44
參考文獻………………………………………………………………….45

表目錄
表2-1住宅租賃發展條例草案擬定後的預期效益………………………11
表4-1本研究所使用之相關配件…………………………………………21
表4-2租屋議題關鍵字……………………………………………………22
表4-3租屋議題關鍵字整併表……………………………………………22
表4-4本研究所使用之停用詞……………………………………………23
表4-5資料分析之結果……………………………………………………28
表4-6主題命題之項目單位表……………………………………………40

圖目錄
圖1-1全國房價所得必趨勢圖…………………………………………….1
圖1-2全國貸款負擔率趨勢圖…………………………………………….2
圖2-1租賃住宅不足之市場成因………………………………………….7
圖2-2文字探勘流程………………………………………………………12
圖3-1研究架構圖…………………………………………………………15
圖3-2 LDA主題模型架構圖………………………………………………19
圖4-1各主題數經10折交叉驗證後之帄均混餚度曲線圖………………28
圖4-2主題命題之百分比分配圓餅圖……………………………………41
參考文獻
參考文獻
一、中文文獻:

內政部(2017)。內政部營建署發布106年度第2季房價負擔能力指標統計成果。取自:http://pip.moi.gov.tw/V2/E/SCRE0105.aspx

內政部(2017)。住宅租賃市場發展條例草案總說明。內政部2017年2月7日公佈。

內政部(2017)。租賃專法保障權益避免糾紛了解租賃住宅市場發展條例。取自:https://goo.gl/7VVXfP

中文詞知識庫小組(無日期)。具有新詞辨識能力的斷詞系統。取自:http://ckip.iis.sinica.edu.tw/CKIP/wordsegment.htm

中華民國住宅學會(2016)。住宅需求動向調查。內政部營建署委託之專題研究成果報告(編號:第十四卷第二期)。內政部不動產資訊平台。

何友鋒、賴碧瑩(2010)。不動產租賃服務產業發展與推動策略。內政部委託之專題研究成果報告(編號:PG9902-0283)。內政部不動產資訊平台。

李志豪(2008)。以基因規劃法為基礎的中文斷詞模型(碩士論文)。取自台灣博碩士論文知識價值系統。(系統編號097HCU08396009)

李家如(2017)。產業分析:不動產經營及相關服務業(2017年)。取自:http://www.twtrend.com/share_cont.php?id=55

陳景祥(2014)。R軟體:應用統計方法,東華書局。

文化研究學會(2010)。批踢踢,踢中文化生產的小腿骨-學術生產中的Ptt現象。文化研究月報,109,188-207。

華昌宜、賴碧瑩(2001)。我國租賃住宅市場之發展與推動。住宅學報, 10(1), 67-76。


潘姿羽(2017)。租賃專法挹注GDP 920億。經濟日報。2017年5月18日,取自:https://udn.com/news/story/7238/2469569

GNU 作業系統(無日期)。自由軟體是什麼?取自:http://www.gnu.org/

二、英文文獻:

Blei, D. M. Ng, A. Y. & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), (pp. 993-1022).

Griffiths, T. L., & Steyvers, M. (2004). Finding scientific topics. Proceedings of the National academy of Sciences, 101(suppl 1), 5228-5235.

Hofmann, T. (1999). Probabilistic latent semantic analysis. In Proceedings of the Fifteenth conference on Uncertainty in artificial intelligence (pp. 289-296). Morgan Kaufmann Publishers Inc.

Kao, A., & Poteet, S.R. (2007). Natural Language Processing and Text Mining. Springer-Verlag London.

Losiewicz, P., Oard, D. W., & Kostoff, R. N. (2000). Textual data mining to support science and technology management. Journal of Intelligent Information Systems, 15(2), 99-119

Maskeri, G., Sarkar, S., & Heafield, K. (2008). Mining business topics in source code using latent dirichlet allocation. In Proceedings of the 1st India software engineering conference(pp. 113-120). ACM.

Sullivan, D. (2001). Document warehousing and text mining: techniques for improving business operations, marketing, and sales. John Wiley & Sons, Inc.

The R Project for Statistical Computing. (n.d.). What is R?. Retrieved October 1, 2017, From the World Wide Web: https://www.r-project.org/about.html

Wikipedia. (n.d.). Latent Dirichlet allocation. Retrieved October 1, 2017, From the World Wide Web: https://en.wikipedia.org/wiki/Latent_Dirichlet_allocation.
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信