§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0208202522182700
DOI 10.6846/tku202500645
論文名稱(中文) 旅遊照片之降維維度與分群效能之探討
論文名稱(英文) A Study on the Dimensions and Clustering Effectiveness of Tourist Photos
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊管理學系碩士班
系所名稱(英文) Department of Information Management
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 113
學期 2
出版年 114
研究生(中文) 許又蓁
研究生(英文) Yu-Chen Hsu
學號 612630284
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2025-06-14
論文頁數 45頁
口試委員 指導教授 - 周清江(cjou@mail.tku.edu.tw)
口試委員 - 溫演福
口試委員 - 張昭憲
口試委員 - 周清江
關鍵字(中) 旅遊影像
深度學習
影像分群
關鍵字(英) Travel Images
Deep Learning
Image Clustering
第三語言關鍵字
學科別分類
中文摘要
隨著社群媒體與影像分享平台的興起,使用者生成的旅遊影像已成為影響旅遊決策的重要因素。然而,龐大的影像資料容易導致資訊過載。如何有效分類這些影像,並取得所需資訊將是一大挑戰。過去研究多透過深度學習提取影像特徵進行分析,但較少探討不同維度對影像分群效能的影響。
本研究針對北台灣的九份與野柳兩個旅遊景點,並聚焦於外國遊客的視角,希望有助促進國際觀光產業發展。我們參考過去研究,使用VGG16模型提取影像特徵,並透過 t-SNE 降維至 2、3、4、8 維,再以 HDBSCAN 進行影像分群。本研究補足過去僅探討 2D 降維的不足,並比較不同降維維度對影像分群的影響,為旅遊影像分群與推薦系統提供參考。
英文摘要
With the rise of social media and image-sharing platforms, user-generated travel images have become a key factor influencing travel decisions. However, the overwhelming volume of visual data lead to information overload. How to effectively classify these images and retrieving relevant information poses a significant challenge. While previous studies have often used deep learning to extract image features for analysis, few have explored how different dimensionalities affect the performance of image clustering.
    This study focuses on two tourist attractions in northern Taiwan—Jiufen and Yeliu—from the perspective of international tourists, aiming to promote the development of the global tourism industry. Using similar frameworks from previous research, the VGG16 model is used to extract image features, which are then reduced to 2, 3, 4, and 8 dimensions using t-SNE. HDBSCAN is subsequently applied for image clustering. By examining multiple dimensionalities, this research addresses the limitations of previous studies that primarily focused on 2D reduction and provides insights into how dimensionality impacts image clustering performance. The findings could provide reference for image-based travel recommendation systems.
第三語言摘要
論文目次
目錄
第一章、緒論	1
1.1、研究背景	1
1.2、研究動機	4
1.3、研究目的	4
第二章、文獻探討	5
2.1、使用者生成內容(UGC)對旅遊決策的影響	5
2.2、旅遊照片分類論文	6
2.3、降維技術	7
2.4、分群	8
2.5、分群評估指標	10
第三章、研究方法	13
3.1、資料收集	13
3.2、影像特徵提取	15
3.3、降維	16
3.4、分群	18
第四章、研究結果	22
4.1、實驗環境與參數	22
4.2、影像資料收集	24
4.3、九份	24
4.4、野柳	33
4.5、實驗結果	39
4.6、研究限制	41
第五章、結論	42
參考文獻	45
 
表目錄
表 1 歷年來台旅客統計	2
表 2  FLICKR照片檔名之後綴說明	14
表 3 原始影像與對應的特徵向量	16
表 4 九份不同PERPLEXITY可視化結果(以2維為例)	17
表 5 野柳不同PERPLEXITY可視化結果(以2維為例)	18
表 6 決定最終分群參數(以野柳3維為例)	21
表 7 決定最終分群參數(以九份2維為例)	21
表 8 決定最終分群參數(以九份8維為例)	21
表 9 九份各維度困惑度參數及其KL值	22
表 10 野柳各維度困惑度參數及其KL值	23
表 11 九份在不同維度使用的分群參數	23
表 12 野柳在不同維度使用的分群參數	23
表 13 收集影像各尺寸張數	24
表 14 九份各維度HDBSCAN產生結果	25
表 15 九份各維度手動調整結果	26
表 16 九份2維人工審查後部分類別代表性照片	28
表 17 九份3維降維各群代表性照片	29
表 18 九份4維降維各群代表性照片	31
表 19 野柳各維度HDBSCAN產生結果	33
表 20 野柳各維度手動調整結果	35
表 21 野柳2維人工審查後部分類別代表性照片	36
表 22 野柳3維各群的代表性照片	37
表 23 野柳8維各群的代表性照片	38
 
圖目錄
圖 1 旅遊資訊參考管道(資料來源:創世紀週刊)	2
圖 2 旅遊資訊參考管道-網路管道(資料來源:創世紀週刊)	3
圖 3 本研究系統架構圖	13
圖 4 HDBSCAN分群參數決定流程	19
圖 5 九份3維群集4(左),群集14(右)的範例照片	27
圖 6 九份3維群集8(左),群集9(右)的範例照片	27
圖 7 九份8維群集0-茶樓主建築與群集3-茶樓側面的範例照片	27
圖 8 無相關性照片群集(以群集39部分照片為例)	35
圖 9 野柳2維女王頭各群集照片(由左至右分別為群集2、22、23)	35
圖 10 野柳2維蕈狀岩各群集照片(由左至右分別為群集5、16、20、21)	35
圖 11 野柳2維龜頭山各群集照片(由左至右分別為群集28、31)	35
參考文獻
[1]于曉茹. (2019). 社群媒體對台灣自助旅遊群體的影響與應用. 臺灣師範大學高階經理人企業管理碩士在職專班 (EMBA) 學位論文, 頁 1-76.
[2]金茶園.(2019). 用戶生成內容與觀賞者評論對韓國遊客來臺旅遊意願之影響. 臺灣博碩士論文知識加值系統,世新大學碩士論文.
[3] Arora, S., Hu, W., & Kothari, P. K. (2018). An analysis of the t-SNE algorithm for data visualization. In Conference on learning theory, pp. 1455-1462.
[4] Belkina, A. C., Ciccolella, C. O., Anno, R., Halpert, R., Spidlen, J., & Snyder-Cappione, J. E. (2019). Automated optimized parameters for T-distributed stochastic neighbor embedding improve visualization and analysis of large datasets. Nature communications, 10(1), p. 5415.
[5] Campello, R. J., Moulavi, D., & Sander, J. (2013). Density-based clustering based on hierarchical density estimates. In Pacific-Asia conference on knowledge discovery and data mining, pp. 160-172.
[6] Ester, M., Kriegel, H. P., Sander, J., & Xu, X. (1996). A density-based algorithm for discovering clusters in large spatial databases with noise. In Proceedings of the Second International Conference on Knowledge Discovery and Data Mining Vol. 96., pp. 226-231.
[7] Hinton, G. E., & Roweis, S. (2002). Stochastic Neighbor Embedding. Advances in neural information processing systems, 15, pp. 857-864.
[8] Kang, Y., Cho, N., Yoon, J., Park, S., & Kim, J. (2021). Transfer learning of a deep learning model for exploring tourists’ urban image using geotagged photos. ISPRS International Journal of Geo-Information, 10(3), p.137.(https://doi.org/10.3390/ijgi10030137)
[9] Kim, J., & Kang, Y. (2022). Automatic classification of photos by tourist attractions using deep learning model and image feature vector clustering. ISPRS International Journal of Geo-Information, 11(4), p. 245.( https://doi.org/10.3390/ijgi11040245)
[10] Kodinariya, T. M., & Makwana, P. R. (2013). Review on determining number of Cluster in K-Means Clustering. International Journal, 1(6), pp. 90-95.
[11] McInnes, L., Healy, J., & Melville, J. (2018). Umap: Uniform manifold approximation and projection for dimension reduction. arXiv preprint arXiv:1802.03426.
[12] Paradise-Vit, A., Elyashar, A., & Aronson, Y. (2024). Automated photo filtering for tourism domain using deep and active learning: the case of Israeli and worldwide cities on instagram. Information Technology & Tourism, 26(3), pp. 553-582.
[13] Ponti, M., Kittler, J., Riva, M., de Campos, T., & Zor, C. (2017). A decision cognizant Kullback–Leibler divergence. Pattern Recognition, 61, pp. 470-478.
[14] Rousseeuw, P. J. (1987). Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics, 20, pp. 53-65.
[15] Simonyan, K., & Zisserman, A. (2015). Very deep convolutional networks for large-scale image recognition. 3rd International Conference on Learning Representations (ICLR 2015), pp. 1-14.
[16] Stewart, G., & Al-Khassaweneh, M. (2022). An implementation of the HDBSCAN* clustering algorithm. Applied Sciences (Switzerland), 12(5), pp. 1-21.
[17] Van der Maaten, L., & Hinton, G. (2008). Visualizing data using t-SNE. Journal of Machine Learning Research, 9, pp. 2579-2605.
[18] Wang, X., & Xu, Y. (2019). An improved index for clustering validation based on Silhouette index and Calinski-Harabasz index. In IOP Conference Series: Materials Science and Engineering. Vol. 569, IOP Publishing, p. 052024.( DOI: 10.1088/1757-899X/569/5/052024)
論文全文使用權限
國家圖書館
同意無償授權國家圖書館,書目與全文電子檔於繳交授權書後, 於網際網路立即公開
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權予資料庫廠商
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信