| 系統識別號 | U0002-0208202522182700 |
|---|---|
| DOI | 10.6846/tku202500645 |
| 論文名稱(中文) | 旅遊照片之降維維度與分群效能之探討 |
| 論文名稱(英文) | A Study on the Dimensions and Clustering Effectiveness of Tourist Photos |
| 第三語言論文名稱 | |
| 校院名稱 | 淡江大學 |
| 系所名稱(中文) | 資訊管理學系碩士班 |
| 系所名稱(英文) | Department of Information Management |
| 外國學位學校名稱 | |
| 外國學位學院名稱 | |
| 外國學位研究所名稱 | |
| 學年度 | 113 |
| 學期 | 2 |
| 出版年 | 114 |
| 研究生(中文) | 許又蓁 |
| 研究生(英文) | Yu-Chen Hsu |
| 學號 | 612630284 |
| 學位類別 | 碩士 |
| 語言別 | 繁體中文 |
| 第二語言別 | |
| 口試日期 | 2025-06-14 |
| 論文頁數 | 45頁 |
| 口試委員 |
指導教授
-
周清江(cjou@mail.tku.edu.tw)
口試委員 - 溫演福 口試委員 - 張昭憲 口試委員 - 周清江 |
| 關鍵字(中) |
旅遊影像 深度學習 影像分群 |
| 關鍵字(英) |
Travel Images Deep Learning Image Clustering |
| 第三語言關鍵字 | |
| 學科別分類 | |
| 中文摘要 |
隨著社群媒體與影像分享平台的興起,使用者生成的旅遊影像已成為影響旅遊決策的重要因素。然而,龐大的影像資料容易導致資訊過載。如何有效分類這些影像,並取得所需資訊將是一大挑戰。過去研究多透過深度學習提取影像特徵進行分析,但較少探討不同維度對影像分群效能的影響。 本研究針對北台灣的九份與野柳兩個旅遊景點,並聚焦於外國遊客的視角,希望有助促進國際觀光產業發展。我們參考過去研究,使用VGG16模型提取影像特徵,並透過 t-SNE 降維至 2、3、4、8 維,再以 HDBSCAN 進行影像分群。本研究補足過去僅探討 2D 降維的不足,並比較不同降維維度對影像分群的影響,為旅遊影像分群與推薦系統提供參考。 |
| 英文摘要 |
With the rise of social media and image-sharing platforms, user-generated travel images have become a key factor influencing travel decisions. However, the overwhelming volume of visual data lead to information overload. How to effectively classify these images and retrieving relevant information poses a significant challenge. While previous studies have often used deep learning to extract image features for analysis, few have explored how different dimensionalities affect the performance of image clustering.
This study focuses on two tourist attractions in northern Taiwan—Jiufen and Yeliu—from the perspective of international tourists, aiming to promote the development of the global tourism industry. Using similar frameworks from previous research, the VGG16 model is used to extract image features, which are then reduced to 2, 3, 4, and 8 dimensions using t-SNE. HDBSCAN is subsequently applied for image clustering. By examining multiple dimensionalities, this research addresses the limitations of previous studies that primarily focused on 2D reduction and provides insights into how dimensionality impacts image clustering performance. The findings could provide reference for image-based travel recommendation systems.
|
| 第三語言摘要 | |
| 論文目次 |
目錄 第一章、緒論 1 1.1、研究背景 1 1.2、研究動機 4 1.3、研究目的 4 第二章、文獻探討 5 2.1、使用者生成內容(UGC)對旅遊決策的影響 5 2.2、旅遊照片分類論文 6 2.3、降維技術 7 2.4、分群 8 2.5、分群評估指標 10 第三章、研究方法 13 3.1、資料收集 13 3.2、影像特徵提取 15 3.3、降維 16 3.4、分群 18 第四章、研究結果 22 4.1、實驗環境與參數 22 4.2、影像資料收集 24 4.3、九份 24 4.4、野柳 33 4.5、實驗結果 39 4.6、研究限制 41 第五章、結論 42 參考文獻 45 表目錄 表 1 歷年來台旅客統計 2 表 2 FLICKR照片檔名之後綴說明 14 表 3 原始影像與對應的特徵向量 16 表 4 九份不同PERPLEXITY可視化結果(以2維為例) 17 表 5 野柳不同PERPLEXITY可視化結果(以2維為例) 18 表 6 決定最終分群參數(以野柳3維為例) 21 表 7 決定最終分群參數(以九份2維為例) 21 表 8 決定最終分群參數(以九份8維為例) 21 表 9 九份各維度困惑度參數及其KL值 22 表 10 野柳各維度困惑度參數及其KL值 23 表 11 九份在不同維度使用的分群參數 23 表 12 野柳在不同維度使用的分群參數 23 表 13 收集影像各尺寸張數 24 表 14 九份各維度HDBSCAN產生結果 25 表 15 九份各維度手動調整結果 26 表 16 九份2維人工審查後部分類別代表性照片 28 表 17 九份3維降維各群代表性照片 29 表 18 九份4維降維各群代表性照片 31 表 19 野柳各維度HDBSCAN產生結果 33 表 20 野柳各維度手動調整結果 35 表 21 野柳2維人工審查後部分類別代表性照片 36 表 22 野柳3維各群的代表性照片 37 表 23 野柳8維各群的代表性照片 38 圖目錄 圖 1 旅遊資訊參考管道(資料來源:創世紀週刊) 2 圖 2 旅遊資訊參考管道-網路管道(資料來源:創世紀週刊) 3 圖 3 本研究系統架構圖 13 圖 4 HDBSCAN分群參數決定流程 19 圖 5 九份3維群集4(左),群集14(右)的範例照片 27 圖 6 九份3維群集8(左),群集9(右)的範例照片 27 圖 7 九份8維群集0-茶樓主建築與群集3-茶樓側面的範例照片 27 圖 8 無相關性照片群集(以群集39部分照片為例) 35 圖 9 野柳2維女王頭各群集照片(由左至右分別為群集2、22、23) 35 圖 10 野柳2維蕈狀岩各群集照片(由左至右分別為群集5、16、20、21) 35 圖 11 野柳2維龜頭山各群集照片(由左至右分別為群集28、31) 35 |
| 參考文獻 |
[1]于曉茹. (2019). 社群媒體對台灣自助旅遊群體的影響與應用. 臺灣師範大學高階經理人企業管理碩士在職專班 (EMBA) 學位論文, 頁 1-76. [2]金茶園.(2019). 用戶生成內容與觀賞者評論對韓國遊客來臺旅遊意願之影響. 臺灣博碩士論文知識加值系統,世新大學碩士論文. [3] Arora, S., Hu, W., & Kothari, P. K. (2018). An analysis of the t-SNE algorithm for data visualization. In Conference on learning theory, pp. 1455-1462. [4] Belkina, A. C., Ciccolella, C. O., Anno, R., Halpert, R., Spidlen, J., & Snyder-Cappione, J. E. (2019). Automated optimized parameters for T-distributed stochastic neighbor embedding improve visualization and analysis of large datasets. Nature communications, 10(1), p. 5415. [5] Campello, R. J., Moulavi, D., & Sander, J. (2013). Density-based clustering based on hierarchical density estimates. In Pacific-Asia conference on knowledge discovery and data mining, pp. 160-172. [6] Ester, M., Kriegel, H. P., Sander, J., & Xu, X. (1996). A density-based algorithm for discovering clusters in large spatial databases with noise. In Proceedings of the Second International Conference on Knowledge Discovery and Data Mining Vol. 96., pp. 226-231. [7] Hinton, G. E., & Roweis, S. (2002). Stochastic Neighbor Embedding. Advances in neural information processing systems, 15, pp. 857-864. [8] Kang, Y., Cho, N., Yoon, J., Park, S., & Kim, J. (2021). Transfer learning of a deep learning model for exploring tourists’ urban image using geotagged photos. ISPRS International Journal of Geo-Information, 10(3), p.137.(https://doi.org/10.3390/ijgi10030137) [9] Kim, J., & Kang, Y. (2022). Automatic classification of photos by tourist attractions using deep learning model and image feature vector clustering. ISPRS International Journal of Geo-Information, 11(4), p. 245.( https://doi.org/10.3390/ijgi11040245) [10] Kodinariya, T. M., & Makwana, P. R. (2013). Review on determining number of Cluster in K-Means Clustering. International Journal, 1(6), pp. 90-95. [11] McInnes, L., Healy, J., & Melville, J. (2018). Umap: Uniform manifold approximation and projection for dimension reduction. arXiv preprint arXiv:1802.03426. [12] Paradise-Vit, A., Elyashar, A., & Aronson, Y. (2024). Automated photo filtering for tourism domain using deep and active learning: the case of Israeli and worldwide cities on instagram. Information Technology & Tourism, 26(3), pp. 553-582. [13] Ponti, M., Kittler, J., Riva, M., de Campos, T., & Zor, C. (2017). A decision cognizant Kullback–Leibler divergence. Pattern Recognition, 61, pp. 470-478. [14] Rousseeuw, P. J. (1987). Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics, 20, pp. 53-65. [15] Simonyan, K., & Zisserman, A. (2015). Very deep convolutional networks for large-scale image recognition. 3rd International Conference on Learning Representations (ICLR 2015), pp. 1-14. [16] Stewart, G., & Al-Khassaweneh, M. (2022). An implementation of the HDBSCAN* clustering algorithm. Applied Sciences (Switzerland), 12(5), pp. 1-21. [17] Van der Maaten, L., & Hinton, G. (2008). Visualizing data using t-SNE. Journal of Machine Learning Research, 9, pp. 2579-2605. [18] Wang, X., & Xu, Y. (2019). An improved index for clustering validation based on Silhouette index and Calinski-Harabasz index. In IOP Conference Series: Materials Science and Engineering. Vol. 569, IOP Publishing, p. 052024.( DOI: 10.1088/1757-899X/569/5/052024) |
| 論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信