系統識別號 | U0002-0803201812495100 |
---|---|
DOI | 10.6846/TKU.2018.00246 |
論文名稱(中文) | 比較分群法處理個體選擇模式中個體偏好差異之研究 |
論文名稱(英文) | Taste Variation in Disaggregate Choice Model:A Comparative Study of User Segmentation Techniques |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 運輸管理學系運輸科學碩士班 |
系所名稱(英文) | Department of Transportation Management |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 106 |
學期 | 1 |
出版年 | 107 |
研究生(中文) | 許峰銓 |
研究生(英文) | Feng-Chuan Hsu |
學號 | 605660025 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2018-01-20 |
論文頁數 | 139頁 |
口試委員 |
指導教授
-
董啟崇(cctong@mail.tku.edu.tw)
委員 - 石豐宇(ofshyr@mail.ncku.edu.tw) 委員 - 顏進儒(jryen@mail.ntou.edu.tw) |
關鍵字(中) |
偏好差異 分群法 市場區隔法 羅吉特模式 K-means 隨機森林 潛在類別模式 國道五號 運具移轉 |
關鍵字(英) |
Taste Variation User Segmentation Techniques Market Segmentation Logit Model K-means Random Forests Latent Class Model National Free Way No.5 Modal Transfer |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
進行旅運行為分析時,常使用市場區隔法將旅程決策者分群處理,其目的在於將性質相近的決策者歸為同一類,藉由分類的方式區分屬於不同分群的資料間之差異,使得屬於同一分群的決策者有較高的同質性,並且跟隸屬其他分群者有較多差異,此即市場區隔。建立市場區隔時需要使用到若干分群方法,包括由分析者根據先驗知識主觀假設不同群間之差異,也可藉由數學或統計方法之演算得出分群結果,本研究將選擇三種不同分群方法之分群結果予以比較分析,並根據分群結果建立之個體選擇模式進行討論。 本研究以國道五號小客車使用者為研究對象,分別藉由面訪與網路問卷蒐集,探討其運具移轉行為資料,運用三個分別具有不同特色之分群方法,包括K-means、隨機森林以及潛在類別模式進行分群,比較分群結果特徵與行為差異。研究結果顯示即使三個分群方法之最適分群數不盡相同,但影響分群效果之變數大致相同,其中18-29歲之學生與年輕族群和其他族群具有明顯區隔,且18-29歲族群在充分理解大眾運輸服務場站與路網資訊條件下,願意轉移至大眾運輸工具之比例較其他族群高。 本研究係以隨機抽取80%之觀察資料根據分群結果分別建立個別群組之羅吉特模式,其中另以旅程出發地分別建立不限出發地模式與北北基桃模式兩組模式;參數校估後之檢定結果顯示分群模式與不分群模式有顯著差異,且分群模式中變數之顯著程度與不分群模式確有不同;而比較不同兩組分群模式內部子群模式之參數亦有顯著差異,顯示市場區隔具有分群之效果。另外,相較於不限出發地模式,北北基桃模式之分群模式內部具顯著差異之變數更多。 模式參數校估結果亦顯示非年輕族群與出發地非位於雙北、基隆、桃園之受訪者對於小客車容易有起始之偏好;家中可用車輛數越多或與家人同行亦會降低移轉至大眾運輸意願;降低使用大眾運輸所需花費的時間,包含進入國道五號前、行駛於國道五號上及離開國道五號後三段時間皆可提升受訪者移轉至大眾運輸之意願;其中針對移轉意願較高之年輕族群又可透過降低國道客運票價進一步提升其意願。本研究最後以未參與模式構建之剩餘20%資料進行模式驗證以作為模式預測能力之比較,結果顯示不限出發地模式中,K-means分群方法之平均預測正確率約與不分群模式相等,但隨機森林與潛在類別分群方法則皆高於不分群模式;北北基桃模式中則是隨機森林分群方法之平均預測正確率略低於不分群模式,K-means與潛在類別模式分群方法則皆高於不分群模式。 歸納三個分群方法之特徵區分能力、運具移轉意願比例之差異、不限出發地模式與北北基桃模式之分群模式內部具顯著差異參數個數、分群模式自我驗證平均正確率及分群模式預測平均正確率,本研究認為以潛在類別模式與隨機森林分群較優於K-means分群法。 |
英文摘要 |
The market segmentation method is often used to distinguish and model various groups of decision makers implementing trip decisions. The purpose of user segmentation is to classify decision makers of similar nature into the same group, such that the trip makers who belong to the same group have higher homogeneity within the same group but with more differences among other groups. This process of user segmentation is also referred to as market segmentation. To implement the user segmentation, we need to use the market segmentation techniques. The segmentation techniques can be based on prior knowledge of the analyst under the assumption of differences between different groups, or applying mathematical/statistical methods. Unlike the past study using user segmentation techniques mainly to improve model accuracy, in this study, we focused on the grouping results of different user segmentation technique on both the mode choice/switch behavior and the associated disaggregate choice models. The passenger car users of National Freeway No. 5 were selected as our demonstrate research subjects on their mode choice behavior. Three user segmentation techniques were implemented, including K-means, Random Forest and Latent Class Model. The results showed that the outcomes of grouping via the three methods were different, but the variables with grouping effect were consistent, which showed students and young people who aged 18-29 are generally distinct from other groups. In addition, such group with higher information awareness to the information of public transportation service stations and road networks, showed higher the proportion of willingness to transfer to public transport than that of others groups. Besides the grouping results, we investigated the mode choice modeling effect in the commonly used Logit model where 80% of the data were randomly selected from the sample data for model estimation and 20% for prediction. Two models were further specified by two bases, named as “departure-unrestricted model” and “departure–restricted model” respectively, depending on the trip departure location for each user group. Estimation results showed the significant effect of the user segmentation. In addition, departure–restricted model had more significance variables than that with departure-unrestricted model. Further, the calibration results show that non-young groups and those whose departure locations being not from Keelung, New Taipei City, Taipei and Taoyuan were more likely to have higher preference for passenger cars, and the more the number of cars available or travelling with family members will reduced their willingness to transfer to public transit. Reducing the time spent on public transit, includes three sections, before entering National Freeway No. 5, traveling on National Freeway No. 5 and after leaving National Freeway No. 5, will increase the respondents’ willingness to transfer to public transit. Besides, the young groups with higher potential to transfer to can further enhance their willingness by reducing the price of Freeway Schedule Bus Service. Finally, the model verification were carried out with the remaining 20% of the data which weren’t used to calibrate the models. The results showed that the average prediction rate of the K-means-grouping models was approximately equal to that of the pooled model in the departure-unrestricted model, while the Random Forests-grouping models and the Latent Class Model models were both higher than the pooled model. In the departure-restricted model, the average prediction rate of the Random Forests-grouping models was about 2% lower than pooled model, while the K-means-grouping models and the Latent Class Model models were both higher than the pooled model. As demonstrated by the findings of this study, comparing the difference of the transfer willingness ratio, the number of parameters with significant differences within the grouping-models, and the self-verification of average right of prediction rate, and average prediction switching rate, Random Forests and Latent Class Model performed better than K-means in this study. |
第三語言摘要 | |
論文目次 |
目錄 第一章 緒論 1 1.1 研究動機 1 1.2 研究目的 2 1.3 研究範圍 3 1.4 研究內容與流程 3 第二章 文獻回顧 6 2.1 偏好差異(Taste variation)與其處理方法 6 2.1.1 K-means 7 2.1.2 隨機森林 8 2.1.3 潛在類別模式 10 2.1.4 隨機係數法 11 2.2 國道五號相關文獻 12 2.3 小結 14 第三章 研究方法 16 3.1 分群方法 16 3.1.1 K-means 16 3.1.2 隨機森林 17 3.1.3 潛在類別模式 19 3.2 模式建構與分析 21 3.3 問卷設計與分析 24 3.3.1 調查目的 24 3.3.2 調查方式與對象 24 3.3.3 問卷內容與結構形式 25 3.3.4 問卷分析方式 29 第四章問卷結果分析 33 4.1 調查結果與樣本分析 33 4.2 問卷合併可能分析 41 4.2.1 社經特性趨勢分析 42 4.2.2 行程特性趨勢分析 44 4.3 K-means分群 45 4.4 隨機森林分群 50 4.5 潛在類別模式分群 54 4.6 各分群於方案選擇之差異 57 4.7 分群結果重疊性比較 60 4.8 分群結果小結 72 第五章 模式建構分析與比較 73 5.1 模式建構流程與效用函數說明 73 5.1.1 模式建構流程說明 73 5.1.2 效用函數說明 74 5.2 模式參數校估 76 5.2.1 不限出發地模式參數校估 76 5.2.2 北北基桃模式參數校估 83 5.3 模式比較 89 5.3.1 分群模式是否顯著與不分群模式有顯著差異 89 5.3.2 各模式內部參數差異檢定 90 5.4 預測能力比較 96 第六章 結論與建議 98 6.1 結論 98 6.2 建議 100 參考文獻 102 附錄A-不限出發地模式之參數差異檢定結果 107 附錄B-北北基桃模式之參數差異檢定結果 113 附錄C-問卷 119 圖目錄 圖1.4.1研究流程圖 5 圖3.3.1蘭陽地區假日景點接駁公車資訊 28 圖4.2.1三個問卷來源之受訪者於最佳方案選擇大眾運輸工具 比例趨勢圖-以年齡區分 42 圖4.2.2三個問卷來源之受訪者於最佳方案選擇大眾運輸工具 比例趨勢圖-以每周大眾運輸工具使用天數區分 43 圖4.2.3三個問卷來源之受訪者於最佳方案選擇大眾運輸工具 44 圖4.2.4三個問卷來源之受訪者於最佳方案選擇大眾運輸工具 比例趨勢圖-以同型阻礙得點區分 44 圖4.4.1隨機森林決策樹數量與模型誤差關係圖 51 圖4.7.1 K-means與隨機森林分群重疊分析圖 60 圖4.7.2 隨機森林對應潛在類別模式分群重疊分析圖 65 圖4.7.3潛在類別模式對應隨機森林分群重疊分析圖 66 圖4.7.6以K-means為基礎對應隨機森林與潛在類別模式之重疊分析圖 71 圖5.1.1模式建構流程圖 74 表目錄 表3.3-1現況資訊揭露之國道客運服務路線與票價 (以板橋轉運站路線為例) 27 表3.3-2敘述性偏好情境設計 28 表3.3-3問卷設計結構表 29 表4.1-1問卷樣本性別分布 34 表4.1-2問卷樣本年齡分布 34 表4.1-3問卷樣本教育程度分布圖 34 表4.1-4問卷樣本職業分布 35 表4.1-5本研究資料與運研所資料之社經特徵分布 35 表4.1-6受訪者同行人數統計表 36 表4.1-7受訪者與同行人關係統計表 36 表4.1-8受訪者旅遊行程天數統計表 37 表4.1-9受訪者使用或考慮使用大眾運輸原因 37 表4.1-10受訪者未選擇大眾運輸工具原因統計 38 表4.1-11受訪者對大眾運輸之印象分數 39 表4.3-1主成份分析旋轉矩陣 45 表4.3-2華德法凝聚過程表 46 表4.3-3 K-means分群迭代過程 46 表4.3-5 K-means分群結果之集群平均值 47 表4.3-6 K-means分群特徵分布 48 表4.3-7 K-means各集群中未參與分群之變數特徵分布 49 表4.4-1隨機森林分群特徵分布 52 表4.4-2隨機森林各分群中未參與分群之變數特徵分布 54 表4.5-1 潛在類別模式分群結果指標值 54 表4.5-2潛在類別模式分群特徵分布 55 表4.5-3潛在類別模式未參與分群之變數特徵分布 57 表4.6-1三個分群方法內部子群於各方案之選擇比例卡方檢定表 58 表4.6-2三個分群方法內部子群於各方案中選擇大眾運輸比例增減表 59 表4.7-1 K-means與隨機森林之分群重疊性分析表 60 表4.7-2 K-means集群1中歸屬於隨機森林不同分群之特徵分布 62 表4.7-3 K-means集群4中歸屬於隨機森林不同分群之特徵分布 64 表4.7-4隨機森林與潛在類別模式之分群重疊性分析表 65 表4.7-5 隨機森林分群1中歸屬於不同潛在類別之特徵分布 67 表4.7-6潛在類別2中歸屬於隨機森林不同分群之特徵分布 69 表4.7-7以K-means為基礎之三重分群重疊性分析 71 表5.1-1羅吉特模式效用函數說明 75 表5.2-1不限出發地模式參數校估結果 79 表5.2-2 去除雜訊之不限出發地模式參數校估結果 81 表5.2-3北北基桃模式參數校估結果 85 表5.2-4去除雜訊之北北基桃模式參數校估結果 87 表5.3-1 不限出發地模式之不分群模式與分群模式顯著差異檢定 89 表5.3-2北北基桃模式之不分群模式與分群模式顯著差異檢定 89 表5.3-3不限出發地模式K-means dummy變數參數差異檢定 90 表5.3-4不限出發地模式K-means 國道客運旅行時間節省參數差異檢定 91 表5.3-5不限出發地模式K-means 是否有高齡者同行參數差異檢定 91 表5.3-6不限出發地模式隨機森林參數差異檢定 91 表5.3-7不限出發地模式潛在類別模式參數差異檢定 92 表5.3-8北北基桃模式K-means dummy變數參數差異檢定 93 表5.3-9北北基桃模式K-means 國道客運旅行時間節省變數參數差異檢定 93 表5.3-10北北基桃模式K-means 是否有家人同行參數差異檢定 94 表5.3-11北北基桃模式隨機森林參數差異檢定 94 表5.3-12北北基桃模式潛在類別模式參數差異檢定 95 表5.3-13不限出發地模式與北北基桃模式參數差異檢定 96 表5.4-1不限出發地模式驗證結果 97 表5.4-2北北基桃模式驗證結果 97 表6.1-1分群方法優劣比較 100 表A-1不限出發地模式dummy變數參數差異檢定 107 表A-2不限出發地模式第一段旅行時間差距參數差異檢定 107 表A-3不限出發地模式國道五號旅行成本差距參數差異檢定 108 表A-4不限出發地模式蘭陽地區車外時間差距參數差異檢定 108 表A-5不限出發地模國道客運旅行時間節省參數差異檢定 109 表A-6不限出發地模式是否有行李寄放服務參數差異檢定 109 表A-7不限出發地模式家中可用車輛數參數差異檢定 110 表A-8不限出發地模式是否有家人同行參數差異檢定 110 表A-9不限出發地模式是否有高齡者同行參數差異檢定 111 表A-10不限出發地模式是否有孩童同行參數差異檢定 111 表A-11不限出發地模式是否有行動不便者同行參數差異檢定 112 表A-12不限出發地模式是否有攜帶大型行李參數差異檢定 112 表B-1北北基桃模式dummy變數參數差異檢定 113 表B-2北北基桃模式第一段旅行時間差距參數差異檢定 113 表B-3北北基桃模式國道五號旅行成本差距參數差異檢定 114 表B-4北北基桃模式蘭陽地區車外時間差距參數差異檢定 114 表B-5北北基桃模國道客運旅行時間節省參數差異檢定 115 表B-6北北基桃模式是否有行李寄放服務參數差異檢定 115 表B-7北北基桃模式家中可用車輛數參數差異檢定 116 表B-8北北基桃模式是否有家人同行參數差異檢定 116 表B-9北北基桃模式是否有高齡者同行參數差異檢定 117 表B-10北北基桃模式是否有孩童同行參數差異檢定 117 表B-11北北基桃模式是否有行動不便者同行參數差異檢定 118 表B-12北北基桃模式是否有攜帶大型行李參數差異檢定 118 |
參考文獻 |
1. Ben-Akiva, M. and Lerman, S. (1989). Discrete choice analysis. Cambridge: The MIT Press. 2. Bhat, C. (1997). An Endogenous Segmentation Mode Choice Model with an Application to Intercity Travel. Transportation Science, 31(1), pp.34-48. 3. Breiman, L. (2001). Machine Learning, 45(1), pp.5-32. 4. Dadashova, B., Ramírez, B., McWilliams, J. and Izquierdo, F. (2016). The Identification of Patterns of Interurban Road Accident Frequency and Severity Using Road Geometry and Traffic Indicators. Transportation Research Procedia, 14, pp.4122-4129. 5. Electric Power Research Institute. (1977). Methodology for Predicting the Demand for New Electricity-Using Goods. EA-593, project 488-1. Final report. Electric Power Research Institute, Palo Alto, Calif. 6. Han, B., Algers, S., Engelson, L. (2001). Accommodating Drivers’ Taste Variation and Repeated Choice Correlation in Route Choice Modeling by Using the Mixed Logit Model. 80th Annual Meeting of the Transportation Research Board. 7. Hensher, D. (1984). Achieving Representativeness of the Observable Component of the Indirect Utility Function in Logit Choice Models: An Empirical Revelation. The Journal of Business, 57(2), p.265. 8. Jou, R., Chiou, Y., Chen, K. and Tan, H. (2012). Freeway drivers’ willingness-to-pay for a distance-based toll rate. Transportation Research Part A: Policy and Practice, 46(3), pp.549-559. 9. Kadane, J., Manski, C. and McFadden, D. (1984). Structural Analysis of Discrete Data with Econometric Applications. Technometrics, 26(4), p.415. 10. Kitamura, R. (1981). A stratification analysis of taste variations in work-trip mode choice. Transportation Research Part A: General, 15(6), pp.473-485. 11. McFadden, D. (1974). The measurement of urban travel demand. Journal of Public Economics, 3(4), pp.303-328. 12. Molin, E., and D. M. Bos. (2009). Exploring Heterogeneity in Park-and-Ride Preferences: Latent Class Model. 88th Annual Meeting of the Transportation Research Board, Washington, D.C. 13. Oshiro, T., Perez, P. and Baranauskas, J. (2012). How Many Trees in a Random Forest?. Machine Learning and Data Mining in Pattern Recognition, pp.154-168. 14. Random Forests , https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm#intro , 造訪日期:2016/11/10 15. Rebollo, J. and Balakrishnan, H. (2014). Characterization and prediction of air traffic delays. Transportation Research Part C: Emerging Technologies, 44, pp.231-241. 16. Román, C., Arencibia, A. and Feo-Valero, M. (2017). A latent class model with attribute cut-offs to analyze modal choice for freight transport. Transportation Research Part A: Policy and Practice, 102, pp.212-227. 17. Small, K., Winston, C. and Yan, J. (2005). Uncovering the Distribution of Motorists' Preferences for Travel Time and Reliability. Econometrica, 73(4), pp.1367-1382. 18. Strobl, C., Boulesteix, A., Kneib, T., Augustin, T. and Zeileis, A. (2008). Conditional Variable Importance for Random Forests. BMC Bioinformatics, 9(1), p.307. 19. Supervised and Unsupervised Machine Learning Algorithms by Jason Brownlee on March 16, 2016 in Machine Learning algorithms (http://machinelearningmastery.com/supervised-and-unsupervised-machine-learning-algorithms/),造訪日期:2016/11/30 20. Yanagihara, M., Uno, N. and Nakamura, T. (2015). Latent Class Analysis for Driving Behavior on Merging Section. Transportation Research Procedia, 6, pp.259-271. 21. Zheng, Z., Liu, Z., Liu, C. and Shiwakoti, N. (2014). Understanding public response to a congestion charge: A random-effects ordered logit approach. Transportation Research Part A: Policy and Practice, 70, pp.117-134. 22. 中華民國交通部台灣區國道高速公路局網站,http://ez2o.com/3duKG,造訪日期:2017/3/8 23. 王唯全,2006,國際航線低價航空公司及一般航空公司選擇行為之研究─以台北-新加坡為例,國立暨南國際大學土木工程學系,碩士論文 24. 王詩婷,2008,多層次多因子潛在類別分析應用於空間能力之分類研究,輔仁大學心理學系,碩士論文 25. 吳冠宏、吳信宏、郭廣洋,2006,應用分群技術於交通事故資料分析,品質學報,第13卷,第3期,第305-312頁。 26. 吳建生、廖梓淋、林鈺翔,2011,兩步驟類神經網路車輛偵測器遺漏資料之填補及其應用,運輸計劃季刊,第四十卷,第一期,第1-30頁 27. 李曉青,2008,考慮競爭者因素下之市場區隔研究-以高科技產業物流委外為例,國立中興大學行銷學系所,碩士論文 28. 沈聖樺,2018,以活動為基礎方法分析例假日國道五號小客車使用者之運具移轉意願,淡江大學運輸科學研究所,碩士論文 29. 邱琮驊,2016,國道五號及門旅行時間對運具選擇行為影響之研究,台灣大學土木工程學研究所,碩士論文 30. 邱皓政,2008,潛在類別模式-原理與技術,五南出版社 31. 范碧儒,2012,以潛在類別模式分析影響台灣中老年人之憂鬱因子,國立成功大學經濟學系碩博士班,碩士論文 32. 馬偉誠,2012,AVI推估都市幹道旅行時間及其應用,逢甲大學運輸科技與管理學系,碩士論文 33. 高筑韻,2011,以潛在群體方法模化高速公路電子自動收費系統之選擇行為,國立交通大學碩士論文 34. 陳志華、楊子緯、張訓楨、賴永崧,2016,特徵分析和機器學習方法應用於肝臟疾病檢測,福祉科技與服務管理學刊,第四卷,第三期,第417-430頁 35. 陳憶君、洪文玲、郭佩棻,2015,車禍被害人特性研究-應用被害者學與巨量分析,中華民國運輸學會104 年學術論文研討會 36. 游思遠 、邱裕鈞、周榮昌、傅強,2013,以潛在類別模式模化計程收費下高速公路駕駛人之運具及路線選擇移轉行為,中華民國運輸學會102年學術論文研討會 37. 雲端資料分析暨導引系統,http://www.r-web.com.tw/index.php,造訪日期:2016/11/9 38. 謝忠和,2012,以機器學習技術改造傳統臨床決策輔具工具─應用隨機森林、支援向量機器與類神經網路於急性闌尾炎診斷與乳癌風險評估,國立陽明大學生物醫學資訊研究所,博士論文 39. 謝翠娟,2011,以多層次潛在類別模式分析網路使用行為類型,國立交通大學資訊管理研究所,博士論文 40. 藍士勛,2010,以數位式行車記錄器資料分析公路客運駕駛行為之研究,國立交通大學運輸科技與管理學系,碩士論文 41. 蘇振維、呂怡青、張瓊文、張舜淵、李俊賢、鍾慧諭、陸進勝、楊祖維、詹勻沂、呂錦隆、李紀薇,2001,經北宜運輸走廊至宜蘭地區旅次之起迄特性研究 |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信