系統識別號 | U0002-2306201608260200 |
---|---|
DOI | 10.6846/TKU.2016.00736 |
論文名稱(中文) | 應用支援向量迴歸於交通資料遺失值之插補:以固定式車輛偵測器資料為例 |
論文名稱(英文) | Applying Support Vector Regression in Interpolating Missing Traffic Data: A Case Study of Fixed Vehicle Detectors |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 運輸管理學系運輸科學碩士班 |
系所名稱(英文) | Department of Transportation Management |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 104 |
學期 | 2 |
出版年 | 105 |
研究生(中文) | 葉蕢誠 |
研究生(英文) | Kuei-Cheng Ye |
學號 | 603660233 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2016-06-17 |
論文頁數 | 134頁 |
口試委員 |
指導教授
-
董啟崇
委員 - 顏進儒 委員 - 胡守任 |
關鍵字(中) |
遺失值 支援向量迴歸 差分模型 插補模式 |
關鍵字(英) |
Missing Value Support Vector Regression Difference Model Interpolating Model |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
道路管理者或規劃者常依據交通即時資料,作為瞭解道路的車流狀況的基礎,並得依此擬定因應管理策略與提供用路人路況資訊。但交通資料可能因蒐集、傳輸或處理過程可能發生異常或遺失的狀態,而影響道路管理者對路網的判斷,因此處理交通資料的遺失為值得重視的課題。目前國內外提出處理交通資料遺失值的插補方法甚為多元,但在實務上並未有共識的最佳方法,因為都有其運用上的限制,例如方法理論上模式假設與限制,演算過程較耗時或困難;或需利用黑盒子形式軟體為輔助工具,較無法理解內部運作關係,導致操作較容易受限;或需要大量歷史資料及模式識別方法建立專用模型以提高插補績效;此外,研究結果較少針對模式參數穩定性或泛用性進行探討,而實證範圍通常較侷限特定區域。 支援向量迴歸(Support Vector Regression, SVR)係源自於支援向量機的機器學習方法,早期運用於模式識別領域,其具有容許誤差、不需過多假設,且透過核函數(Kernel Function)處理在高維空間非線性轉換問題的特點。相關研究透過此方法處理交通領域的問題,如交通量預測、旅行時間預測等,證實有良好的成果。因此本研究目的係構建以SVR為基礎的快速反應插補模型,並檢視其特性,包括預測準確性、模式參數是否達到穩定及泛用,以及操作上是否容易,追求建立一套可以簡易修正的基礎模式參數,並可調整因應適用於不同的情境狀態問題。本研究有別以往研究模式構建直接以原始時序資料投入模式中,模式構建係以基本鄰近上、下游資料作為錨定值及上下游資料間相對變動量(差分值)之核心差分反應模型,並可透過調整因子來鬆綁模式應用限制,如參考點相對位置及車道數變化等。另基於現階段國內交通資料的蒐集仍以固定式車輛偵測器為主,本研究選擇以封閉式直線路段之速率資料作為模式示範插捕對象,並選擇不同道路等級與區域進行校估及驗證。SVR模式參數校估可分為兩部分,其一為模式內部運作參數之懲罰系數C、核函數的寬度係數γ,以及不敏感損失函數的寬度ε,並以先設ε值進行K-fold交叉驗證進行調校(C, γ);其二為校估轉換後之線性迴歸式的權重係數ω及截距項。 參數校估結果顯示,在設定ε值下,未刪除極端值所校估模式內部運作參數C與γ在各情境或區域下,整體參數呈現較不一致或變動範圍較大的不穩定狀態,而經由刪除極端值後,部分子模式在不同情境或區域參數趨於穩定在較小範圍內,其中參數C多收斂於1~4之間,γ則收斂於0.03~1之間,可視為有限度的穩定。但在線性迴歸的參數校估結果顯示,每筆支援向量的權重係數值皆不一致,以及截距項也並不穩定於一定範圍內。另外,在模式預測能力驗證結果,除了少數國一北區情境2、4預測結果較差(MAPE>20%),其餘情境自我驗證大致可達到高精確的績效(MAPE<10%)。若以全面性交叉驗證選出代表性參數模型預測於不同地區與情境的結果,整體有良好的預測能力(MAPE=10.57%)。 本研究另以相同資料對照比較基於轉換函數之快速反應模型,總體而言兩者模式在實務操作上具簡易、控制性佳,以及模式運用的泛用性、預測準確性皆有良好的優勢。但在操作上的差異,SVR在內部核函數選擇,以及將資料轉換過程較為複雜;而轉換函數需先判別時序資料是否需要差分,並判讀其干擾項以及衝擊反應權數的階次,其操作過程略為複雜。在參數校估結果上,SVR較不如轉換函數具有穩定的現象。 |
英文摘要 |
Real-time traffic data serve as fundamental necessity for traffic authorities or planners to monitor vehicular flows over the road networks in order to develop management strategies or provide travel information to road users. However, these crucial data can be disrupted and missing due to problems between among collecting, transmitting, or handling processes and therefore poses serious consequence. As such, how to deal with traffic missing data becomes an important issue. Various interpolating methods have been proposed with limited success due to the facts that none is perfect without shortcomings; some inherit theoretical presumptions and conditions, some may impose complex computational processes, some require proprietary toolboxes (black boxes) or special- purpose programs, some need to employ massive historical data for pattern matching. Most of all, suffered with limited validations, none can be declared as the best and applicable to all situations due to lacking of stability and transferability in model parameters. The Support Vector Regression (SVR) derived from the mechanical learning methods of Support Vector Machine (SVM) bears the characteristics of high error tolerance, and can handle non-linear problems through transferring data into hyper linear spaces by Kernel function. Applications of SVR to transportation related problems have been successfully demonstrated in various issues such as traffic volume forecasting, travel time prediction. The purpose of this thesis is to develop SVR based model for traffic data interpolation and to investigate the model performance including accuracy of prediction and stability of parameters. This study chose to explore the missing data problem of fixed-type vehicle detectors most commonly used at present time in Taiwan. The travel speed data is of particular interest to be studied. SVR models were specified with a primary form of “difference” model where an attribute variable was defined as the difference between the referenced upper stream and the downstream speeds; and several extension forms for adjustments of roadway geometry conditions. Models were calibrated at several sites with two different road classes and with different traffic flow conditions. Parameter calibrations were performed by two major stages, including three parameters of kernel function and then two parameters for linear regression. Model validations were performed to include self-validation (at the same site) and cross-validation (across different sites). Results show that prediction accuracy was mostly very good with MAPE less than 10%, while the parameter stability/transferability was less satisfactory. Finally, a comparative study between SVR-based models and Transfer Function-based models was implemented. The result showed that both models could generate high accurate predictions with relative quick operations using generally accessible computer software respectively. However, transfer function technique seemed to be with higher parameter stability. |
第三語言摘要 | |
論文目次 |
目錄 第一章 緒論 1 1.1研究背景與動機 1 1.2研究目的 3 1.3研究範圍與對象 4 1.4研究流程 5 第二章 文獻回顧 7 2.1交通資料遺失值定義及處理 7 2.2交通資料插補之相關研究 8 2.2.1迴歸分析法 8 2.2.2類神經網路法 9 2.2.3基因規劃法 10 2.2.4轉換函數法 10 2.3支援向量迴歸 16 2.3.1支援向量迴歸用於預測 16 2.3.2支援向量迴歸應用於交通資料插補與預測 17 2.4小結 21 第三章 研究方法 22 3.1支援向量迴歸 22 3.1.1支援向量迴歸基本理論 22 3.1.2核函數 28 3.1.3參數篩選 28 3.1.4參數調校法則 30 3.2轉換函數模式基本理論 31 3.2.1轉換函數基本定義 31 第四章 模式構建與情境設計 33 4.1模式構建 33 4.1.1核心插補模型 33 4.1.2泛用插補模型 34 4.1.3對照模式-不差分模型 37 4.2模式情境分析設計 37 4.2.1模式分析路段對象 37 4.2.2模式情境設計 40 4.2.3模式校估 42 4.2.4模式驗證 44 4.2.5模式比較分析 45 第五章 實證分析 46 5.1 實證分析-基於支援向量迴歸插補模式 46 5.1.1實證研究資料 48 5.1.2原始資料前置處理 64 5.1.3資料預處理-正規化 66 5.1.4 K-fold交叉驗證調校最佳參數 66 5.1.5模式自我驗證 82 5.1.6各情境代表性插補模型 99 5.1.7跨情境模式交叉驗證 102 5.1.8代表性參數插補模型 108 5.1.9模式比較 109 5.2支援向量迴歸模式延伸討論 118 5.2.1車道數變化之插補模式 118 5.2.2處理回溯時階問題 124 5.2.3支援向量迴歸模式敏感度分析 125 第六章 結論與建議 128 6.1結論 128 6.2建議 129 6.3研究貢獻 130 參考文獻 131 圖目錄 圖3.1非線性映射函數 23 圖3.2導入 -不敏感損失函數的支援向量迴歸 24 圖3.3傳統線性迴歸與支援向量迴歸(及其損失函數)比較圖 25 圖3.4支援向量迴歸架構示意圖 27 圖3.5二元轉換函數模式之理論形式 31 圖3.6多元轉換函數模式之理論形式 32 圖3.7轉換函數模式構建程序 32 圖4.1上下游資料相對變動量結合參考點間距比例示意圖 34 圖4.2兩匝道間三支鄰近蒐集資料之參考點相對位置示意圖 38 圖4.3模式情境設計之SVR子插補模式架構 41 圖4.4 SVR網格搜尋法調校參數流程圖 43 圖5.1支援向量迴歸遺失值插補模式構建流程圖 47 圖5.2國道一號北區基隆至頭份路段示意圖 49 圖5.3國道一號南區新營至永康路段示意圖 49 圖5.4省道台21線65.5K至68.8K路段 50 圖5.5國一北區情境1上游速率趨勢 52 圖5.6國一北區情境1上下游中間速率趨勢 52 圖5.7國一北區情境1下游速率趨勢 52 圖5.8國一北區情境2上游速率趨勢 53 圖5.9國一北區情境2上下游中間速率趨勢 53 圖5.10國一北區情境2下游速率趨勢 53 圖5.11國一北區情境3上游速率趨勢 54 圖5.12國一北區情境3上下游中間速率趨勢 54 圖5.13國一北區情境3下游速率趨勢 54 圖5.14國一北區情境4上游速率趨勢 55 圖5.15國一北區情境4上下游中間速率趨勢 55 圖5.16國一北區情境4下游速率趨勢 55 圖5.17國一北區情境5上游速率趨勢 56 圖5.18國一北區情境5上下游中間速率趨勢 56 圖5.19國一北區情境5下游速率趨勢 56 圖5.20國一南區情境1上游速率趨勢 58 圖5.21國一南區情境1上下游中間速率趨勢 58 圖5.22國一南區情境1下游速率趨勢 58 圖5.23國一南區情境2上游速率趨勢 59 圖5.24國一南區情境2上下游中間速率趨勢 59 圖5.25國一南區情境2下游速率趨勢 59 圖5.26國一南區情境5上游速率趨勢 60 圖5.27國一南區情境5上下游中間速率趨勢 60 圖5.28國一南區情境5下游速率趨勢 60 圖5.29台21線情境6上游速率趨勢 62 圖5.30台21線情境6上下游中間速率趨勢 62 圖5.31台21線情境6下游速率趨勢 62 圖5.32台21線情境7上游速率趨勢 63 圖5.33台21線情境7上下游中間速率趨勢 63 圖5.34台21線情境7下游速率趨勢 63 圖5.35正負3倍標準差範圍以外示意圖 64 圖5.36粗略選擇SVR參數之均方誤差等高線圖 68 圖5.37國一北區差分模型未刪極端值情境2A預測結果(MAPE=35.02%) 96 圖5.38國一北區差分模型未刪極端值情境2C預測結果(MAPE=53.81%) 96 圖5.39國一南區未差分模型已刪極端值情境5C預測結果(MAPE=5.13) 97 圖5.40不差分模型預測北區情境1趨勢圖(MAPE=1.01%) 107 圖5.41差分模型預測南區情境2趨勢圖(MAPE=14.73%) 107 圖5.42 SVR與轉換函數預測各情境後25%資料之MAPE 113 圖5.43楊梅至湖口上游速率趨勢圖 114 圖5.44楊梅至湖口上下游中間速率趨勢圖 114 圖5.45楊梅至湖口下游速率趨勢圖 114 圖5.46支援向量迴歸模式預測趨勢圖(MAPE=8.05%) 115 圖5.47轉換函數模式預測趨勢圖(MAPE=9.66%) 115 圖5.48以下游為基準點回溯上游時階示意圖 124 圖5.49固定 與 變動C值時MAPE的變化 126 圖5.50固定C與 變動 值時MAPE的變化 126 圖5.51固定C與 變動 值時MAPE的變化 127 圖5.52固定C與 變動 值時支援向量佔整體資料的比例變化 127 表目錄 表2-1-1交通資料插補之相關研究彙整表 11 表2-1-2交通資料插補之相關研究彙整表 12 表2-1-3交通資料插補之相關研究彙整表 13 表2-1-4交通資料插補之相關研究彙整表 14 表2-1-5交通資料插補之相關研究彙整表 15 表2-2-1支援向量迴歸應用於交通資料插補之相關文獻彙整 19 表2-2-2支援向量迴歸應用於交通資料插補之相關文獻彙整 20 表4-1車道數增減調整參數應用狀態 36 表4-2高速公路路段車流狀態與平均速率對照表 39 表4-3平均行駛速率 39 表4-4不同投入變數組合 40 表4-5模式預測能力評估準則 45 表5-1國道一號北區路段各情資料分佈狀態彙整表 51 表5-2國道一號南區路段各情資料分佈狀態彙整表 57 表5-3省道台21線路段各情資料分佈狀態彙整表 61 表5-4各情境未刪極端值之前75%訓練資料與後25%預測資料筆數 67 表5-5各情境已刪極端值之前75%訓練資料與後25%預測資料筆數 67 表5-6模式代稱說明 67 表5-7差分模型各情境未刪極端值參數調校結果 73 表5-8差分模型各情境已刪極端值參數調校結果 74 表5-9不差分模型各情境未刪極端值參數調校結果 75 表5-10不差分模型各情境已刪極端值參數調校結果 76 表5-11差分模型各情境權重係數範圍 77 表5-12不差分模型各情境權重係數範圍 78 表5-13差分模型各情境子模式之截距值 79 表5-14不差分模型各情境子模式之截距值 80 表5-15前75%訓練資料變異係數值彙整表 83 表5-16差分模型未刪極端值前75%訓練資料模式自我驗證彙整表 84 表5-17差分模型已刪極端值前75%訓練資料模式自我驗證彙整表 85 表5-18不差分模型未刪極端值前75%訓練資料模式自我驗證彙整表 87 表5-19不差分模型已刪極端值前75%訓練資料模式自我驗證彙整表 88 表5-20相關係數的強度大小與定義 89 表5-21未刪極端值變異係數與MAPE相關性檢定 90 表5-22已刪極端值變異係數與MAPE相關性檢定 90 表5-23後25%預測資料變異係數值彙整表 91 表5-24差分模型未刪極端值預測後25%資料模式自我驗證彙整表 92 表5-25差分模型已刪極端值預測後25%資料模式自我驗證彙整表 93 表5-26不差分模型未刪極端值預測後25%資料模式自我驗證彙整表 94 表5-27不差分模型已刪極端值預測後25%資料模式自我驗證彙整表 95 表5-28變異係數與未刪極端值MAPE相關性檢定 98 表5-29變異係數與已刪極端值預測MAPE相關性檢定 98 表5-30差分模型值各情境之代表性插補模式 100 表5-31不差分模型值各情境之代表性插補模式 101 表5-32差分模型各情境代表性插補模型之跨情境交叉驗證表 104 表5-33不差分模型各情境代表性插補模型之跨情境交叉驗證表 105 表5-34差分與不差分模型代表性參數模型 106 表5-35以代表性參數重新建校各情境插補模型 108 表5-36 SVR與轉換函數預測各情境後25%資料 113 表5-37支援向量迴歸模式與轉換函數模式比較表 116 表5-38國一北區-路段三車道增為四車道之車道調整係數 119 表5-39國一南區-路段三車道增為四車道之車道調整係數 119 表5-40車道數增加路段原始資料 120 表5-41 SVR與轉換函數加入車道數增加調整因子驗證結果 120 表5-42重新訓練加入車道數增加調整因子結果 121 表5-43國一北區-路段四車道減為三車道之車道調整係數 121 表5-44國一南區-路段四車道減為三車道之車道調整係數 122 表5-45車道數縮減路段原始資料 122 表5-46 SVR加入車道數縮減調整因子驗證結果 123 表5-47重新訓練加入車道數縮減調整因子結果 123 表5-48處理回溯時階數預測MAPE比較表 125 |
參考文獻 |
中文 1. 呂奇傑、李天行、高人龍、黃敏菁(2009),「支援向量機與支援向量迴歸於財務時間序列預測之應用」,數據分析,第二期第四卷,頁35-56。 2. 林鈺翔(2010),「利用時空資料插補車輛偵測器遺漏值之研究」,國立中央大學土木工程學系碩士論文。 3. 邱孟佑(2010),「以交通狀態為基礎之旅行時間預測」,國立交通大學交通運輸研究所博士論文。 4. 胡守任、鄭雅楓(2014),「高速公路車輛偵測器資料填補模式之比較分析」,中華民國運輸學會學術論文研討會論文集。 5. 陳寬裕、何嘉惠、蕭宏誠(2004),「應用支援向量迴歸於國際旅遊需求之預測」,旅遊管理研究,第四期第一卷,頁 81-97。 6. 陳首源(2007),「結合移動式與固定式偵測器資料以轉換函數推估旅行時間」,淡江大學運輸科學研究所碩士論文。 7. 陳世倫(2013),「利用基因規劃法進行車輛偵測器資料填補」,國立中央大學土木工程學系碩士論文。 8. 陳宛靜(2015),「構建固定式車輛偵測器遺失值之快速插補模式」,淡江大學運輸科學研究所碩士論文。 9. 許雅惠(2004),「以模擬分析法探討轉換函數在預測旅行時間之運用」,淡江大學運輸科學研究所碩士論文 10. 許程詠(2011),「利用灰色理論於偵測器遺失資料插補之研究」,國立交通大學運輸科技與管理學系碩士班碩士論文。 11. 張逸凡(2005),「支撐向量機在即時河川水位預報之應用」,國立成功大學水利及海洋工程研究所碩士論文。 12. 曾群明(2012),「應用格位傳送模式建構預測型高速公路動態起迄矩陣推估演算法」,國立交通大學交通運輸研究所博士論文。 13. 董啟崇、胡大瀛、鄭妍妍(2010),「初探轉換函數於模擬旅行時間與實際旅行時間之轉換校估」,中華民國運輸學會第二十五屆學術論文研討會論文集。 14. 董啟崇、陳宛靜(2013),「固定車輛偵測器遺失值之快速插補模式」,中華民國運輸學會學術論文研討會論文集。 15. 詹淑鳳(2010),「應用灰色支援向量迴歸預測國際旅遊需求」,淡江大學管理科學研究所碩士論文。 16. 趙志民(2004),「高速公路路段速率推估之研究」,國立交通大學管理學院碩士在職專班運輸物流組碩士論文。 17. 交通部臺灣區國道高速公路局(2016),網址:http://www.freeway.gov.tw/,擷取日期:民國105年3月22日。 18. 交通部(2015),公路路線設計規範。 英文 1. Alex J. S., Bernhard S. (2004), “A tutorial on support vector regression”, Statistics and Computing, vol. 14, no.3, pp. 1999-2222. 2. Chen, D., Muller S. G., Mussone, L., and Montgomey, F. (2001), “A Study of Hybrid Neural Network Approaches and the Effects of Missing Data on Traffic Forecasting”, Neural Computing and Applications, pp. 277-286. 3. Chen, C., Kwon, J., Rice, J., Skabardonis, A. and Varaiya, P. (2002), “Detecting Errors and Imputing Missing Data for Single Loop Surveillance Systems”, Transportation Research Board, Washington, D.C. 4. Cao, L. (2003) “Support vector machines experts for time series forecasting”. Neurocomputing, 51, pp. 321-339. 5. Celikoglu, H. B., and Cigizoglu, H. K. (2007), “Modelling public transport trips by radial basis function neural networks”, Mathematical and Computer Modelling, Vol. 45, pp. 480-489. 6. Gold, D., Turner, S., Gajewski, B., and Spiegelman, C. (2001), “Imputing Missing Values In ITS Data Archives For Intervals Under 5 Minutes”, Transportation Research Board 80th Annual Meeting January 7-11, Washington, D.C. 7. Jun, G., Lin, Q., Mingyue, L., and Xiuyang, C. (2013), “Forecasting urban traffic flow by SVR”, IEEE Control and Decision Conference (CCDC), 2013 25th Chinese pp. 981-984. 8. Little R. and Rubin. R. (1987), “Statistical Analysis with Missing Data” Wiley, New York. 9. Manoel, C., Jeong, Y. S., Jeong, M. K. and Han, L. D. (2009), “Online-SVR for short-term traffic flow prediction under typical and atypical traffic conditions”, Expert Systems with Applications, Vol. 36, No. 3, Part 2, pp. 6164-6173. 10. Park, D. J., Rilett, L. R., and Han, G. H. (1999), “Spectral Basis Neural Networks for Real-time Travel Time Forecasting”, Journal of Transportation Engineering, Vol. 125, No. 6, pp. 515-523. 11. Raut. R. D., and Goyal, V. K. (2012), “Public Transport Bus Arrival Time Prediction with Seasonal and Special Emphasis on Weather Compensation Changes Using RNN”, International Journal of Advanced Research in Computer and Communication Engineering, Vol. 1, No. 6, pp. 378-382. 12. Tavana, H. and Mahmassani, H. S. (2000), “Estimation and Application of Dynamic Speed-Density Relations by using Transfer Function Models”, Transportation Research Record 1710, pp. 47-57. 13. Theja, P. V. V. K., & Vanajakshi, L. (2010), “Short term prediction of traffic parameters using support vector machines technique”, IEEE Emerging Trends in Engineering and Technology (ICETET), 2010 3rd International Conference , pp. 70-75. 14. Wu, C. H., Ho, J. M., and Lee, D. T. (2004), “Travel-time prediction with support vector regression” IEEE Transactions on Intelligent Transportation Systems, 5 (4), pp. 276-281. 15. Wang, F., Tan, G., Deng, C., & Tian, Z. (2008), “Real-time traffic flow forecasting model and parameter selection based on ε-SVR”, IEEE Intelligent Control and Automation, 2008. WCICA 2008. 7th World Congress on , pp. 2870-2875. 16. Y. S. Jeong, Y. J. Byon, M. M. Castro-Neto and S. M. Easa (2013), “Supervised weighting-online learning algorithm for short-term traffic flow prediction”, IEEE Transactions on Intelligent Transportation Systems, Vol. 14, No. 4, pp. 1700 -1707. 17. Zhang, Y., and Liu, Y. (2009), “Missing Traffic Flow Data Prediction using Least Squares Support Vector Machines in Urban Arterial Streets”, IEEE Symposium on Computational Intelligence and Data Mining, pp. 76-83. |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信