§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0409201216123900
DOI 10.6846/TKU.2012.00165
論文名稱(中文) 臭氧事件之預測分析-以高雄左營地區為例
論文名稱(英文) Prediction of Ozone Episode Days- A Case Study of Zuoying Area in Kaohsiung
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 水資源及環境工程學系碩士班
系所名稱(英文) Department of Water Resources and Environmental Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 100
學期 2
出版年 101
研究生(中文) 李振豪
研究生(英文) Chen-Hao Li
學號 698480455
學位類別 碩士
語言別 繁體中文
第二語言別 繁體中文
口試日期 2012-07-16
論文頁數 84頁
口試委員 指導教授 - 黃富國(fkhuang@mail.tku.edu.tw)
委員 - 江旭程
委員 - 王淑娟
關鍵字(中) 臭氧事件日
判別分析
邏輯迴歸
類神經網路
支持向量機
關鍵字(英) ozone episodes
discriminant analysis
logistic regression
artifical neural network
support vector machine
第三語言關鍵字
學科別分類
中文摘要
高屏地區之光化學污染問題值得長期關注,如何預測及降低臭氧濃度為目前空氣品質污染防制的重要課題。本研究以高雄市臭氧污染較嚴重之左營地區為例,分別採用判別分析(discriminant analysis, DA)、邏輯迴歸(logistic regression, LR)、類神經網路(artificial neural network, ANN),以及較新之支持向量機(support vector machine, SVM)等四種模式作臭氧事件日之預測分析,各模式之預測成果雖互有差異,但相較於直接預測臭氧濃度,本研究展示了探討臭氧問題之另一可行途徑。
本文之研究,利用包括檢測機率(POD)、誤警率(FAR)、誤判率(FPR)、漏判率(FNR)及準確率(ACC)等指標作為模式優劣評判之依據。依美國臭氧事件標準,於臭氧事件日與否之資料數目有偏差的情況下,DA雖然有最高之POD,但卻有最差之FAR及FPR,導致預測結果表現不佳。而SVM之FAR、FPR及ACC雖然不錯,整體而言,還是以ANN呈現之預測結果最為理想;而依台灣臭氧事件標準,在臭氧事件日與否之資料數目沒有偏差之情況下,顯示DA及LR模式在預測臭氧事件日之表現上均較不理想。ANN有最高之準確率ACC、最低之FPR及最低之FAR。相較之下,SVM雖有較高之FAR,不過有最高之POD及最低之FNR;整體表現雖不如ANN理想,不過POD值、FNR值均表現不錯,若考量臭氧事件對民眾健康的影響,採用SVM模式來預測臭氧事件日,仍為一可資採用之選擇。
英文摘要
It’s a problem worthy of much attention in the long term for the photochemical air pollution in Kaohsiung/Ping-Dong area. How to predict and reduce the ozone concentration is an important issue for the air quality pollution control. In this research, a case study of ozone pollution is performed for the Zuoying area in Kaohsiung. In order to predict the ozone episode days, four models, i.e., discriminant analysis (DA), logistic regression (LR), artificial neural network (ANN), and the support vector machine (SVM), are used to analysis and comparison, respectively. Rather than predicting the ozone concentration directly, the occurrence of ozone episode days is forecast instead in the analysis which demonstrates another way to explore the ozone issue.
In this study, five indicators including probability of detection (POD), false alarm rate (FAR), false positive rate (FPR), false negative rate (FNR) and accuracy (ACC) are used as a basis to assess the model performance. If based on the biased data according to the U.S. standard for ozone episodes, DA has the highest POD, but with the worst FAR and FPR, led to the poor performance of the prediction results. Whereas SVM has the better FAR, FPR, and the ACC, the performance of ANN prediction is the best overall. On the other hand, if based on the unbiased data according to the Taiwan standard for ozone episodes, the performance of DA and LR models is not satisfactory. ANN has the highest ACC and the lowest FPR and FAR. In contrast, although SVM has the higher FAR, it with the highest POD and the lowest FNR. The performance of SVM is not good than ANN in general, however, its POD and FNR values show good. If the influences of ozone episodes on the public health are considered, it will be a not bad choice by the SVM model to predict the ozone episode days.
第三語言摘要
論文目次
目錄	I
表目錄	III
圖目錄	V

目錄
第一章 前言	1
1.1 研究動機與目的	1
1.2 研究架構及流程	2
第二章 台灣地區空氣品質概述及文獻回顧	5
2.1 台灣地區空氣品質概述	5
2.1.1 空氣品質概述	5
2.1.2 臭氧形成機制	7
2.1.3 台灣地區空氣品質標準	8
2.2文獻回顧	10
2.2.1 判別分析法之相關研究	10
2.2.2 邏輯迴歸法之相關研究	10
2.2.3 類神經網路之相關研究	11
2.2.4 支持向量機之相關研究	12
第三章 研究方法	15
3.1 判別分析法(DA)	15
3.2 邏輯迴歸分析法(LR)	17
3.3 類神經網路分析法(ANN)	19
3.3.1 倒傳遞類神經網路	19
3.3.2 倒傳遞類神經網路演算法	20
3.4 支持向量機分析法(SVM)	23
3.4.1線性支持向量機	24
3.4.2 非線性支持向量機	28
3.5 評估指標	30
3.5.1分類矩陣	30
3.5.2 熵值	32
第四章 左營地區臭氧事件案例探討	35
4.1 場址特性及監測資料	35
4.1.1 左營測站場址特性	35
4.1.2 左營測站監測資料	36
4.2 分析參數研究	44
4.3 判別分析	48
4.3.1 採用台灣臭氧事件日之標準	48
4.3.2 採用美國臭氧事件日之標準	52
4.4 邏輯迴歸分析	53
4.4.1採用台灣臭氧事件日之標準	53
4.4.2採用美國臭氧事件日之標準	57
4.5 類神經網路分析	58
4.5.1採用台灣臭氧事件日之標準	58
4.5.2採用美國臭氧事件日之標準	63
4.6 支持向量機分析	64
4.6.1採用台灣臭氧事件日之標準	64
4.6.2採用美國臭氧事件日之標準	68
4.7 各模式綜合比較	69
4.7.1採用台灣臭氧事件日之標準	69
4.7.2採用美國臭氧事件日之標準	74
第五章 結論與建議	79
5.1 結論	79
5.2 建議	80
參考文獻	81

表目錄
表2.1 污染物濃度與污染副指標值對照表(環保署,2012)	7
表2.2 台灣地區空氣品質標準(環保署,2012)	9
表3.1 SVM常用的核函數(Hsu et al., 2009)	29
表3.2 分類矩陣(classification matrix)	30
表3.3 分類矩陣-事件日及非事件日加總	33
表3.4 頻率矩陣	34
表4.1 各模式輸入之參數及資料來源	38
表4.2各模式訓練、測試及預測資料相關數據	39
表4.3 O3自相關係數表	45
表4.4 目標輸出之臭氧事件日與O3_1之交叉相關表	47
表4.5 判別分析之模式摘要	48
表4.6 判別函數係數與結構係數彙總表	50
表4.7 台灣標準之DA結果分類矩陣	51
表4.8 美國標準之DA結果分類矩陣	52
表4.9 LR模式摘要表	53
表4.10 Hosmer-Lemeshow擬合優度指標	54
表4.11 LR方程式中的變數	56
表4.12台灣標準之LR結果分類矩陣	57
表4.13美國標準之LR結果分類矩陣	58
表4.14 神經元個數與均方根誤差(RMSE)關係表	59
表4.15 類神經網路架構及參數設定資料	61
表4.16 台灣標準之ANN結果分類矩陣	63
表4.17 美國標準之ANN結果分類矩陣	63
表4.18 台灣標準之SVM結果分類矩陣	68
表4.19美國標準之SVM結果分類矩陣	68
表4.20台灣標準之各模式頻率矩陣值	70
表4.21採用台灣臭氧事件日標準之模式評估指標綜合比較表	72
表4.22台灣標準之模式與評估指標整理比較表	73
表4.23採用美國臭氧事件日標準之模式評估指標綜合比較表	75

圖目錄
圖1.1研究架構及流程圖	3
圖2.1 台灣地區2000-2011年O3與PM10之PSI值>100比例圖	6
圖3.1 判別分析幾何圖形(林震岩,2006)	16
圖3.2 邏輯函數曲線圖(王與郭,2010)	18
圖3.3 倒傳遞類神經網路(BPNN)架構圖(張&張,2010)	20
圖3.4 誤差倒傳遞演算法流程(張&張,2010)	22
圖3.5 SVM實際風險示意圖(修改自Vapnik, 1995)	23
圖3.6 SVM之線性可分情況(修改自Burges, 1998)	24
圖3.7 SVM之線性不可分情況(修改自Burges, 1998)	27
圖4.1台灣高屏空品區之左營測站及高雄氣象站位置圖	36
圖4.2 O3、NO2及太陽角φ隨時間變化情形	41
圖4.3雲量、最高溫度及最大溫度差隨時間變化情形	42
圖4.4日溫度差、風速及相對濕度隨時間變化情形	43
圖4.5 O3自相關係數圖	45
圖4.6目標輸出之臭氧事件日與否與O3_1之交叉相關圖	46
圖4.7神經元個數與均方根誤差(RMSE)關係圖	59
圖4.8ANN之各層神經元個數示意圖	60
圖4.9 ANN輸入參數之貢獻圖	62
圖4.10 SVM資料處理流程圖(黃承龍等,2004)	65
圖4.11 SVM網格搜尋法調整參數流程圖(黃承龍等,2004)	66
圖4.12 SVM正確率等高線圖	67
圖4.13各模式之R/Rmax值比較	70
圖4.14 台灣標準之各模式POD vs.FAR	74
圖4.15 美國標準之各模式POD vs.FAR	76
參考文獻
1.	Burges, C. J. C. (1998). “A Tutorial on Support Vector Machines for Pattern Recognition,” Data Mining Knowl. Discov., 2, pp. 121-167.
2.	Bernhard, S., and Smola, A. J. (2002). “Learning with Kernels - Support Vector Machines, Regularization, Optimization, and Beyond,” London, England:The MIT Press.
3.	Change, C.C., and Lin, C. J. (2009). “LIBSVM: A Library for Support Vector Machines,” available http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html
4.	Chelani, A.B. (2010). “Prediction of Daily Maximum Ground Ozone Concentration Using Support Vector Machine,” Environ. Moni. Assess. 162, pp. 169–176.
5.	Cox, D. R. &Snell, E. J.(1989). “The Analysis of Binary Data.(2nd ed.). London:Chapman and Hall 
6.	Faruto and Liyang (2009)., LIBSVM-faruto Ultimate Version A Toolbox with Implements for Support Vector Machines Based on Libsvm,
Software Available at http://www.ilovematlab.cn
7.	Fletcher, R.(1987). Practical Methods of Optimization. John Wiley and Sons, Inc., 2nd edition.
8.	Fisher, R. A. (1936). The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, Vol. 7, pp. 179-188.
9.	Gately, E.,(1996). Neural Networks for Financial Forecasting. New York: Wiley.
10.	Hsu, C. W., Chang, C.C., and Lin, C. J. (2009). “A Practical Guide to Support Vector Classification,” Department of Computer Science, National Taiwan University, http://www.csie.ntu.edu.tw/~cjlin/
11.	Lu, W. Z., and Wang, W. J. (2005). “Potential Assessment of The Support Vector Machine Method in Forecasting Ambient Air Pollutant Trends,” Chemosphere, Vol. 59, pp. 693-701.
12.	Lu, W. Z.and Wang, D. (2008). “Ground-Level Ozone Prediction by Support Vector Machine Approach with a Cost-Sensitive Classification Scheme,” Science of the Total Environment, Vol. 395, pp. 109-116.
13.	Maddala, G. S.(1983). Limited-Dependent and Qualitative Variables in Econometrics, London:Cambridge University press
14.	Magge, L.(1990). “R2 Measures Based on Wald and Likelihood Eatio Joint Significance Tests,” American Statistician, Vol. 44, pp.250-253
15.	Morris, H. M. and Mark, J.S.(1973). “Classification of Meteorological Patterns in Southern California by Discriminant Analysis,” J. Appl. Meteor., 12, pp. 571–577.
16.	Nagelkerke, N. J. D.(1991). “A Note on a General Definitionod the Coefficient of Determination, ” Biometrika, Vol. 78, pp. 691-692
17.	Nello, C., and Taylor, J. S. (2000). An Introduction to Support Vector Machines and Other Kernel-based Learning Methods. Cambridge University Press.
18.	Sa’nchez, J. L., Marcos, J. L., De-La-Fuente, M. T., and Castro, A. (1998). “A Logistic Regression Model Applied to Short Term Forecast of Hail Risk,” Phys. Chem. Earth, Vol. 23, No5-6, pp. 645-648.
19.	Sa’nchez, J. L., Garcia, E. O.,and Marcos, J. L. (2001). “Construction and Assessment of A Logistic Regression Model Applied to Short-Term Forecasting of Thunderstorms in Leo’n (Spain),” Atmospheric Research, Vol. 56, pp. 57-71.
20.	Tsai, C. H., Chang, L. C., and Chiang, H. C. (2009). “Forecasting of Ozone Episode Days by Cost-sensitive Neural Network Methods,” Science of the Total Environment, Vol. 407, pp. 2124-2135.
21.	Vapnik, V. N. (1995). The Nature of Statistical Learning Theory. 2nd ed., New York:Springer-Verlag,.
22.	Yi, J., and Prybutok, V. R. (1996). “A Neural Network Model Forecasting for Prediction of Daily Maximum Ozone Concentration in An Industrialized Urban Area,” Environmental Polution, Vol. 92, No. 3, pp. 349-357.
23.	王濟川、郭志剛(2010),Logistic 迴歸模型-方法與應用,二版,五南圖書。
24.	王文聖、張祥、金菊良、丁晶、王浩(2011),水文學不確定性分析方法,科學出版社。
25.	行政院環境保護署網站(2012),http://www.epa.gov.tw。.
26.	行政院環境保護署 (2011),中華民國台灣地區空氣品質監測報告-100年年報。
27.	行政院環境保護署(2012),高屏總量管制計畫初稿。
28.	交通部中央氣象局網站(2012),http://www.cwb.gov.tw。
29.	李國正、王猛、曾華軍(2000),支持向量機導論,電子工業出版社。
30.	李淑蓉、程萬里(2010),中部地區在臭氧事件日期間揮發性有機物來源及其臭氧生成潛勢,工業污染防治季刊,第114期,第63-96頁。
31.	吳剛宏(2008),福衛三號電子濃度資料分析:電離層E層,碩士論文,國立中央大學太空科學研究所。
32.	林震岩(2006),多變量分析-SPSS的操作與應用,初版,智勝文化。
33.	林燕萍(2007),消費性貸款違約行為預測模式之研究—DEA-DA、類神經網路、Logistic迴歸與判別分析之比較,碩士論文,中華大學經營管理研究所。
34.	陳順宇(2004),多變量分析,四版,華泰文化。
35.	陳文通(2006),利用類神經網路預測台灣地區臭氧濃度,碩士論文,淡江大學水資源及環境工程學系。
36.	張斐章、張麗秋(2010),類神經網路導論-原理與應用,滄海書局。
37.	張弼超(2005),運用羅吉斯迴歸法進行山崩潛感分析-以臺灣中部國姓地區為例,碩士論文,國立中央大學應用地質研究所。
38.	張叁麒、孫建平(2009),結構方程模式於建立生態水質水文指標之研究,農業工程學報,第五十五卷,第三期,第75-87頁
39.	莊緯璉(2005),運用判別分析進行山崩潛感分析之研究–以臺灣中部國姓地區為例,碩士論文,國立中央大學應用地質研究所。
40.	黃富國(2008),基於訊息理論之液化機率與損害評估模式建立與應用,中國土木水利工程學刊,第二十卷,第三期,第301-314頁。
41.	黃宗仁(2001),利用類神經網路預測台中都會區臭氧趨勢之研究,碩士論文,國立中興大學環境工程研究所。
42.	黃承龍、陳穆臻、王界人(2004),支援向量機於信用評等之應用,計量管理期刊,第一卷,第二期,第155-172頁。
43.	葉小蓁(1998),時間序列分析與應用,第2-8頁。
44.	廖琇怡(2005),高雄市臭氧特性與氣象因子之相關性探討,碩士論文,國立中山大學環境工程研究所。
45.	鄭乃揚、田英傑(2004),數據挖掘中的新方法-支持向量機,科學出版社。
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信