§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0602201811541400
DOI 10.6846/TKU.2018.00187
論文名稱(中文) 風工程氣動力資料庫之資料探勘架構探討及實證研究
論文名稱(英文) The Study of Data Mining Framework and Case Validation on Wind Engineering Aerodynamic Database
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 土木工程學系碩士班
系所名稱(英文) Department of Civil Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 106
學期 1
出版年 107
研究生(中文) 康曉薇
研究生(英文) Hsiao-Wei Kang
學號 604380161
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2018-01-19
論文頁數 112頁
口試委員 指導教授 - 王人牧
委員 - 陳振華
委員 - 羅元隆
關鍵字(中) 資料探勘
決策樹
迴歸分析
SAS Enterprise Miner
預測模型
渦散頻率
極值風壓
最佳設計百分比
關鍵字(英) Data Mining
Decision tree
Regression
SAS Enterprise Miner
Predicted model
vortex shedding frequency
optimum design fractile
Extreme wind pressure
第三語言關鍵字
學科別分類
中文摘要
近年來,網路的發達以及電腦運算能力強大,資料探勘的技術日漸成熟,甚至橫跨各個領域。資料探勘是一個非常具有系統的分析過程,從問題的定義、資料處理、資料探勘模式的建立、到結果解釋與評估,都有其數據依據。藉由這樣的模式,發掘出有用的資訊以提供決策支援。而淡江大學風工程研究中心隨著前人不斷累積實驗數據,已累積大量的風洞試驗數據存放於氣動力資料庫中,不只是知識的保存,也是更多的知識等待被發現、挖掘。
    因此,本研究將建立一個風工程氣動力資料庫之資料探勘架構,目的設計出一個有系統的資料探索流程,具有資料檢視與處理、分析模型及結果的視覺化圖表的功能。資料使用三筆淡江大學風工程研究中心氣動力資料庫中的資料,分別是橫風向的風力頻譜頻寬、低矮建物屋頂表面極值風壓的最佳設計百分比以及高層建物表面風壓的最佳設計百分比。三個資料皆會分割成訓練、驗證、測試的資料進行模型的驗證與評估。分析工具使用SAS Enterprise Miner 14.1;分析方法是結合決策樹及迴歸分析模型,決策樹的演算法使用分類迴歸樹( Classification and Regression Trees, CART )。
    分析流程分為兩個部分,決策樹以及迴歸分析。決策樹的部分,目標得到變數重要性的權重以及重要規則;迴歸分析的部分,先使用決策樹中得到的規則將資料分組,將資料分組訓練,目標得到準確又簡單的迴歸公式。以平均絕對誤差百分比( Mean Absolute Percentage Error, MAPE )及實際值-預測值圖做準確度的標準。
   本研究從橫風向的風力頻譜頻寬開始,得到架構的設計及評估,再以後兩筆資料進行架構的驗證。本研究的結果得到MAPE低於10%及迴歸公式項次小於6項的使用模式以及各資料重要規則的現象詮釋。
英文摘要
Because of the rapid progress of Internet and computers, data mining techniques become mature and widely used in all fields. Data mining is a systematic analysis process that has data support in each stage, from problem definition and structuring, data preparation, model construction and result evaluation and interpretation. With data mining, it is easy to extract valuable information and help in making decisions. TKU-WERC accumulates lots of experimental data in aerodynamic database. It is not only for data reservation but also knowledge discovery. 

    This study is intended to build up a data mining framework for wind engineering aerodynamic database, and uses 3 cases to do the case validation. The purpose of study is to design a systematic data discovery process, with functions of data inspection and preparation, modeling, evaluation and data visualization. The data used in the 3 cases are: the acrosswind spectrum bandwidth near vortex shedding frequency, the optimum design fractile of the low-rise building roof surface extreme pressure and the optimum design fractile of the highrise building surface extreme pressure. The tool of this study is SAS Enterprise Miner 14.1. The methodology of study combined 2 algorithm, decision tree ( CART ) and regression. 

    The process is divided into 2 parts as follows: First, get the variable importance and rule set from decision tree, and use the rules to form data groups. Second, use regression to train data by group. The goal is to get precise and simple prediction formulas. The criteria for accuracy evaluation are Mean Absolute Percentage Error ( MAPE ) and Actual – Predicted diagram. 

    The first case is used to design the framework and make evaluation, and the following 2 cases are for the framework validation. The results from this study acquire the regression application models with MAPE below 10% and the number of coefficient of formula below 6, and the important rule set to interpret the phenomenon of data.
第三語言摘要
論文目次
目錄
目錄	I
圖目錄	IV
表目錄	VI
第一章	緒論	1
1.1	研究動機與目的	1
1.2	研究範圍	3
1.3	研究方法	5
1.4	論文組織簡述	5
第二章	文獻回顧	7
2.1	風工程資料相關文獻	7
2.1.1	氣動力資料庫	7
2.1.1.1	淡江大學風工程研究中心之高層建築氣動力資料庫	8
2.1.1.2	本研究三筆氣動力資料的實驗設置	9
2.1.2	橫風向設計風力於近似矩形斷面高層建築	12
2.1.2.1	鈍體空氣力學	12
2.1.2.2	橫風向設計風力	15
2.1.3	最佳設計百分比	17
2.1.3.1	廣義極值分佈與相關參數	17
2.1.3.2	設計風載重	19
2.2	資料探勘( Data Mining )	21
2.2.1	資料探勘的定義	21
2.2.2	資料探勘的功能與方法	23
2.2.3	資料探勘的架構與步驟	26
2.2.4	資料探勘對科學與工程的相關研究	28
2.2.5	多維資料視覺化方法-平行座標圖( parallel coordinates )	29
2.3	決策樹	32
2.3.1	決策樹的演算法	32
2.3.1.1	CART	32
2.3.1.2	C4.5/C5.0	33
2.3.1.3	CHAID	34
2.4	SAS資料採礦平台( SAS Enterprise Miner, SAS EM )	35
2.4.1	資料採礦方法論SEMMA	35
2.4.2	SAS EM 節點介紹	37
第三章	風工程氣動力資料探勘架構	41
3.1	問題定義	43
3.2	資料準備	44
3.2.1	資料取得	44
3.2.2	資料檢視	44
3.2.3	資料清理	45
3.2.4	資料分割	45
3.3	資料探勘模式建立	46
3.3.1	決策樹建模	46
3.3.2	迴歸分析建模	48
3.3.3	MAPE與實際值-預測值圖	49
3.4	結果解釋與評估	50
第四章	分析案例設置	52
4.1	案例一:高層建物橫風向風力的渦散頻率之頻寬	52
4.2	案例二:低矮建物屋頂表面極值風壓的最佳設計百分比	60
4.3	案例三:單棟高層建物表面風壓的最佳設計百分比	68
第五章	結果分析與實證研究	76
5.1	案例一:結果分析與探討	77
5.2	案例二:結果分析與探討	82
5.3	案例三:結果分析與探討	86
第六章	結論與建議	89
6.1	結論	89
6.2	建議	90
參考文獻	92
附錄A:決策樹結果	95
附錄B:單獨τc或c.o.v.c的實際值-預測值圖	99
附錄C:三個案例MAPE前四名的實際值-預測值圖結果	103

圖目錄
圖2- 1 表面風壓量測法實驗配置	8
圖2- 2  BL-A、BL-B與BL-C的平均風速剖面及紊流強度	9
圖2- 3 鈍體位於自由流中的流場示意圖(參考 [1]重製)	12
圖2- 4 矩柱體外型參數示意圖	13
圖2- 5 深寬比於二維矩柱體在平滑流場中的阻力係數的影響	14
圖2- 6 高寬比於二維方柱體阻力係數的影響	14
圖2- 7 資料探勘模式建立的準則( Pyle [18] )	27
圖2- 8 資料探勘分析架構( 簡禎富、許嘉裕 [16] )	28
圖2- 9 鳶尾花的四個屬性之平行座標圖	31
圖2- 10 重新排序圖2-9中四個屬性的鳶尾花平行座標圖	31
圖2- 11 資料採礦方法論SEMMA	35
圖3- 1 風工程氣動力資料探勘架構	42
圖4- 1 Be1與深寬比、紊流強度的平行軸圖	54
圖4- 2 低矮建物屋頂極值風壓的coptimal與(c.o.v.)c及τc的平行軸圖	62
圖4- 3 最佳設計百分比與形狀參數、擾動程度的平行軸圖	70
圖4- 4 圖4-3局部放大圖	70
圖5- 1 案例一:Type1-1的n5平行座標圖( 色軸:Iu )	78
圖5- 2 案例一:Type1-1的n5平行座標圖( 色軸:SideRatio )	78
圖5- 3 案例一:Type1-1的n3平行座標圖( 色軸:Iu )	79
圖5- 4 案例一:Type1-1的n3平行座標圖( 色軸:SideRatio )	79
圖5- 5 案例一:最佳結果( Type1-1 ,公式編號5 )與鄭啟明 [4]比較圖	81
圖5- 6 Coptimal大於0.95的平行軸圖( 色軸:τc )	83
圖5- 7 Coptimal大於0.95的平行軸圖( 色軸:c.o.v.c )	83
圖B- 1 案例二:以τc在不同分組與公式階數的實際值-預測值圖	99
圖B- 2 案例二:以(c.o.v)c在不同分組與公式階數的實際值-預測值圖	100
圖B- 3 案例三:以τc在不同分組與公式階數的實際值-預測值圖	101
圖B- 4 案例三:以(c.o.v)c在不同分組與公式階數的實際值-預測值圖	102
圖C- 1 案例一:不分群MAPE前四名的實際值-預測值圖	103
圖C- 2 案例一:Type1-1 n3前四名的實際值-預測值圖	104
圖C- 3 案例一:Type1-1 n4前四名的實際值-預測值圖	105
圖C- 4 案例一:Type1-1 n5前四名的實際值-預測值圖	106
圖C- 5 案例二:不分群MAPE前四名的實際值-預測值圖	107
圖C- 6 案例二:Type1-1 n2前四名的實際值-預測值圖	108
圖C- 7 案例二:Type1-1 n3前四名的實際值-預測值圖	109
圖C- 8 案例三:不分群MAPE前四名的實際值-預測值圖	110
圖C- 9 案例三:Type1-1 n2前四名的實際值-預測值圖	111
圖C- 10 案例三:Type1-1 n3前四名的實際值-預測值圖	112

表目錄
表1- 1 本研究風工程氣動力資料列表	3
表1- 2  D1:資料欄位介紹	3
表1- 3  D2:資料欄位介紹表	4
表1- 4  D3:資料欄位介紹表	4
表2- 1 資料探勘的定義	22
表2- 2 資料探勘的學習方法與功能	26
表2- 3 資料探勘對科學與工程的相關研究	29
表3- 1 研究要素	41
表3- 2 本研究風工程氣動力資料列表與資料實驗來源者	44
表3- 3 分析前變數重要性示意表	45
表3- 4 本研究附錄說明	46
表3- 5 CART演算法在SAS Enterprise Miner14.1基本設定	47
表3- 6 迴歸分析輸入項的基本種類	48
表3- 7 研究流程代號概念表	50
表4- 1  D1變數名稱與描述	52
表4- 2  D1連續型輸入變數統計表	53
表4- 3  D1連續型輸入變數統計表(刪除所有具Be1遺失值樣本)	53
表4- 4  D1分析前變數重要性	54
表4- 5  D1目標Be1的決策樹測試項目	55
表4- 6  案例一:Type1-1分組規則	55
表4- 7 案例一:基本公式	56
表4- 8 案例一:迴歸分析輸入項代號說明	56
表4- 9 案例一:不分組( Type0 )迴歸VASE結果	57
表4- 10 案例一:Type1-1 n3分組迴歸VASE結果	57
表4- 11 案例一:Type1-1 n4分組迴歸VASE結果	58
表4- 12 案例一:Type1-1 n5分組迴歸VASE結果	58
表4- 13 案例一:MAPE比較結果	59
表4- 14  D2的變數名稱與描述	60
表4- 15  D2連續型輸入變數的統計表	61
表4- 16  D2分析前變數重要性表	61
表4- 17  D2目標coptimal的決策樹測試項目	63
表4- 18 案例二:Type1-1分組規則	63
表4- 19 案例二:基本公式	64
表4- 20 案例二:迴歸分析輸入項代號說明	64
表4- 21 案例二:不分組( Type0 )迴歸VASE結果	65
表4- 22 案例二:Type1-1 n2及n3迴歸公式	66
表4- 23 案例二:Type1-1 n2分組迴歸VASE結果	66
表4- 24 案例一:Type1-1 n3分組迴歸VASE結果	66
表4- 25 案例二:MAPE之前四名比較結果	67
表4- 26 案例二:MAPE之形狀參數τc與擾動程度c.o.v.c比較結果	67
表4- 27  D3變數名稱與描述	68
表4- 28  D3連續型輸入變數統計表	69
表4- 29  D3分析前變數重要性	69
表4- 30  D3目標Coptimal的決策樹測試項目	71
表4- 31 案例三:Type1-1分組規則	71
表4- 32 案例三:基本公式	72
表4- 33 案例三:迴歸分析輸入項代號說明	72
表4- 34 案例三:不分組( Type0 )迴歸VASE結果	73
表4- 35 案例三:Type1-1 n2及n3迴歸公式	73
表4- 36 案例三:Type1-1 n2分組迴歸VASE結果	74
表4- 37 案例三:Type1-1 n3分組迴歸VASE結果	74
表4- 38 案例三:MAPE之前四名比較結果	75
表4- 39 案例三:MAPE之形狀參數τc與擾動程度c.o.v.c比較結果	75
表5- 1 案例一:MAPE與公式係數個數對照表	77
表5- 2 Be1公式係數( Type1-1 ,公式編號5 )	80
表5- 3 Type1-1公式編號5應用模式預測最不佳前五名資訊	80
表5- 4 鄭啟明 [4] 係數	81
表5- 5 案例二:MAPE與公式係數個數對照表	82
表5- 6 Coptimal公式係數( Type1-1 ,公式編號4 )	84
表5- 7 案例二:Type1-1公式編號4應用模式預測最不佳前五名資訊	84
表5- 8 案例三:MAPE與公式係數個數對照表	86
表5- 9 案例三:Type1-1公式編號4應用模式預測最不佳前五名資訊	87
表5- 10 案例三:Type1-1公式編號3應用模式預測最不佳前五名資訊	87
表A- 1 案例一:決策樹樹形	95
表A- 2 案例一:決策樹規則集	95
表A- 3 案例二:決策樹樹形	96
表A- 4 案例二:決策樹規則集	97
表A- 5 案例三:決策樹樹形	98
表A- 6 案例三:決策樹規則集	98
參考文獻
[1] 	中華民國風工程學會, 風工程理論與應用, 臺北市: 科技圖書股份有限公司, 2016. 
[2] 	Y. Zhou, T. Kijewski and A. Kareem, "Aerodynamic Loads on Tall Buildings: Interactive Database," Journal of Structure Engineering, ASCE, pp. 394-404, 2003. 
[3] 	王人牧、鄭啟明、鄧秉泰, "以風洞實驗資料庫為基礎之高層建築設計風載重專家系統," 結構工程, vol. 21, no. 2, pp. 39-51, 2006. 
[4] 	C.-M. Cheng, J. Wang, T.-C. Lai and M.-S. Tsai, "A Proposed Model for the Acrosswind Equivalent Static Design Wind Load of rectangular shaped tall building," in The 14th International Symposium on Structural Engineering, 2016. 
[5] 	羅元隆、林逸崧, “低矮建物屋頂表面極值風壓之特性分布探討,” 全國風工程研討會論文, 2016.
[6] 	曾育凡, “干擾效應下的極值分布特性,” 淡江大學土木工程學系碩士論文, 2017.
[7] 	Y.-L. Lo and M. Kasperski, “Estimation of the Design Values of Local Wind-induced Loads Based on Short Wind Tunnel Experiments,”Asia-Pacific Conference on Wind Engineering, Auckland, New Zealand, 2017. 
[8] 	李淑娟, 資料採礦運用 以SAS Enterprise Miner為工具, 臺北市: SAS Institute Taiwan Ltd., 2015. 
[9] 	W. Frawley and G. Piateski, Knowledge Discovery in Databases, Cambridge, MA, USA: MIT Press, 1991. 
[10] 	廖述賢、溫志皓, 資料探勘理論與應用-以IBM SPSS Modeler為範例, 新北市汐止區: 博碩文化股份有限公司, 2011. 
[11] 	U. Fayyad, G. Piatetsky-Shapiro and P. Smyth, "The KDD Process for Extracting Useful Knowledge from Volumes of Data," Communication of ACM, vol. 39, no. 11, 1996. 
[12] 	M. Berry and G. Linoff, Data Mining Techniques for Marketing, Sales and Customer Support, New York: John Wiley and Sons, 1997. 
[13] 	C. Kleissner, “Data Mining for the Enterprise,” IEEE, 1998. 
[14] 	廖述賢, 資訊管理, 雙葉書廊, 2007. 
[15] 	J. Han, M. Kamber and J. Pei, Data mining:concepts and techniques, 3rd ed., 2011. 
[16] 	簡禎富、許嘉裕, 資料挖礦與大數據分析, 新北市: 前程文化事業有限公司, 2014. 
[17] 	曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯, 資料探勘, 旗標出版社股份有限公司, 2005. 
[18] 	D. Pyle, Data Preparation for Data Mining, San Diego, CA 92101-4495, USA: Morgan Kaufmann, 1999. 
[19] 	李培瑞, “半導體製程資料挖礦架構、決策樹分類法則及其實證研究,” 國立清華大學工業工程與工程管理學系碩士論文, 2002.
[20] 	T. Miranda, G. A. Correia, M. Santos, L. R. e. Sousa and P. Cortez, "New Models for Strength and Deformability Parameter Calculation in Rock Masses Using Data-Mining Techniques," International Journal of Geomechanics, ASCE, vol. 11, no. 1, pp. 44-58, 2011. 
[21] 	Q. Meng and J. Weng, "Classification and Regression Tree Approach for Predicting Drivers' Merging Behavior in Short-Term Work Zone Merging Areas," Journal of Transportation Engineering, ASCE, vol. 138, no. 8, pp. 1062-1070, 2012. 
[22] 	顏偉倫, “建構資料挖礦架構於半導體先進製程導入量產階段的良率提升,” 國立清華大學工業工程與工程管理學系碩士論文, 2012.
[23] 	蕭唯倫, “應用資料探勘技術針對肇事碰撞型態建立路口分支風險和肇事因子模型,” 國立臺灣大學工學院土木工程學系碩士論文, 2015.
[24] 	C. Contreras-Nieto, P. Lewis and Y. Shan, "Developing Predictive Models of Superstructure Rating for Steel and Prestressed Concrete Bridge," Construction Research Congress, ASCE, 2016. 
[25] 	H. Zhou, X. Yuan, H. Qu, W. w. Cui and B. Chen, “Visual Clustering in Parallel Coordinates,” Eurographics/ IEEE-VGTC Symposium on Visualization, 2008. 
[26] 	E. Turban, R. E. Sharda and D. Delen, Decision Support and Business Intelligence Systems,9th Edition, Pearson, 2011. 
[27] 	P. N. Tan, M. Steinbach and V. Kumar, 資料探勘( Introduction to Data Mining ), 台灣培生教育, 2008.
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信