§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0608202014281000
DOI 10.6846/TKU.2020.00141
論文名稱(中文) 探索空間非平穩性之多變量迴歸方法
論文名稱(英文) A multivariate regression approach for modeling spatial nonstationarity
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 統計學系應用統計學碩士班
系所名稱(英文) Department of Statistics
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 108
學期 2
出版年 109
研究生(中文) 簡宏濂
研究生(英文) Hong-Lian Jian
學號 607650198
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2020-07-14
論文頁數 63頁
口試委員 指導教授 - 陳怡如
委員 - 李百靈
委員 - 吳漢銘
關鍵字(中) 空間異質性
多變量迴歸模型
地理加權迴歸
多變量變異數分析
拔靴法
關鍵字(英) Spatial nonstationarity
Multivariate regression model
Geographically weighted regression
MultiVariate Analysis of Variation Analysis
Bootstrap Method
第三語言關鍵字
學科別分類
中文摘要
在空間分析的研究議題中,若地理資料具有空間非平穩性(spatial non-stationarity)的問題,地理加權迴歸(Geographically Weighted Regression; GWR)為探討此問題經常使用的工具之一。由於GWR易於計算且容易解釋,近年來已有不少學者拓展此模型;但大多數方法僅針對單個反應變數,鮮少考慮多個反應變數。若空間資料涉及多個高度相關的反應變數,GWR則會忽略其相關性,導致結果有所偏差。鑑於此,本研究提出了地理加權多變量迴歸模型(Geographically Weighted Multivariate Multiple Regression; GWMMR),並討論其相關建模問題,包括多變量變異數分析、拔靴法之迴歸係數檢定與蒙地卡羅空間非平穩性檢定。本研究進一步使用紐約地區之截停盤查資料,實證所提出的GWMMR技術,並將其分析結果與傳統的非空間多變量迴歸和GWR模型進行比較。研究結果顯示, GWMMR表現最佳,並能提供更有用的空間非平穩資訊。
英文摘要
Geographically Weighted Regression (GWR) has been a popular tool in spatial research to address the spatial aspect of data that emphasizes on the issue of spatial non-stationarity. Due to its simple implementation and ease of interpretation, various extensions of GWR have been developed to study the effects of covariates on a single outcome variable. When the geographical data involves multivariate dependent variables collected in the same regions, such a modeling approach ignores the correlations between the outcomes and then yields biased results. Additionally, there has been little study focusing on GWR developments in similar direction. In these regards, this study proposes a geographically weighted multivariate multiple regression (GWMMR) as the
methodology contribution. The associated modeling properties, which include the tests for multivariate analysis of variance, the bootstrap tests of regression coefficients, and the Monte Carlo test in spatial non-stationarity, are also discussed. We further use the “stop-and-frisk"data published by New York Police Department to illustrate the proposed approach. The analysis results are then compared with those from the traditional non-spatial multivariate regression and GWR models. The results show that GWMMR offer better predictions, which in turn provides more detailed information about spatial non-stationairty.
第三語言摘要
論文目次
目錄
1 緒論1
1.1 研究背景與動機. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 研究目的. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 研究架構. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 文獻探討4
2.1 多變量迴歸. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 估計. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.2 多變量變異數分析(MultiVariate Analysis of Variation Analysis;
MANOVA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.3 特殊情況. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 空間分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 繪製地圖. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 空間相關. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.3 空間迴歸. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 地理加權迴歸(Geographically Weighted Regression) . . . . . . . . . . 13
2.3.1 核函數與最佳帶寬. . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.2 空間非平穩性檢定. . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.3 迴歸係數檢定. . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.4 拔靴法檢定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 小結. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 研究材料19
3.1 資料介紹. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 反應變數. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3 解釋變數. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4 研究方法22
4.1 地理加權多變量迴歸(Geographically Weighted Multivariate Multiple
Regression;GWMMR) . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 最佳帶寬選擇. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3 迴歸係數檢定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3.1 MANOVA 檢定. . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3.2 拔靴法之迴歸係數檢定. . . . . . . . . . . . . . . . . . . . . . 27
4.4 蒙地卡羅之空間非平穩性檢定. . . . . . . . . . . . . . . . . . . . . . . 28
4.5 雙變量地圖. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5 研究結果34
5.1 敘述性分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.1.1 反應變數. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.1.2 解釋變數. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.2 傳統非空間迴歸模型分析. . . . . . . . . . . . . . . . . . . . . . . . . 39
5.2.1 變數轉換. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.2.2 傳統一般迴歸分析. . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2.3 多變量迴歸分析. . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.2.4 空間自相關. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.3 空間模型分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.3.1 地理加權迴歸分析. . . . . . . . . . . . . . . . . . . . . . . . . 44
5.3.2 地理加權多變量迴歸分析. . . . . . . . . . . . . . . . . . . . . 50
5.3.3 拔靴法檢定分析. . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.3.4 模型比較分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6 討論與建議58
6.1 總結與討論. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.2 未來研究與建議. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
圖目錄
2.1 空間迴歸類型圖. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.1 GWMMR 流程圖. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2 自然對數犯罪率分佈圖. . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3 兩種顏色依等級分成三個區塊. . . . . . . . . . . . . . . . . . . . . . . 31
4.4 逆時針轉90 度之顏色矩陣. . . . . . . . . . . . . . . . . . . . . . . . . 31
4.5 九種顏色結果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.6 雙變量地圖結果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.1 截停盤查強度分配直方圖. . . . . . . . . . . . . . . . . . . . . . . . . 35
5.2 截停盤查強度散佈圖. . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.3 反應解釋變數地圖分佈. . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.4 解釋變數地圖分佈(一) . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.5 解釋變數地圖分佈(二) . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.6 自然對數轉換警察截停盤查強度分佈圖. . . . . . . . . . . . . . . . . . 40
5.7 自然對數轉換警察截停盤查強度Q-Q plot . . . . . . . . . . . . . . . . 40
5.8 截停盤查強度之多變量常態圖. . . . . . . . . . . . . . . . . . . . . . . 41
5.9 GWR 截停盤查強度之非西班牙裔白人所佔比例顯著分佈圖. . . . . . 47
5.10 GWR 截停盤查強度之非西班牙裔黑人所佔比例顯著分佈圖. . . . . . 48
5.11 GWR 截停盤查強度之西班牙裔所佔比例顯著分佈圖. . . . . . . . . . 48
5.12 GWR 截停盤查強度之外國出生人口所佔比例顯著分佈圖. . . . . . . 49
5.13 GWR 截停盤查強度之自然對數犯罪率顯著分佈圖. . . . . . . . . . . 49
5.14 GWMMR 之MANOVA 檢定顯著分佈圖(一) . . . . . . . . . . . . . . 53
5.15 GWMMR 之MANOVA 檢定顯著分佈圖(二) . . . . . . . . . . . . . . 53
5.16 GWMMR 之MANOVA 檢定顯著分佈圖(一) . . . . . . . . . . . . . . 55
5.17 GWMMR 之MANOVA 檢定顯著分佈圖(二) . . . . . . . . . . . . . . 55
表目錄
2.1 文獻探討相關文獻整理. . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.1 截停盤查次數與截停盤查強度之敘述性統計量. . . . . . . . . . . . . . 36
5.2 各解釋變數之敘述性統計量. . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 截停強度之變數顯著性結果. . . . . . . . . . . . . . . . . . . . . . . . 42
5.4 盤查強度之變數顯著性結果. . . . . . . . . . . . . . . . . . . . . . . . 42
5.5 截停強度與盤查強度之MANOVA 結果. . . . . . . . . . . . . . . . . 43
5.6 全域Moran's Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.7 截停強度GWR 迴歸係數估計結果. . . . . . . . . . . . . . . . . . . . 45
5.8 盤查強度GWR 迴歸係數估計結果. . . . . . . . . . . . . . . . . . . . 45
5.9 GWR 蒙地卡羅檢定結果. . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.10 截停強度GWMMR 迴歸係數估計結果. . . . . . . . . . . . . . . . . . 50
5.11 盤查強度GWMMR 迴歸係數估計結果. . . . . . . . . . . . . . . . . . 50
5.12 GWMMR 蒙地卡羅檢定結果. . . . . . . . . . . . . . . . . . . . . . . 51
5.13 各迴歸模型配適程度比較結果. . . . . . . . . . . . . . . . . . . . . . . 57
參考文獻
[1] Anselin, L. (2006) Spatial econometrics. In Palgrave Handbook of Econometrics, 1:Economectric Theory, K. Patterson and T.C. Mills (eds.), Palgrave Macmillan.
[2] Brunsdon, C., Fotheringham, S., Charlton, M., (1998) Geographically weighted regression. Journal of the Royal Statistical Society:Series D (The Statistician), 47(3):431-443.
[3] Chen, V.Y.J., Deng, W.S., Yang, T.C. and Matthews, S.A. (2012). Geographically Weighted Quantile Regression (GWQR):An Application to U.S.Mortality Data. Geographically Analysis, 44(2):134-150.
[4] Goodchild, Michael F and Anselin, Luc and Appelbaum, Richard P and Harthorn, Barbara Herr (2000), Toward spatially integrated social science, International Regional Science Review, 23(2):139-159.
[5] Efron, B and others (1979), Bootstrap Methods:Another Look at the Jackknif, The Annals of Statistics, 7(1):1-26.
[6] Fotheringham, A. S., Brunsdon, C. and Charlton, M. (2002), Geographically weighted regression, West Atrium:John Wiley and Sons, Limited.
[7] Gelfand, Alan E and Vounatsou, Penelope (2003), Proper multivariate conditional autoregressive models for spatial data analysis, Biostatistics, 4(1): 11-15.
[8] Gelman, A., J. Fagan, and A. Kiss. (2007), A An analysis of the New York City police department’s “stop-and-frisk"policy in the context of claims of racial bias, Journal of the American Statistical Association, 102 (479):813–823.
[9] Harini, Sri and Purhadi, Purhadi and Sunaryo, S (2012), Statistical test for multivariate geographically weighted regression model using the method of maximum likelihood ratio test, International Journal of Applied Mathematics and Statistics, 29(5):110-115.
[10] Johnson, Richard Arnold and Wichern, Dean W and others (2002), Applied multivariate statistical analysis, Englewood Cliffs, NJ:Prentice Hall.
[11] Kim, Kevin and Timm, Neil(2006), Univariate and multivariate general linear models:theory and applications with SAS, CRC Press.
[12] Liu, Hongqiang and Zhu, Xinyan (2017), Joint modeling of multiple crimes:A Bayesian spatial approach, ISPRS International Journal of Geo-Information, 6(1):16.
[13] Li, Dengkui and Mei, Changlin (2018), A two-stage estimation method with bootstrap inference for semi-parametric geographically weighted generalized linear models, International Journal of Geographical Information Science, 32(9):587-598.
[14] Luc Anselin (1995), Local Indicators of Spatial Association|LISA, Geographical Analysis Volume, 27(2):93-115.
[15] Muller, Keith E and Lavange, Lisa M and Ramey, Sharon Landesman and Ramey, Craig T (1992), Power calculations for general linear multivariate models including repeated measures applications, Journal of the American Statistical Association, Taylor & Francis, 87(420):1209-1226.
[16] Mei, Chang-Lin and Wang, Ning and Zhang, Wen-Xiu (2006), Testing the importance of the explanatory variables in a mixed geographically weighted regression model, Environment and Planning A, SAGE Publications Sage
UK:London, England, 38(3):587-598.
[17] Mukhopadhyay, Parimal (2009), Multivariate statistical analysis, World Scientific.
[18] Mei, Chang-Lin and Xu, Min and Wang, Ning (2016), A bootstrap test for constant coefficients in geographically weighted regression models, International
Journal of Geographical Information Science, 30(8):1622-1643.
[19] Michael Friendly (2017), Multivariate multiple regression and visualizing multivariate tests.
[20] Nakaya, Tomoki and Fotheringham, Alexander S and Brunsdon, Chris and Charlton, Martin (2005), Geographically weighted Poisson regression for disease association mapping, Statistics in medicine,24(17):2695-2717.
[21] Massey, D. S., and Denton, N. A.(1989), Hypersegregation in U.S. metropolitan areas: black and hispanic segregation along five dimensions, Demography, 26(3): 373- 391.
[22] Nathaniel E. Helwig (2017), Assistant Professor of Psychology and Statistics.
[23] Olson, Chester L (1974), Comparative robustness of six tests in multivariate analysis of variance, Journal of the American Statistical Association, 69(348):894-908.
[24] P. A. P. Moran (1950), Notes on Continuous Stochastic Phenomena.Biometrika Vol., 37, No. 1/2, pp. 17-23.
[25] Stevens, Josh. (2015), “Bivariate Choropleth Maps:A How-to Guide.", Blog. Josh Stevens. http://www.joshuastevens.net/cartography/makea-
bivariatechoropleth-map/.
[26] Yeo, In-Kwon and Johnson, Richard (2000). A new family of power transformations to improve normality or symmetry. Biometrika, 87:954-959.
[27] Yanagihara, Hirokazu and Wakaki, Hirofumi and Fujikoshi, Yasunori (2015), A consistency property of the AIC for multivariate linear models when the dimension and the sample size are large, Electronic Journal of Statistics, 9(1):869-897.
[28] Zhao, Yunhan and Yang, Tse-Chuan and Messner, Steven F (2019), Segregation and racial disparities in post-stop outcomes:insights from New York City, Journal of Crime and Justice, 42( 4):2003.
[29] 賴進貴、葉高華、陳汶軍(2005), 地理資訊系統應用於登革熱疫情防治之檢討與建議, 環境與世界, 11 : 65-81.
[30] 胡立諄、賴進貴(2006), 臺灣女性癌症的空間分析, 臺灣地理資訊學刊,(4): 39-55.
[31] 顏吟真(2012) 地理加權自相關分量迴歸, 淡江大學統計學系碩士班學位論文:1-62.
論文全文使用權限
校內
校內紙本論文延後至2023-08-14公開
同意電子論文全文授權校園內公開
校內電子論文延後至2023-08-14公開
校內書目立即公開
校外
同意授權
校外電子論文延後至2023-08-14公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信