系統識別號 | U0002-2806201607123900 |
---|---|
DOI | 10.6846/TKU.2016.00968 |
論文名稱(中文) | 頻寬選取於相對風險之核估計:極大的對照資料對極小的病例資料 |
論文名稱(英文) | Bandwidth selection in kernel estimation of relative risk: large control data vs. small case data |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 統計學系應用統計學碩士班 |
系所名稱(英文) | Department of Statistics |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 104 |
學期 | 2 |
出版年 | 105 |
研究生(中文) | 賴孟暄 |
研究生(英文) | Meng-Hsuan Lai |
學號 | 603650077 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2016-06-18 |
論文頁數 | 30頁 |
口試委員 |
指導教授
-
張雅梅
委員 - 洪小文 委員 - 潘宏裕 |
關鍵字(中) |
相對風險函數 交叉驗證法 頻寬選取 核估計 |
關鍵字(英) |
relative risk function cross-validation bandwidth selection kernel estimation |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
在某個地理空間的區域範圍下,除了可得知當地居民是否罹患某種特殊疾病外,並同時紀錄病患的居住地點,可估計罹患該疾病的相對風險,並觀察其在空間上的變化情形。在此研究中,我們利用核估計法去估計相對風險,其中如何選擇頻寬成為我們有興趣探討的主題。若罹患該疾病的人數遠小於所有觀察對象的人數時,是否需要將對照組與病例組的頻寬設為一樣,亦是我們另一項研究重點。本研究在估計相對風險函數時,利用三種交叉驗證方法去選擇頻寬,並以誤差平方積分值來衡量估計結果好壞。藉此在對照組與病例組數量懸殊的情況下,達到更好的估計結果,以估計罹患疾病的相對風險。 |
英文摘要 |
To estimate some disease relative risk, we ask whether residents suffer from particular disease on the certain region and record the residence of patient. We estimate the relative risk and observe the changes in the space. In our study, we use kernel estimation method to estimate relative risk and interest in choosing the bandwidth of kernel estimation. Another focus of our study, we set the bandwidths of case group and control group whether to be same when the number of patients is much less than the observations. We propose three cross-validation methods to select the bandwidth and use the integrated square errors (ISE) to evaluate the estimation results. For the above purposes, we achieve better estimation result of disease relative risk when the number have wide gap between the case group and control group. |
第三語言摘要 | |
論文目次 |
目錄 第一章 緒論 1 第二章 估計方法 3 第一節 核估計 4 第二節 選取頻寬方法 5 第三章 模擬研究 8 第四章 實例分析 16 第五章 結論 26 參考文獻 28 圖目錄 圖3.1 六種模式病例資料之散佈圖,n1=7000與n2=140 12 圖3.2 六種模式之ISE箱型圖,n1=7000與n2=140 13 圖3.3 六種模式之ISE箱型圖,n1=7000與n2=70 14 圖3.4 六種模式之ISE箱型圖,n1=7000與n2=210 15 圖4.1 所有樹木資料之散佈圖 18 圖4.2 各品種樹木的位置散佈圖 20 圖4.3 各品種樹木的位置散佈圖 21 圖4.4 各品種樹木的位置散佈圖 22 圖4.5 各品種樹木的相對風險函數圖形 23 圖4.6 各品種樹木的相對風險函數圖形 24 圖4.7 各品種樹木的相對風險函數圖形 25 表目錄 表4.1 18種品種樹木資料 19 |
參考文獻 |
[1]Gatrell, A. C., Bailey, T. C., Diggle, P. J. and Rowlingson, B. S. (1996). Spatial point pattern analysis and its application in geographical epidemiology, Transactions of the Institute of British Geographers, 256-274. [2]Rushton, G. and Lolonis, P. (1996). Exploratory spatial analysis of birth defect rates in an urban population, Statistics in Medicine,15(7-9), 717-726. [3]Han, D., Rogerson, P. A., Bonner, M. R., Nie, J., Vena, J. E., Muti, P., Trevisan, M. and Freudenheim, J. L.(2005). Assessing spatio-temporal variability of risk surfaces using residential history data in a case control study of breast cancer, International Journal of Health Geographics, 4(1), 1-10. [4]Worton, B. J. (1989). Kernel methods for estimating the utilization distribution in home‐range studies, Ecology, 70(1), 164-168. [5]Brunsdon, C. (1995). Estimating probability surfaces for geographical point data: an adaptive kernel algorithm, Computers & Geosciences, 21(7), 877-894. [6]Bithell, J. F. (1990). An application of density estimation to geographical epidemiology, Statistics in Medicine, 9(6), 691-701. [7] Bithell, J. F. (1991). Estimation of relative risk functions, Statistics in Medicine, 10(11), 1745-1751. [8]Prince, M. I., Chetwynd, A., Diggle, P., Jarner, M., Metcalf, J. V. and James, O. F. (2001). The geographical distribution of primary biliary cirrhosis in a well‐defined cohort, Hepatology, 34(6), 1083-1088. [9]Wheeler, D. C. (2007). A comparison of spatial clustering and cluster detection techniques for childhood leukemia incidence in Ohio, 1996–2003, International Journal of Health Geographics, 6(1), 1-16. [10]Kelsall, J. E. and Diggle, P. J. (1995). Kernel estimation of relative risk, Bernoulli, 3-16. [11]Kelsall, J. E. and Diggle, P. J. (1998). Spatial variation in risk of disease: a nonparametric binary regression approach, Journal of the Royal Statistical Society: Series C (Applied Statistics), 47(4), 559-573. [12]Davies, T. M. and Hazelton, M. L. (2010). Adaptive kernel estimation of spatial relative risk, Statistics in Medicine, 29(23), 2423-2437. [13]Fernando, W. T. P. S., Ganesalingam, S. and Hazelton, M. L. (2014). A comparison of estimators of the geographical relative risk function, Journal of Statistical Computation and Simulation, 84(7), 1471-1485. [14] Shi, X. (2010). Selection of bandwidth type and adjustment side in kernel density estimation over inhomogeneous backgrounds, International Journal of Geographical Information Science, 24(5), 643-660. [15] Diggle, P., Zheng, P. and Durr, P. (2005). Nonparametric estimation of spatial segregation in a multivariate point process: bovine tuberculosis in Cornwall, UK, Journal of the Royal Statistical Society: Series C (Applied Statistics), 54(3), 645-658. |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信