系統識別號 | U0002-1706201311393800 |
---|---|
DOI | 10.6846/TKU.2013.00581 |
論文名稱(中文) | 兩類別變數的關聯性研究 |
論文名稱(英文) | On the study of the Association between Two Categorical Variables |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 統計學系應用統計學碩士班 |
系所名稱(英文) | Department of Statistics |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 101 |
學期 | 2 |
出版年 | 102 |
研究生(中文) | 周德昌 |
研究生(英文) | Te-Chang Chou |
學號 | 600650203 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2013-05-16 |
論文頁數 | 63頁 |
口試委員 |
指導教授
-
陳麗菁
共同指導教授 - 朱建平 委員 - 王俊毅 委員 - 陳蔓樺 |
關鍵字(中) |
列聯係數 Cramer's V係數 特徵值 皮爾森卡方檢定 逐次檢定 |
關鍵字(英) |
Contingency coefficient Cramer's V coefficient Eigenvalue Pearson chi-square test Sequential test |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
本篇論文回顧Zhu et al.(2013)的逐次檢定方法檢測兩類別變數之間的關聯程度,並使用他們所提出的指標tau來衡量兩類別變數的關聯強度。本研究進一步利用Zhu et al.(2013)的發現建構一些新的指標以修正原有的指標,並且針對這些指標與Cramer's V係數、列聯係數,進行有限樣本的模擬研究,以比較這些指標的表現。在模擬研究當中,第一部分驗證了Zhu et al.(2013)的逐次檢定統計量的抽樣分配會近似卡方分配。第二部分透過大量模擬發現以新指標來衡量兩類別變數的關聯程度表現得最好,其中指標tau4為指標tau乘上((L+1)/L)再開根號,L為行數或列數取較小的再減1。為了示範新指標tau4的執行,針對台北榮民總醫院所提供的燒燙傷研究的資料,本文以新指標tau4評估對於感興趣的兩類別變數間的關聯程度。 |
英文摘要 |
This paper reviews the sequential test method proposed by Zhu et al.(2013) to test the degree of association of two categorical variables. Zhu et al.(2013) also proposed an index tau to measure the strength of association of two categorical variables. In this study, some another similar indexes are constructed and their performance are then compared with the Cramer's V and contingency coefficient. According to the result of the extensive simulation studies, the index tau4 has the best performance, where tau4 is the square root of the index tau multiplied by ((L+1)/L) and L+1 is the number of rows or the number of columns, whichever is less. Another simulation studies confirm that the sampling distribution of the sequential test statistic proposed by Zhu et al.(2013) approximates the chi-square distribution. An acute burn injury research from the Veterans General Hospital database has been used to illustrate the proposed method as well. |
第三語言摘要 | |
論文目次 |
第一章 緒論 1 第二章 研究方法 6 第一節 逐次檢定方法 7 第二節 關聯程度的測量指標 10 第三章 模擬研究 13 第四章 實際資料分析 30 第五章 結論與討論 41 參考文獻 43 附錄 45 表目錄 表 1、逐次檢定中各關聯程度的比例 16 表 2、不同的相關係數下各指標的平均值 17 表 3、逐次檢定中各關聯程度的比例 22 表 4、不同的相關係數下各指標的平均值 23 表 5、參數 (a , b) 的設定與其相關係數 25 表 6、逐次檢定中各關聯程度的比例 25 表 7、不同的相關係數下各指標的平均值 26 表 8、逐次檢定中各關聯程度的比例 28 表 9、不同的相關係數下各指標的平均值 28 表 10、燒燙傷病患: 變數說明 32 表 11、獨立性檢定的p值 33 表 12、入院類別與是否進入加護病房的次數分配表 35 表 13、是否有吸入性傷害與燒傷指數(BI)的次數分配表 36 表 14、性別與燒傷面積是否大於20% (D20) 的次數分配表 37 表 15、燒燙傷原因與入院類別的次數分配表 39 表 16、四個範例的各個衡量指標係數表 40 圖目錄 圖 1、實線與虛線分別代表w0檢定統計量和卡方(25)的機率密度曲線 45 圖 2、實線與虛線分別代表w1檢定統計量和卡方(16)的機率密度曲線 45 圖 3、實線與虛線分別代表w2檢定統計量和卡方(9)的機率密度曲線 46 圖 4、實線與虛線分別代表w3檢定統計量和卡方(4)的機率密度曲線 46 圖 5、實線與虛線分別代表w4檢定統計量和卡方(1)的機率密度曲線 47 圖 6- 1、在相關係數0時,w0分配與卡方(25)分配的比較 47 圖 6- 2、在相關係數0時,w1檢定統計量的機率密度曲線 48 圖 6- 3、在相關係數0時,w2檢定統計量的機率密度曲線 48 圖 6- 4、在相關係數0時,w3檢定統計量的機率密度曲線 49 圖 6- 5、在相關係數0時,w4檢定統計量的機率密度曲線 49 圖 7- 1、在相關係數0.3時,w0檢定統計量的機率密度曲線 50 圖 7- 2、在相關係數0.3時,w1分配與卡方(16)分配的比較 50 圖 7- 3、在相關係數0.3時,w2分配與卡方(9)分配的比較 51 圖 7- 4、在相關係數0.3時,w3檢定統計量的機率密度曲線 51 圖 7- 5、在相關係數0.3時,w4檢定統計量的機率密度曲線 52 圖 8- 1、在相關係數0.6時,w0檢定統計量的機率密度曲線 52 圖 8- 2、在相關係數0.6時,w1檢定統計量的機率密度曲線 53 圖 8- 3、在相關係數0.6時,w2分配與卡方(9)分配的比較 53 圖 8- 4、在相關係數0.6時,w3分配與卡方(4)分配的比較 54 圖 8- 5、在相關係數0.6時,w4檢定統計量的機率密度曲線 54 圖 9- 1、在相關係數0.9時,w0檢定統計量的機率密度曲線 55 圖 9- 2、在相關係數0.9時,w1檢定統計量的機率密度曲線 55 圖 9- 3、在相關係數0.9時,w2檢定統計量的機率密度曲線 56 圖 9- 4、在相關係數0.9時,w3檢定統計量的機率密度曲線 56 圖 9- 5、在相關係數0.9時,w4分配與卡方(1)分配的比較 57 |
參考文獻 |
1. Agresti, A. (2002), Categorical Data Analysis, 2nd. New York: John Wiley. 2. Alan, S., and J. Keith Ord (1994), Kendall's Advanced Theory of Statistics, Distribution Theory. 3. Chen C.C., Chen L.C., Wen B.S., Liu S.H., and Ma H.(2012), Objective estimates of the probability of death in acute burn injury : A Proposed Taiwan Burn Score. Journal of Trauma and Acute Care Surgery 73(6), 1581-1587. 4. Cramer, H. (1946), Mathematical Methods of Statistics. Princeton: Princeton University Press. 5. Jeffrey, S. S. (2003), Analyzing Categorical Data. Rajkamal Electric Press, New Delhi, India. 6. Kaeyoung, S., and Raghu, P. (2010), An Algorithm for Fast Generation of Bivariate Poisson Random Vectors. Journal on Computing 22(1), 81-92. 7. Norman, B. (2003), Analyzing quantitative data: From description to explanation. The Cromwell Press Ltd, Trowbridge, Wiltshire. 8. Sarelees N., A.K. Gupta (2006), Some bivariate gamma distributions. Applied Mathematics Letters 19, 767-774. 9. S. Kotz, N. Balakrishnan, N.L. Johnson (2000), Continuous Multivariate Distribution, Volume 1 : Models and Applications, 2nd edition, John Wiley and Sons, New York. 10. Zhu J.P, Chen L.C., and Tsai T.R. (2013), A Sequential Test for Investigating the Association Structure of Two Categorical Variables. (Submitted) |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信