淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-0707201017495800
中文論文名稱 中央極限定理應用於偏斜分布時樣本大小之探討
英文論文名稱 A study on proper sample size for the use of the Central Limit Theorem on skewed distributions.
校院名稱 淡江大學
系所名稱(中) 數學學系碩士班
系所名稱(英) Department of Mathematics
學年度 98
學期 2
出版年 99
研究生中文姓名 許力升
研究生英文姓名 Li-Sheng Hsu
學號 697190469
學位類別 碩士
語文別 中文
口試日期 2010-06-18
論文頁數 39頁
口試委員 指導教授-鄭惟厚
委員-趙晨慶
委員-吳漢銘
中文關鍵字 樣本大小  中央極限定理  偏斜分布 
英文關鍵字 Sample size  Central limit theorem  Skewed distribution 
學科別分類 學科別自然科學數學
中文摘要 在統計的應用上,想要對母體平均數 做區間估計及檢定時,需要用到樣本平均數 之抽樣分布,通常需要依賴中央極限定理來得到。然而中央極限定理是一個極限結果,在實際應用時必須樣本數 n「足夠大」才適用,怎樣是「足夠大」卻無定論。
怎樣的 n 才適用中央極限定理,其中以 n 大於或等於30似被較多教科書採用。然而對於很偏的 (skewed) 分布來說, n 等於30或40時若應用中央極限定理,會不會得出一些誤導的結論?這是我們在本文所探討的問題。
本論文將利用電腦模擬方式,探討在不對稱分布情況下,隨著樣本數 n 的變動,應用中央極限定理的結果會如何。所討論的分布以 gamma 分布、混合常態的雙峰 (bimodal) 分布及伯努利 (Bernoulli) 分布為主。討論的結果發現,當我們用樣本標準差 S 代替母體標準差 並應用中央極限定理計算信賴區間及處理檢定問題時,信賴係數及顯著水準 並不如我們的預期。另外我們在討論中央極限定理應用於離散型的二項分布時發現,當 p 值很小或很大的情況下,即使滿足書上建議 np 與 n(1-p) 同時大於或等於5甚至10時,在估計 p 的信賴區間之信賴係數時,也有一些問題必須注意。
英文摘要 When we make statistical inferences about the population mean based on the sample mean , we often rely on the central limit theorem to obtain the (approximate)sampling distribution of . The central limit theorem is an asymptotic result, hence the sample size has to be sufficiently large for the application to be appropriate. Yet there does not seem to be much discussion on how large qualifies for “sufficiently large”.
General suggestions have been made which include, for example, , or . But we do know that if the population distribution is very skewed, then it takes bigger sample size for the distribution of the sample mean to be close to normal distribution. We would like to explore in more details about the appropriateness of the application of the central limit theorem under these circumstances.
We used computer to simulate random samples from gamma, mixed normal and Bernoulli distributions and found that when the population standard deviation is unknown and has to be replaced by the sample standard deviation, cautions have to be taken when one applies the central limit theorem and makes decisions based on the result of the inferences, because the significant levels and confidence coefficients may not be what we expected.
論文目次 1. 緒論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1 前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 文獻探討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2. X‾
的抽樣分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.1 母體為 gamma 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.2 母體為混和常態分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3. 應用中央極限定理於有限樣本 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.1 在偏斜分布下, 探討以 S 估計 σ 之表現 . . . . . . . . . . . . . . . . . 15

3.2 信賴區間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4. 中央極限定理應用於二項分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

5. 結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

參考文獻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

表目錄


表 3.1-1 : 10000 次模擬所得 S 之平均數 S‾ 及標準差 SES . . . . . . . . 15
表 3.1-2 : 10000 次模擬所得 S 之平均數 S‾ 及標準差 SES :
mixed normal(p = 0.9, µ1 = −2, σ2 = 0.36, µ2 = 0.8, σ2 = a) . . 20
表 3.1-3 : 10000 次模擬所得 S 之平均數 S‾ 及標準差 SES . . . . . . . 20
表 3.2-1 : 10000 次模擬所得之信賴係數 . . . . . . . . . . . . . . . . . . . . . . . . . 28
表 3.2-2 : 10000 次模擬所得 S 之平均數 S‾ 及標準差 SES :
mixed normal(p = 0.9, µ1 = −2, σ2 = 0.36, µ2 = 0.8, σ2 = a) . . 29
表 3.2-3 : X1 . . . Xn ∼ gamma(1, 0.5) ,10000 次模擬標準差
S 低估母體標準差 σ 的比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
表 3.3-1 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
表 3.3-2 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
表 3.3-3 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
表 3.3-4 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
表 4-1 : Bin(n, 0.05) 的 10000 次模擬所得之信賴係數 . . . . . . . . . . 35
表 4-2 : Bin(n, 0.05) 的 10000 次模擬所得之信賴係數 . . . . . . . . . . 36

圖目錄


圖 2.1-1 : X1 . . . Xn ∼ Gamma(1, 0.5) , 模擬 10000 次所得 X‾ 直方圖與 N (2, 4/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
圖 2.1-2 : X1 . . . Xn ∼ Gamma(2, 0.5) , 模擬 10000 次所得 X‾ 直方圖與 N (4, 8/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
圖 2.1-3 : X1 . . . Xn ∼ Gamma(1, 2) , 模擬 10000 次所得 X‾
直方圖與 N (0.5, 1/4n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
圖 2.1-4 : Gamma(α, β) 機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
圖 2.2-1: mixed normal(p = 0.9, µ1 = −2, σ2 = 0.36, µ2 =
0.8, σ2 = a) 機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
圖 2.2-2: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2 = 0.36, µ2 = 0.8, σ2 = 0.04) , 模擬 10000 次所得 X‾
之直方圖與N (−1.72, 1.0336/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
圖 2.2-3: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2 = 0.36, µ2 = 0.8, σ2 = 0.16) , 模擬 10000 次所得 X‾
之直方圖與N (−1.72, 1.0456/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
圖 2.2-4: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2 = 0.36, µ2 = 0.8, σ2 = 0.36) , 模擬 10000 次所得 X‾之直方圖與N (−1.72, 1.0656/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
圖 2.2-5: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2 = 0.36, µ2 = 0.8, σ2 = 0.64) , 模擬 10000 次所得 X‾之直方圖與N (−1.72, 1.0936/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
圖 3.1-1: X1 . . . Xn ∼ gamma(1, 0.5), σ = 2 ,10000 次模擬得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
圖 3.1-2: X1 . . . Xn ∼ gamma(2, 0.5), σ = 2.828 ,10000 次擬所得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
圖 3.1-3: X1 . . . Xn ∼ gamma(1, 2), σ = 0.5 ,10000 次模擬得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
圖 3.1-4: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2
= 0.36, µ2 = 0.8, σ2 = 0.04), σ = 1.017 ,10000 次模擬
得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
圖 3.1-5: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2
= 0.36, µ2 = 0.8, σ2 = 0.16), σ = 1.023 ,10000 次模擬所o之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
圖 3.1-6: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2
= 0.36, µ2 = 0.8, σ2 = 0.36), σ = 1.032 ,10000 次模擬
得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
圖 3.1-7: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1 = −2, σ2
= 0.36, µ2 = 0.8, σ2 = 0.64), σ = 1.046 ,10000 次模擬
得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
圖 3.1-8: X1 . . . Xn ∼ N (µ = 0, σ2 = 1), σ = 1 ,10000 次擬所得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
圖 3.1-9: X1 . . . Xn ∼ U (0, 1), σ = 0.289 ,10000 次模擬所得S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
圖 4-1: Bin(n, p) 確實直方圖與 N (µ = np, σ2 = np(1 − p)) 率密度曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

參考文獻 1 Conover, W. J. (1999), ”Practical nonparametric statistics,” 3rd ed., John Wiley and Sons, New York.

2 Devore J. L. (2008), ”Probability and statistics for engineering and the sciences,” 7th ed., Thomson, Toronto.

3 Groeneveld, R. A. (1991), ”An influence function approach to de- scribing the skewness of a distribution,” The American Statistician,
45(2), 97-102.


4 Hogg, R. V. and Tanis, E. A. (2006), ”Probability and statistical inference,” 7th ed., Prentice Hall, New Jersey.

5 Le Cam, L.(1986), ”The central limit theorem around 1935,” Sta- tistical Science, 1(1), 78-96.

6 Maine M., Boullion T. and Rizzuto G. T. (1991) ”Detecting the number of components in a finite mixture having normal compo- nents,” , 20(2), 611-620

7 Roussas, G. G.(2002), ”A course in mathematical statistics,” 2nd ed., Elsevier, Singapore.

8 Ramachandran K. M. and Tsokos C. P. (2009) ”Mathematical Statistics with Applications,” Elsevier, Singapore. United States of America.

9 Schilling M. F., Watkins A. E., and Watkins W. (2002) ”Is human height bimodal?” The American Statistician, 56(3), 223-229.
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2010-07-22公開。
  • 同意授權瀏覽/列印電子全文服務,於2010-07-22起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2281 或 來信