§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0707201017495800
DOI 10.6846/TKU.2010.00226
論文名稱(中文) 中央極限定理應用於偏斜分布時樣本大小之探討
論文名稱(英文) A study on proper sample size for the use of the Central Limit Theorem on skewed distributions.
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 數學學系碩士班
系所名稱(英文) Department of Mathematics
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 98
學期 2
出版年 99
研究生(中文) 許力升
研究生(英文) Li-Sheng Hsu
學號 697190469
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2010-06-18
論文頁數 39頁
口試委員 指導教授 - 鄭惟厚
委員 - 趙晨慶
委員 - 吳漢銘
關鍵字(中) 樣本大小
中央極限定理
偏斜分布
關鍵字(英) Sample size
Central limit theorem
Skewed distribution
第三語言關鍵字
學科別分類
中文摘要
在統計的應用上,想要對母體平均數 做區間估計及檢定時,需要用到樣本平均數 之抽樣分布,通常需要依賴中央極限定理來得到。然而中央極限定理是一個極限結果,在實際應用時必須樣本數 n「足夠大」才適用,怎樣是「足夠大」卻無定論。
    怎樣的 n 才適用中央極限定理,其中以 n 大於或等於30似被較多教科書採用。然而對於很偏的 (skewed) 分布來說, n 等於30或40時若應用中央極限定理,會不會得出一些誤導的結論?這是我們在本文所探討的問題。
    本論文將利用電腦模擬方式,探討在不對稱分布情況下,隨著樣本數 n 的變動,應用中央極限定理的結果會如何。所討論的分布以 gamma 分布、混合常態的雙峰 (bimodal) 分布及伯努利 (Bernoulli) 分布為主。討論的結果發現,當我們用樣本標準差 S 代替母體標準差  並應用中央極限定理計算信賴區間及處理檢定問題時,信賴係數及顯著水準 並不如我們的預期。另外我們在討論中央極限定理應用於離散型的二項分布時發現,當 p 值很小或很大的情況下,即使滿足書上建議 np 與 n(1-p) 同時大於或等於5甚至10時,在估計 p 的信賴區間之信賴係數時,也有一些問題必須注意。
英文摘要
When we make statistical inferences about the population mean based on the sample mean  , we often rely on the central limit theorem to obtain the (approximate)sampling distribution of  . The central limit theorem is an asymptotic result, hence the sample size   has to be sufficiently large for the application to be appropriate. Yet there does not seem to be much discussion on how large qualifies for “sufficiently large”.
General suggestions have been made which include, for example,  ,   or  . But we do know that if the population distribution is very skewed, then it takes bigger sample size for the distribution of the sample mean   to be close to normal distribution. We would like to explore in more details about the appropriateness of the application of the central limit theorem under these circumstances.
We used computer to simulate random samples from gamma, mixed normal and Bernoulli distributions and found that when the population standard deviation is unknown and has to be replaced by the sample standard deviation, cautions have to be taken when one applies the central limit theorem and makes decisions based on the result of the inferences, because the significant levels and confidence coefficients may not be what we expected.
第三語言摘要
論文目次
1. 緒論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1 前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 文獻探討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
 
2. X¯ 
的抽樣分布  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.1 母體為 gamma  分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.2 母體為混和常態分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
 
3. 應用中央極限定理於有限樣本 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.1 在偏斜分布下, 探討以 S 估計 σ 之表現 . . . . . . . . . . . . . . . . . 15

3.2 信賴區間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4. 中央極限定理應用於二項分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

5. 結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

參考文獻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
 
表目錄


表 3.1-1 : 10000 次模擬所得 S 之平均數 S¯  及標準差 SES . . . . . . . . 15
表 3.1-2 : 10000 次模擬所得 S 之平均數 S¯  及標準差 SES   :
mixed normal(p = 0.9, µ1  = −2, σ2  = 0.36, µ2  = 0.8, σ2  = a)   . . 20
表 3.1-3 : 10000 次模擬所得 S 之平均數 S¯  及標準差 SES   . . . . . . . 20 
表 3.2-1 : 10000 次模擬所得之信賴係數  . . . . . . . . . . . . . . . . . . . . . . . . . 28 
表 3.2-2 : 10000 次模擬所得 S 之平均數 S¯  及標準差 SES   :
mixed normal(p = 0.9, µ1  = −2, σ2  = 0.36, µ2  = 0.8, σ2  = a)   . . 29
表 3.2-3 : X1 . . . Xn ∼ gamma(1, 0.5) ,10000 次模擬標準差
S 低估母體標準差 σ 的比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
表 3.3-1 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 
表 3.3-2 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 
表 3.3-3 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 
表 3.3-4 : 檢定母體平均數, 在 α = 0.05 之下, 10000 次模擬 所得的拒絕比例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 
表 4-1 : Bin(n, 0.05) 的 10000 次模擬所得之信賴係數  . . . . . . . . . . 35 
表 4-2 : Bin(n, 0.05) 的 10000 次模擬所得之信賴係數  . . . . . . . . . . 36
 
圖目錄


圖 2.1-1 : X1 . . . Xn ∼ Gamma(1, 0.5) , 模擬 10000 次所得 X¯ 直方圖與 N (2, 4/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 
圖 2.1-2 : X1 . . . Xn ∼ Gamma(2, 0.5) , 模擬 10000 次所得 X¯ 直方圖與 N (4, 8/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 
圖 2.1-3 : X1 . . . Xn ∼ Gamma(1, 2) , 模擬 10000 次所得 X¯
直方圖與 N (0.5, 1/4n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 
圖 2.1-4 : Gamma(α, β) 機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 
圖 2.2-1: mixed normal(p = 0.9, µ1  = −2, σ2  = 0.36, µ2  =
0.8, σ2  = a) 機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
圖 2.2-2: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2  = 0.36, µ2  = 0.8, σ2  = 0.04) , 模擬 10000 次所得 X¯ 
之直方圖與N (−1.72, 1.0336/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
圖 2.2-3: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2  = 0.36, µ2  = 0.8, σ2  = 0.16) , 模擬 10000 次所得 X¯
之直方圖與N (−1.72, 1.0456/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
圖 2.2-4: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2  = 0.36, µ2  = 0.8, σ2  = 0.36) , 模擬 10000 次所得 X¯之直方圖與N (−1.72, 1.0656/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
圖 2.2-5: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2  = 0.36, µ2  = 0.8, σ2  = 0.64) , 模擬 10000 次所得 X¯之直方圖與N (−1.72, 1.0936/n) 的機率密度圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
圖 3.1-1: X1 . . . Xn ∼ gamma(1, 0.5),   σ = 2 ,10000 次模擬得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
圖 3.1-2: X1 . . . Xn ∼ gamma(2, 0.5),   σ = 2.828 ,10000 次擬所得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
圖 3.1-3: X1 . . . Xn ∼ gamma(1, 2),   σ = 0.5 ,10000 次模擬得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
圖 3.1-4: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2
= 0.36, µ2  = 0.8, σ2  = 0.04),   σ = 1.017 ,10000 次模擬
得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
圖 3.1-5: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2
= 0.36, µ2  = 0.8, σ2  = 0.16),   σ = 1.023 ,10000 次模擬所o之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
圖 3.1-6: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2
= 0.36, µ2  = 0.8, σ2  = 0.36),   σ = 1.032 ,10000 次模擬
得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
圖 3.1-7: X1 . . . Xn ∼ mixed normal(p = 0.9, µ1  = −2, σ2
= 0.36, µ2  = 0.8, σ2  = 0.64),   σ = 1.046 ,10000 次模擬
得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
圖 3.1-8: X1 . . . Xn ∼ N (µ = 0, σ2  = 1),   σ = 1 ,10000 次擬所得之 S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
圖 3.1-9: X1 . . . Xn ∼ U (0, 1),   σ = 0.289 ,10000 次模擬所得S 直方圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
 圖 4-1: Bin(n, p) 確實直方圖與 N (µ = np, σ2  = np(1 − p)) 率密度曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
參考文獻
1  Conover,  W.  J. (1999),  ”Practical nonparametric  statistics,”  3rd ed., John  Wiley  and Sons, New York.

2  Devore J. L. (2008), ”Probability and statistics  for engineering and the sciences,” 7th ed., Thomson,  Toronto.

3  Groeneveld, R.  A.  (1991), ”An  influence function approach to de- scribing the skewness of a distribution,” The American  Statistician,
45(2), 97-102.


4  Hogg,  R.  V.  and Tanis, E. A.  (2006),  ”Probability and statistical inference,” 7th ed., Prentice  Hall,  New Jersey.

5  Le  Cam,  L.(1986), ”The  central limit  theorem around 1935,” Sta- tistical Science,  1(1),  78-96.

6  Maine M.,  Boullion  T. and Rizzuto G.  T. (1991)  ”Detecting  the number of components in a finite mixture  having  normal compo- nents,” , 20(2), 611-620

7  Roussas,  G.  G.(2002),  ”A  course in mathematical  statistics,” 2nd ed., Elsevier,  Singapore.

8  Ramachandran K.  M.  and  Tsokos   C.   P. (2009)  ”Mathematical Statistics with  Applications,” Elsevier,  Singapore.   United  States of America.

9  Schilling M. F.,  Watkins  A.  E.,  and Watkins  W. (2002) ”Is  human height bimodal?”  The American  Statistician, 56(3), 223-229.
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信