2017/1/1

中央極限定理



丟骰子


丟一顆六個面的公平骰子,記錄每次出現的點數,重複無限多次,將出現次數對出現點數作圖,可以得到六個長條,每條等高。

將骰子增加到 10 顆,記錄這 10 顆骰子出現的所有點數取平均值,重複無限多次,將出現次數對點數平均值作圖,可得到左二圖形,左右對稱,中央約等於 3.5。

將骰子增加到 30 顆,然後 90 顆,可發現骰子數目越多,每次丟完之後所有骰子出現點數「平均值的分配」越向中間值 3.5 趨近。


中央極限定理


定理的概念是,當取樣夠多,樣本平均值的分配就會像常態分佈,而且這個常態分佈曲線的中央就會趨近於母群體的真正平均值,最神奇的是不管母群體的分配長怎樣,這個定理皆成立。

可由數學證明,當樣本數量在 30 個以上,樣本平均值的分配就足夠接近常態分佈。因此實務上,只要取 30 個以上的樣本,樣本平均值通常適用於以常態分配為前提的各種平均值檢定(independent t-test,ANOVA)