önce M. AKÇA tarafından yazılmıştır. Merkezi Limit Teoremi

Merkezi Limit Teoremi

Merkezi Limit Teoremi şunu der: Bağımsız ve aynı dağılımı gösteren değişkenlerin toplamı ya da aritmatik ortalaması yaklaşık olarak normal dağılım halini alır. Fakat bu işlemin gerçekleşmesi için yeterli büyüklükte bir değişken uzayı büyüklüğüne sahip olmanız gerekmektedir.

Olasılıkta çekim gücü gösteren bir dağılım vardır. Ve ortalamalar belirli bir limitten sonra dağılım olarak bu dağılıma yakınsar. Dağılım ne şekilde olursa olsun n sayısı artış gösterdikçe limitte ortalaması μ olan bir standart dağılıma yakınsama gösterir.

Sn = X1 + … + X

Rassal değişkenlerin toplamı olmak üzere,

standartsapma

 

dağılım bu şekilde olacaktır. Matematiksel ispat yöntemleri için istatistik kitapları ya da Vikipedia daki kaynak incelenebilir. Burada matematiksel kısma girmeden Excel üzerinde devam edeceğim. n sayısı artış gösterdikçe ortalamalar normal dağılıma yaklaşmaktadır bu sayı 29 olarak düşünülmüştü fakat son zamanlarda 100 olması gerekliliği konusunda bir çok çevrelerce fikir birliği yaşanmaktadır. Bu sayının belirlenmesinde ana kütlenin çarpıklık göstermesi en önemli kriterdir.

Bu nedenle çıkarımsal istatistik yöntemlerinden bir tanesi olan Student-t dağılımı için istenen n>30 değeri de aslında bazı çalışmalarda* gösterilmiştir ki bu değerler aslında her durum için yeterli değil. Fakat bir çok durumda halen n>30 kriteri uygulanmaya devam etmektedir.

Bir motorun saniyedeki dönüş hızının ele alındığı ihtimal hesabının düzgün dağılıma uyduğunu düşünelim. Burdaki örnek motor hızı yerine 8 kenarlı bir zar gibi de düşünülebilir.

Saniyedeki Motor Dönüşü

Saniyedeki Motor Dönüşü

Olasılık dağılımı düzgün (uniform) dağılan bu deney. 10 kez tekrarlandığında dağılım şu şekilde olabilir. (Örnekler’de Excel’in RASTGELEARADA () fonksiyonu, ve “Özet Tablo ve Grafik” Özelliği kullanılmıştır.)

10 kez tekrarlandı

Deney 10 kez tekrarlandığında

Gördüğünüz gibi deney 10 kez tekrarlandığında bu deney sayısı küçük olduğu için dağılım kendi karakteristiğini gösteremedi. Peki deney 100 kez tekrarlansaydı durum nasıl olurdu diye baktığımızda biraz daha kararlı bir durumla karşılaimayı bekleyebiliriz. Fakat tesadüfi olarak daha kararsız bir durum da çıkabilir karşımıza:

100 kez tekrarlandı

Deney 100 kez tekrarlandığında

 

Deney 1000 kez tekrarlandığında durumu nasıl olur?

Deney 1000 kez tekrarlandığında

Deney 1000 kez tekrarlandığında

 

Peki deney 1.000.000 kez tekrarlandığında nasıl bir değer listesine sahip olacağım diye baktığımda ise son derece kararlı bir yapı ile karşılaşıyorum.

1000000 kez tekrarlandı

1000000 kez tekrarlanan deney ve kararlı durumu

 

Deney nekadar çok tekrarlanırsa, sapma eğilimi ve sapma durumu yüzdesi o kadar azalmaktadır.

Bir başka uç değer azalması da, ikili, üçlü ve dörtlü deney ortalamalarındaki aşırı uç değerlerinin azalarak normal dağılıma yaklaşmasında gözlemlenmektedir. Bu milyon kayıtlı rastgele değişkenlerden iki tane olduğunda bu İkili değerlerin ortalamasına baktığımızda şu şekilde bir grafikler karşılaşmaktayız:

ikili 1000000 kez tekrarlandı

 

 

üçlü 1000000 kez tekrarlandı

Aynı örneğe üçüncü bir rastgele örnek seti eklediğimizde dağılımın Gauss Eğri’sine daha da yaklaştığını görürüz.  n>30 olduktan sonra dağılımların ortalaması normal dağılıma daha da yaklaşmaktadır.

Merkezi limit teoreminin geçerliliği sadece sürekli değişkenlerle sınırlı değildir. Kesikli değişkenlerde de kullanılabilir.

Bu dağılım sadece uniform dağılım için geçerli bir durum olmayıp, altta farklı dağılım tarzları için n sayısının 1,2,3 ve 30 olma durumları gösterilmiştir.

Farklı Dağılım Tiplerine Gore Merkezi Limit Teoremi ve Normal Dağılıma Yaklaşım

Farklı Dağılım Tiplerine Gore Merkezi Limit Teoremi ve Normal Dağılıma Yaklaşım

 

Örneklem büyüklüğü değiştikçe dağılımın gelişimi alttaki grafikten de inceleyebilirsiniz:

Uniform Dağılımın Merkezi Limit Teoremi İle İncelenmesi

Uniform Dağılımın Merkezi Limit Teoremi İle İncelenmesi**

 

“Identification of Misconceptions in the Central Limit Theorem and Related Concepts and Evaluation of Computer Media as a Remedial Tool” Yu, Chong Ho ve Dr. John T. Behrens, Arizona State University ve Spencer Anthony, Univ. of Oklahoma: “American Educational Research Association” Yıllık Toplantısı için makale. Sunma tarihi: 19 Nisan, 1995 ve revizyon: 12 Şubat, 1997, CWisdom-rtf(Erişme:25.10.2007) + Marasinghe, M., Meeker, W., Cook, D. & Shin, T.S.(1994 August), “Using graphics and simulation to teach statistical concepts”, American Statistician Association’un, Toronto, Kanada 1994 yılı için yıllık konferansına sunulan bir makale.

**Farklı dağılımlarla ilgili gelişimi inceleyebileceğiniz bir program  http://www.vias.org/simulations/simusoft_cenlimit.html