önce M. AKÇA tarafından yazılmıştır. Sahte Korelasyonlar

Sahte Korelasyonlar

İstatistikle ilgilenen herkesin bilmesi gereken bir şey vardır: Korelasyon nedensellik değildir. Bir çok araştırmacı şu hataya düşer: İki ilişki arasında bir korelasyon varsa biri diğerinin sebebidir. Bu durum ise Sahte Korelasyonlar’ın oluşmasına sebebiyet verir.

Aslında Nedensellik ve Korelasyon birbirlerine bağlı kavramlardır. Nedensellikten bahsedebilmek için korelasyon olması gerekir fakat tek başına korelasyon bulunması yeterli değildir. Korelasyon nedensellik değildir fakat nedenselliğe daha ayrıntılı bakmamızı sağlayan bir araçtır.

İçersinde nedensellik bulunmayan ya da olması gerektiği gibi bulunmayan Sahte Korelasyon örneklerini iki başlıkta sınıflandırmayı uygun görüyorum.

 

Açıklanabilir Sahte Korelasyon Örnekleri

Bu tip korelasyonlar genellikle bir nedene bağlı olarak birlikte değişim gösteren olaylar sonrası oluşmaktadır. İki olayın bağlantılı olduğu ana bir neden vardır. Ve korelasyonlarda etkileyen-etkilenen şeklinde değil etkilenen-etkilenen iki değişkene bakılmaktadır.

 

Örnek1: Yazın Gelmesi

Bir şehirde yapılan dondurma satışları ile denizde boğulmalar arasında yüksek bir korelasyon bulunmaktadır. Burada  yazın artan yüzme ve serinleme ihtiyacının birlikte hareket etmesi sonucu dolaylı bağlantı bir korelasyon bulunmaktadır.

Bu örnekte Etki Eden Olay:Yazın Gelmesi Etkilenen Olaylar: Boğulma-Dondurma Satışı

dondurma ve boğulma

Fakat; Yazın Gelmesi-Boğulma ve Yazın Gelmesi-Dondurma Satışı korelasyonlarına bakılsaydı, bu iki değişkenden bir tanesi etki eden, diğeri etkilenen olacağından gösterilen korelasyon mantıklı bir nedensellik ürünü olacaktı.

 

Örnek 2: Sarhoşsun

Ayakkabı ile uyumakla baş ağrısı arasında bir korelasyon bulan çalışmada ayakkabı ile uyumanın aslında akşamdan kalma alkol kullanımı ile bağlantılı olduğu, baş ağrısının da yine alkole bağlı olarak arttığı gözlemlenmiştir.

Bu örnekte Etki Eden Olay:Sarhoş Olma Etkilenen Olaylar: Ayakkabı ile Uyuma-Baş Ağrısı ile Uyanma

Eğer Sarhoş Olma-Ayakkabı ile Uyuma ve Sarhoş Olma-Baş Ağrısı ile uyanma korelasyonlarına bakılsaydı buradaki korelasyon mantıklı bir nedensellik ürünü olacaktı.

 

Örnek 3: Yangın Var

Bir yangına müdahale eden itfaiyeci sayısı ile yangındaki maddi zarar arasında yine çok büyük bir korelasyon vardır. Bağlantı düşünüldüğünde sanki itfaiyeciler yangın yerine zarar veriyorlarmış gibi görünse de aslında durum, büyük yangınlarda fazla itfaiyeci çalışması ile ilgili bir durumdur.

Bu örnekte Etki Eden Olay:Yangının Büyüklüğü Etkilenen Olaylar: İtfaiyeci Sayısı-Maddi Zarar

Eğer Yangının Büyüklüğü-İtfaiyeci Sayısı ve Yangının Büyüklüğü-Maddi Zarar  korelasyonlarına bakılsaydı buradaki korelasyon mantıklı bir nedensellik ürünü olacaktı.

 

Örnek 4: Ekonomi Gelişti-1

İskandinavyada 19. ve 20. yüzyılda leylekler ve çocuklar üzerinde yapılan araştırmada. Leylek sayısı ile çocuk sayısı değişiminde çok ciddi bir korelasyon tesbit edilmiştir. Bu durum çocukları leyleklerin getirdiği önermesini kanıtlamaz. Ekonomik gelişme ile değişen doğa şartları ve yaşam biçimleri çocuk ve leylek sayısında bir azalma meydana getirmiştir.

Bu örnekte Etki Eden Olay:Ekonominin Gelişmesi Etkilenen Olaylar: Leylek Sayısı-Çocuk Sayısı

Eğer Ekonominin Gelişmesi-Leylek Sayısı  ve Ekonominin Gelişmesi-Çocuk Sayısı korelasyonlarına bakılsaydı buradaki korelasyon mantıklı bir nedensellik ürünü olacaktı.

 

Örnek 5: Ekonomi Gelişti-2

Polise bildirilen ihbar sayısı ile hava kirliliği arasındaki korelasyon, bu da yine hızlı şehirleşme sonucu genel suç oranı artışı ve hava kirliliğinin sonucudur.

Bu örnekte Etki Eden Olay:Ekonominin Gelişmesi Etkilenen Olaylar: İhbar Sayısı-Hava Kirliliği

Eğer Ekonominin Gelişmesi-İhbar Sayısı  ve Ekonominin Gelişmesi-Hava Kirliliği korelasyonlarına bakılsaydı buradaki korelasyon mantıklı bir nedensellik ürünü olacaktı.

Tamamen İlgisiz Olma Durumu

Ekran Resmi 2014-11-30 19.13.38Soldaki örnekte afyon üretimi grafiği ile Everest tepesinin biçim olarak benzerliği yer almaktadır. Bu örnek olaya biraz espritüel yaklaşmış olsa da bazı durumlarda tamamen ilgisiz iki durum tesadüfi olarak aynı korelasyonu gösterebilir. Bu durum genellikle iki değişkenin nedenselliğine bakmadan korelasyon değerlerinin hesaplanması sonucu oluşmaktadır.

http://tylervigen.com/ internet sitesinde bu durumun bir çok örneği bulunmaktadır. Tesadüfi olarak bir araya getirilen veri setleri bazen ilginç korelasyonlar da meydana getirmektedir.

Bir ilişkinin olup olmadığını söylemek son derece subjektif bir durumdur ve önce korelasyon bulunup sonra nedenselliğe gitmemek gerekir.