önce M. AKÇA tarafından yazılmıştır. Old Faithful

Old Faithful

Dünyanın ilk ulusal parkı olma özelliğini taşıyan Yellowstone, Amerika’da yer alan ve 70 bin yıldır patlamak için bekleyen bir milli park. ‘Yellowstone Yanardağı’ bu parkın içinde yer alıyor. Parkın toplam büyüklüğü yaklaşık 8987 km2 büyüklüğünde. Dünyadali 10 bini aşan sıcak su kaynaklarının yarısı ve dünyanın en büyük Greyzer i de bu alan içersinde yer alıyor. Dünya genelindeki 1000 kadar gayzerin yaklaşık yarısı Amerika Birleşik Devletleri’ndeki Yellow Stone Milli Parkı’nda bulunuyor.*

Sıcak su fışkırtan kaynaklardan en önemlisi olan Old Faithful günün farklı saatlerinde farklı miktarlarda sıcak su ve buhar fışkırtıyor.

Patlama süreleri 1,5 dakika ile 5 dakika arasında değişebiliyor.  32 metre – 56 metre arasında değişen yüksekliklerde patlamalar olabilir (Ortalama 44 metre). Bu patlamalar 14000 – 32000 L arasında değişen büyüklüklerde patlamalar olabilir.Patlamalar arası 45 ile 125 dakika arasında değişmektedir. Ortalama 66,5 dakikadır. (1939 yılında yapılan bir çalışmaya göre)

Bu patlamayla ilgili 272 patlama gözlemini not etmiş ve iki değişken ile bir data seti oluşturulmuştur.
Old Faithful
Old Faithful Geyser Data denilen bu veri setine buradan ulaşabilirsiniz: Old Faithful Grayser Data
272 adet verinin ortalama sürme süresi 3,488  ve bir sonraki patlamayı bekleme süresi ise 70,897’dir. İki değişkenli bu verinin Korelasyon‘una baktığımızda (Excel’in Korelasyon Fonksiyonu) bu değerin %90 gibi yüksek bir değer olduğunu görürüz. Yan taraftaki grafik ise bu değerlerin korelasyon grafiğidir.

 

korelasyon

 

Korelasyon’un yüksek olması, bize büyük patlamalardan sonra uzun aralar verildiğini söylemektedir. Öyle ise patlamaları büyük ve küçük patlamalar şeklinde iki ayrı grupta incelemek mümkündür.

Bu ayrımı yapabilmek için Excel Datamining programı ve Kümeleme Algoritması kullanarak Old Faithful Geyser Data‘yı  şu ayarlamalarla büyük ve küçük patlamalar olarak iki gruba ayırabiliriz:

Program parametrelerinden  küme sayısını, iki ayrı grupta ele alacağım için ikiye indirilm Ayrıca algoritma tipi olarak da k-means kümeleme algoritması‘nı kullandım. Bu ayarlamalar yapıldıktan sonra veri setimiz iki parçaya bölünmüş olarak buldum ve sonucunda Excel üzerinde yaptığım bir kaç grafik işlemi ile şu grafiği elde ettim:

Old Faithful Data Seti Kümeleme

Old Faithful Data Seti Kümeleme Algoritması

Net bir şekilde ikiye bölünen ve grup isimleri ile işaretlenen veri setimi artık büyük patlamalar ve küçük patlamalar olarak iki ayrı grupta ele alabilirim.

 

*http://www.bilimgenc.tubitak.gov.tr/makale/gayzerler