Makine Öğrenmesi

Veri Madenciliği (Data Mining) Aşamaları Nelerdir?

Data Mining, özellikle iş dünyasındaki  büyük verileri keşfetmek için dizayn edilmiş; değişkenler arasındaki ilişkileri ortaya çıkaran, desenleri ortaya çıkararak yeni ve anlamlı bilgiler oluşturan yöntemler sürecidir. En önemli amacı prediction/tahminlemedir. Aynı zamanda da tahminleme en yaygın data mining çeşididir ve iş dünyasındaki herhangi bir alanda bu çeşidin genellikle bir karşılığı bulunur. Söz konusu Data Mining prosesi üç ana adımdan oluşmaktadır: 1- İlk Keşfetme ...

Read More »

Kirpiler ve Tilkiler

Kirpiler ve Tilkiler “Hiçbir şey bireylere ya da gruplara tek hakikate sahip oldukları inancından daha büyük zarar veremez: Özellikle nasıl yaşanacağına, ne olunacağına ve ne yapılacağına dair hakikat – tek hakikate sahip olduğuna inananlara göre farklı olanlar hatalı değildir, onlar hain ya da delidir; ya kısıtlanmaları ya da bastırılmaları gerekmektedir. Sadece kendinin haklı olduğunu, hakikati gören sihirli bir göze sahip ...

Read More »

Kredi Skorlama Nedir?

Kredi Skorlama Finans dünyasında, tüketiciler satın alma ihtiyaçlarını karşılamak için düzenli olarak  kredi taleplerinde bulunurlar. Finansal kurum için kritik olan kredi için başvuranlar arasında iyi ve kötü olabilecekleri önceden başarılı bir şekilde öngörebilmektir. Bu problemi çözmeye odaklı en yaygın  çözüm ise Kredi Skorlaması’dır. Kredi skorlaması, karar modelleri ile karar modellerinin altında yatan teknolojilerin bütünüdür. Bu teknolojiler kim ne kadar kredi almalı gibi ...

Read More »

Churn Analizi ile Müşteri Kaybının Engellenmesi

Churn Analizi ya da Müşteri Kaybını Nasıl Engellerim? Araştırmalara göre günümüz rekabet koşullarında yeni müşteri kazanmak mevcut müşteriyi mutlu edip elde tutmaktan 5 ila 10 kat daha maliyetli. (Kotler and Keller. 2009. sf. 138)*  Bu gerçeğin farkında olan bir çok firma agresif satış politikası, gerilla tipi pazarlama gibi yöntemlerle birlikte mevcut müşterilerini memnun etme yolunu da seçmeye başladı. Son 5 yılda kazanılan müşterilerdeki ...

Read More »

Old Faithful

Dünyanın ilk ulusal parkı olma özelliğini taşıyan Yellowstone, Amerika’da yer alan ve 70 bin yıldır patlamak için bekleyen bir milli park. ‘Yellowstone Yanardağı’ bu parkın içinde yer alıyor. Parkın toplam büyüklüğü yaklaşık 8987 km2 büyüklüğünde. Dünyadali 10 bini aşan sıcak su kaynaklarının yarısı ve dünyanın en büyük Greyzer i de bu alan içersinde yer alıyor. Dünya genelindeki 1000 kadar gayzerin yaklaşık yarısı ...

Read More »

Excel Data Mining Add-Inn Parametreleri

Siz Data Mining Add-Inn ile bir model üzerinde çalışmaya başladığınızda, herhangi bir ayar yapmanıza gerek kalmadan Excel model için en iyi parametrelerle işlemine devam edebilir. Fakat ben bu işte çok iyiyim ve daha detaya müdahale etmek istiyorum derseniz. Excel Data Mining Add-Inn Parametreleri kısmına göz gezdirmeniz gerekecektir. Yeni bir model kurulurken alttaki gibi bir ekran karşımıza çıkar, bu: Cluster algoritması ...

Read More »

k-Means Kümeleme Algoritması Nedir?

En eski kümeleme algoritmalarından olan k-means, 1967 yılında J.B. MacQueen  tarafından geliştirilmiştir (MacQueen, 1967) * k-Means Kümeleme Algoritması Data Mining Dünyasında En Çok Kullanılan Algoritmaların başında yer almaktadır.  Kümeleme algoritmaları ile Sınıflandırma algoritmaları arasında bir takım farklılıklar bulunmaktadır. k-means algoritması bir kümeleme algoritmasıdır. Kümeleme algoritmaları otomatik olarak verileri daha küçük kümelere yada alt kümelere ayırmaya yarayan algoritmalardır. Algoritma istatistiksel olarak benzer nitelikteki ...

Read More »

Data Mining Dünyasında TOP 10 Algoritma

  “Knowledge and Information Systems” dergisinde yapılan bir değerlendirmede en popüler Data Mining algoritmaları hangisidir? sorusuna cevap verilmişti. Bu araştırma aslında bir KDD (Knowledge Discovery in Databases) konferasnsında düzenlenen yarışmada kazananlar arasında problemleri çözmede kullanılan algoritmalardan yola çıkılmış olup bu algoritmalar şunlardan oluşmaktadır: Machine Learning Algoritmaları: k-Nearest Neighbors Decision trees Naïve Bayes algorithm Support Vector Machines. AdaBoost   Tahminleme Algoritmaları ...

Read More »

CRISP Nedir?

  CRISP Veri Madenciliği için standart süreçlerin tanımlandığı bir modeldir. 90’lı yılların ortalarında bir konsorsiyum tarafından geliştirilmiştir. CRISP süreçlerini izleyerek herhangi bir alanda herhangi bir data mining yazılımı kullanarak işlem yapabilirsiniz. Data mining projelerinin daha etkili, daha hızlı, daha güvenilir ve daha az maliyetli olması için geliştirilmiştir. Aşamaları şunlardır; Business Understanding: İşi anlama safası olup, üzerinde işlem yapılan işin anlaşılmasıdır. ...

Read More »

En sık kullanılan istatistiksel analizler

İstatistiksel analizler bir çok bilimsel çalışmada, araştırmanın en önemli aşamasını oluşturmaktadır. Araştırmalarda çok sık görülen bir hata vardır: Araştırmacılar yanlış analiz yöntemi seçimi nedeniyle sonuçlarını hatalı hesaplar ya da herhangi bir sonuca ulaşamazlar. Verilerin sağlıklı bir şekilde analiz edilebilmesi için hangi şartlarda hangi analiz yöntemlerinin kullanılıyor olduğunu bilmek çok önemlidir.  Uygun olmayan bir yöntem seçimi verilerin hatalı yorumlanmasına neden olacaktır. Doğru ...

Read More »