Başarısızlığın Örneklendirilmemesi

Herhangi bir stratejiyi deneyen kaç şirket, bu strateji nedeniyle başarılı oldu? Sorusu gerçekten o stratejinin işe yarayıp yaramadığı hakkında bize bir izlenim verebilir. Sorun şu ki, herhangi bir nedenle başarı yakalayamamış bir şirket, ayakta kalamayacağı için gözlem altına alınan inceleme gruplarında yer almaz. Oxford’da Strateji profosoru olan Jerker Denrell buna başarısızlığın örneklendirilmemesi diyor. *Örneğimizi strateji ile değil sonuçla incelediğimizden başarılı ...

Read More »

Data Mining Dünyasında TOP 10 Algoritma

  “Knowledge and Information Systems” dergisinde yapılan bir değerlendirmede en popüler Data Mining algoritmaları hangisidir? sorusuna cevap verilmişti. Bu araştırma aslında bir KDD (Knowledge Discovery in Databases) konferasnsında düzenlenen yarışmada kazananlar arasında problemleri çözmede kullanılan algoritmalardan yola çıkılmış olup bu algoritmalar şunlardan oluşmaktadır: Machine Learning Algoritmaları: k-Nearest Neighbors Decision trees Naïve Bayes algorithm Support Vector Machines. AdaBoost   Tahminleme Algoritmaları ...

Read More »

ETL Nedir?

ETL;  Extract, Transform ve Load kelimelerinin baş harflerinden oluşmaktadır. ETL genel anlamda verilerin seçilmesi ve işe yarar bir şekilde uygun başka bir yerde depolanması sistematiğidir. Günümüzde çok sayıda dağıtık kaynaklardan gelen verilerin tek bir şablonda, kurallara uygun olarak biriktirilmesi önem arz etmektedir. Bir data science uzmanının çok iyi ETL bilgisine sahip olması beklenir. Eğer veriyi alınması gerektiği yerden alınması gereken formatta ...

Read More »

CRISP Nedir?

  CRISP Veri Madenciliği için standart süreçlerin tanımlandığı bir modeldir. 90’lı yılların ortalarında bir konsorsiyum tarafından geliştirilmiştir. CRISP süreçlerini izleyerek herhangi bir alanda herhangi bir data mining yazılımı kullanarak işlem yapabilirsiniz. Data mining projelerinin daha etkili, daha hızlı, daha güvenilir ve daha az maliyetli olması için geliştirilmiştir. Aşamaları şunlardır; Business Understanding: İşi anlama safası olup, üzerinde işlem yapılan işin anlaşılmasıdır. ...

Read More »

En sık kullanılan istatistiksel analizler

İstatistiksel analizler bir çok bilimsel çalışmada, araştırmanın en önemli aşamasını oluşturmaktadır. Araştırmalarda çok sık görülen bir hata vardır: Araştırmacılar yanlış analiz yöntemi seçimi nedeniyle sonuçlarını hatalı hesaplar ya da herhangi bir sonuca ulaşamazlar. Verilerin sağlıklı bir şekilde analiz edilebilmesi için hangi şartlarda hangi analiz yöntemlerinin kullanılıyor olduğunu bilmek çok önemlidir.  Uygun olmayan bir yöntem seçimi verilerin hatalı yorumlanmasına neden olacaktır. Doğru ...

Read More »

Bir Veri Bilimci (Data Scientist) Hangi Yeteneklere Sahip Olmalıdır?

Bir Veri Bilimi (Data Science) kariyeri yapmak istiyorsanız bazı yetkinliklere sahip olmanız beklenmektedir. Üç safhada ele alınabilecek bu yetkinlikler şunlardır: VERİYİ ELDE ETME Programlama ve Veri Tabanı Becerileri İlk önce mutlaka Java, Pyhton gibi programlama dillerine aşina olmalı ve SQL bilgisine mutlaka sahip olmaldır. Denileiblir ki başlangıç için veriyi elde etmek ve nasıl elde edeceğini bilmek temel düzeyde en önemli ...

Read More »

İstatistiksel Veri Tipleri

İstatistikte yorumlamak ve sunmak amacı ile toplanmış, özetlenmiş ölçüm,bilgi ve belgelere genel olarak veri denilmektedir. İşlenmiş ve sonuç çıkarılmış veriye bilgi ya da enformasyon denir. Veri tipleri ise şu başlıklarda toplanabilir: 1. BAKIŞ AÇISI 1- Nümerik Veriler: Sayısal-Nümerik-Nicel Veriler de denmektedir. Boy,Yaş gibi süreklilik arzeden değerler Nümerik verilerdir. “Daha fazla” ifadesi ile kullanılabilirler. Sürekli ve süreksiz olarak iki başlıkta ele alınabilir: a) ...

Read More »

Excel ile RFM Analizi

RFM analizi pazarlama’da çok kullanılan bir analiz yöntemidir. Genellikle müşteri segmentasyonu için kullanılmaktadır. RFM; Recency, Frequency, Monetary kelimelerinin baş harflerinden oluşur. Recency: Müşterinin son işlem güncelliğini belirtmektedir. Frequency: İşlem sıklığının ölçüsüdür. Monetary ise müşterinin harcadığı toplam paradır. Müşteri satın alma davranışını özetlemek için RFM Analizlerine ihtiyaç duyarız.  Özet olarak bu davranışları ERP programları gibi veri kaynaklarından çekebiliriz. Daha büyük yapılarda ...

Read More »

Kısmi Korelasyon

Kısmi Korelasyon terimi ilk kez 1907 yılında Yule tarafından kullanılmıştır. Korelasyon hesaplamalarında bazı durumlarda değişkenler bir birlerinden etkilenebilirler. Söz gelimi insan boyu ile insan saçı arasında bir korelasyon üzerinde çalıştığımızda analizimizde sadece saç ve boy değişkenleri ile ilgilenir isek kısa boylu insanların uzun saçlı olduğuna karar verebiliriz.  Bu durum ilk bakışta biraz saçma gibi görülse de dünya genelinde kadınların boy ortalamalarının ...

Read More »

Normal Dağılım Nedir?

Normal Dağılım istatistikteki en önemli konulardan biridir. Sürekli Dağılım türlerinden biridir ve pratikte bir çok durumda verilerin Normal Dağılım gösteren bir ana kütleden geldiği varsayılır. Bunun nedeni doğa ve insan davranışlarının genelinin Normal Dağılıma uygun olmasıdır. Örnek vermek gerekirse: – İnsanların çoğu ortalama bir boya sahiptir. Ülkemizdeki erkekleri ele alacak olursak çok azı 1.90 üzeridir. Geneli 1.70-1.75 arasında bir boya sahiptir ...

Read More »