Monthly Archives: September 2014

Data Mining Dünyasında TOP 10 Algoritma

  “Knowledge and Information Systems” dergisinde yapılan bir değerlendirmede en popüler Data Mining algoritmaları hangisidir? sorusuna cevap verilmişti. Bu araştırma aslında bir KDD (Knowledge Discovery in Databases) konferasnsında düzenlenen yarışmada kazananlar arasında problemleri çözmede kullanılan algoritmalardan yola çıkılmış olup bu algoritmalar şunlardan oluşmaktadır: Machine Learning Algoritmaları: k-Nearest Neighbors Decision trees Naïve Bayes algorithm Support Vector Machines. AdaBoost   Tahminleme Algoritmaları ...

Read More »

ETL Nedir?

ETL;  Extract, Transform ve Load kelimelerinin baş harflerinden oluşmaktadır. ETL genel anlamda verilerin seçilmesi ve işe yarar bir şekilde uygun başka bir yerde depolanması sistematiğidir. Günümüzde çok sayıda dağıtık kaynaklardan gelen verilerin tek bir şablonda, kurallara uygun olarak biriktirilmesi önem arz etmektedir. Bir data science uzmanının çok iyi ETL bilgisine sahip olması beklenir. Eğer veriyi alınması gerektiği yerden alınması gereken formatta ...

Read More »

CRISP Nedir?

  CRISP Veri Madenciliği için standart süreçlerin tanımlandığı bir modeldir. 90’lı yılların ortalarında bir konsorsiyum tarafından geliştirilmiştir. CRISP süreçlerini izleyerek herhangi bir alanda herhangi bir data mining yazılımı kullanarak işlem yapabilirsiniz. Data mining projelerinin daha etkili, daha hızlı, daha güvenilir ve daha az maliyetli olması için geliştirilmiştir. Aşamaları şunlardır; Business Understanding: İşi anlama safası olup, üzerinde işlem yapılan işin anlaşılmasıdır. ...

Read More »

En sık kullanılan istatistiksel analizler

İstatistiksel analizler bir çok bilimsel çalışmada, araştırmanın en önemli aşamasını oluşturmaktadır. Araştırmalarda çok sık görülen bir hata vardır: Araştırmacılar yanlış analiz yöntemi seçimi nedeniyle sonuçlarını hatalı hesaplar ya da herhangi bir sonuca ulaşamazlar. Verilerin sağlıklı bir şekilde analiz edilebilmesi için hangi şartlarda hangi analiz yöntemlerinin kullanılıyor olduğunu bilmek çok önemlidir.  Uygun olmayan bir yöntem seçimi verilerin hatalı yorumlanmasına neden olacaktır. Doğru ...

Read More »

Bir Veri Bilimci (Data Scientist) Hangi Yeteneklere Sahip Olmalıdır?

Bir Veri Bilimi (Data Science) kariyeri yapmak istiyorsanız bazı yetkinliklere sahip olmanız beklenmektedir. Üç safhada ele alınabilecek bu yetkinlikler şunlardır: VERİYİ ELDE ETME Programlama ve Veri Tabanı Becerileri İlk önce mutlaka Java, Pyhton gibi programlama dillerine aşina olmalı ve SQL bilgisine mutlaka sahip olmaldır. Denileiblir ki başlangıç için veriyi elde etmek ve nasıl elde edeceğini bilmek temel düzeyde en önemli ...

Read More »

İstatistiksel Veri Tipleri

İstatistikte yorumlamak ve sunmak amacı ile toplanmış, özetlenmiş ölçüm,bilgi ve belgelere genel olarak veri denilmektedir. İşlenmiş ve sonuç çıkarılmış veriye bilgi ya da enformasyon denir. Veri tipleri ise şu başlıklarda toplanabilir: 1. BAKIŞ AÇISI 1- Nümerik Veriler: Sayısal-Nümerik-Nicel Veriler de denmektedir. Boy,Yaş gibi süreklilik arzeden değerler Nümerik verilerdir. “Daha fazla” ifadesi ile kullanılabilirler. Sürekli ve süreksiz olarak iki başlıkta ele alınabilir: a) ...

Read More »

Excel ile RFM Analizi

RFM analizi pazarlama’da çok kullanılan bir analiz yöntemidir. Genellikle müşteri segmentasyonu için kullanılmaktadır. RFM; Recency, Frequency, Monetary kelimelerinin baş harflerinden oluşur. Recency: Müşterinin son işlem güncelliğini belirtmektedir. Frequency: İşlem sıklığının ölçüsüdür. Monetary ise müşterinin harcadığı toplam paradır. Müşteri satın alma davranışını özetlemek için RFM Analizlerine ihtiyaç duyarız.  Özet olarak bu davranışları ERP programları gibi veri kaynaklarından çekebiliriz. Daha büyük yapılarda ...

Read More »