Alan

Excel Data Mining Add-Inn Parametreleri

Siz Data Mining Add-Inn ile bir model üzerinde çalışmaya başladığınızda, herhangi bir ayar yapmanıza gerek kalmadan Excel model için en iyi parametrelerle işlemine devam edebilir. Fakat ben bu işte çok iyiyim ve daha detaya müdahale etmek istiyorum derseniz. Excel Data Mining Add-Inn Parametreleri kısmına göz gezdirmeniz gerekecektir. Yeni bir model kurulurken alttaki gibi bir ekran karşımıza çıkar, bu: Cluster algoritması ...

Read More »

k-Means Kümeleme Algoritması Nedir?

En eski kümeleme algoritmalarından olan k-means, 1967 yılında J.B. MacQueen  tarafından geliştirilmiştir (MacQueen, 1967) * k-Means Kümeleme Algoritması Data Mining Dünyasında En Çok Kullanılan Algoritmaların başında yer almaktadır.  Kümeleme algoritmaları ile Sınıflandırma algoritmaları arasında bir takım farklılıklar bulunmaktadır. k-means algoritması bir kümeleme algoritmasıdır. Kümeleme algoritmaları otomatik olarak verileri daha küçük kümelere yada alt kümelere ayırmaya yarayan algoritmalardır. Algoritma istatistiksel olarak benzer nitelikteki ...

Read More »

Excel Data Mining Add-In Kurulumu

Kullanıcı dostu bir arayüze ve kullanıma sahip Microsoft’un amiral gemisi Excel, bu özellikleri nedeniyle sadece dünyada en yaygın olarak kullanılan sayı tablosu programı olmayıp, aynı zamanda en yaygın kullanılan bilgisayar programı ve programlama aracıdır. İş dünyasında üretilen bir çok yazılım kendisini Excel programına benzetmeye çalışarak kullanıcılarla yakınlık kurmaya çalışır. Herkes Excel kullanmayı bilir. Bu nedenle programını Excel’e benzetirsen, herkes kolaylıkla ...

Read More »

Başarısızlığın Örneklendirilmemesi

Herhangi bir stratejiyi deneyen kaç şirket, bu strateji nedeniyle başarılı oldu? Sorusu gerçekten o stratejinin işe yarayıp yaramadığı hakkında bize bir izlenim verebilir. Sorun şu ki, herhangi bir nedenle başarı yakalayamamış bir şirket, ayakta kalamayacağı için gözlem altına alınan inceleme gruplarında yer almaz. Oxford’da Strateji profosoru olan Jerker Denrell buna başarısızlığın örneklendirilmemesi diyor. *Örneğimizi strateji ile değil sonuçla incelediğimizden başarılı ...

Read More »

Data Mining Dünyasında TOP 10 Algoritma

  “Knowledge and Information Systems” dergisinde yapılan bir değerlendirmede en popüler Data Mining algoritmaları hangisidir? sorusuna cevap verilmişti. Bu araştırma aslında bir KDD (Knowledge Discovery in Databases) konferasnsında düzenlenen yarışmada kazananlar arasında problemleri çözmede kullanılan algoritmalardan yola çıkılmış olup bu algoritmalar şunlardan oluşmaktadır: Machine Learning Algoritmaları: k-Nearest Neighbors Decision trees Naïve Bayes algorithm Support Vector Machines. AdaBoost   Tahminleme Algoritmaları ...

Read More »

ETL Nedir?

ETL;  Extract, Transform ve Load kelimelerinin baş harflerinden oluşmaktadır. ETL genel anlamda verilerin seçilmesi ve işe yarar bir şekilde uygun başka bir yerde depolanması sistematiğidir. Günümüzde çok sayıda dağıtık kaynaklardan gelen verilerin tek bir şablonda, kurallara uygun olarak biriktirilmesi önem arz etmektedir. Bir data science uzmanının çok iyi ETL bilgisine sahip olması beklenir. Eğer veriyi alınması gerektiği yerden alınması gereken formatta ...

Read More »

CRISP Nedir?

  CRISP Veri Madenciliği için standart süreçlerin tanımlandığı bir modeldir. 90’lı yılların ortalarında bir konsorsiyum tarafından geliştirilmiştir. CRISP süreçlerini izleyerek herhangi bir alanda herhangi bir data mining yazılımı kullanarak işlem yapabilirsiniz. Data mining projelerinin daha etkili, daha hızlı, daha güvenilir ve daha az maliyetli olması için geliştirilmiştir. Aşamaları şunlardır; Business Understanding: İşi anlama safası olup, üzerinde işlem yapılan işin anlaşılmasıdır. ...

Read More »

En sık kullanılan istatistiksel analizler

İstatistiksel analizler bir çok bilimsel çalışmada, araştırmanın en önemli aşamasını oluşturmaktadır. Araştırmalarda çok sık görülen bir hata vardır: Araştırmacılar yanlış analiz yöntemi seçimi nedeniyle sonuçlarını hatalı hesaplar ya da herhangi bir sonuca ulaşamazlar. Verilerin sağlıklı bir şekilde analiz edilebilmesi için hangi şartlarda hangi analiz yöntemlerinin kullanılıyor olduğunu bilmek çok önemlidir.  Uygun olmayan bir yöntem seçimi verilerin hatalı yorumlanmasına neden olacaktır. Doğru ...

Read More »

Bir Veri Bilimci (Data Scientist) Hangi Yeteneklere Sahip Olmalıdır?

Bir Veri Bilimi (Data Science) kariyeri yapmak istiyorsanız bazı yetkinliklere sahip olmanız beklenmektedir. Üç safhada ele alınabilecek bu yetkinlikler şunlardır: VERİYİ ELDE ETME Programlama ve Veri Tabanı Becerileri İlk önce mutlaka Java, Pyhton gibi programlama dillerine aşina olmalı ve SQL bilgisine mutlaka sahip olmaldır. Denileiblir ki başlangıç için veriyi elde etmek ve nasıl elde edeceğini bilmek temel düzeyde en önemli ...

Read More »

İstatistiksel Veri Tipleri

İstatistikte yorumlamak ve sunmak amacı ile toplanmış, özetlenmiş ölçüm,bilgi ve belgelere genel olarak veri denilmektedir. İşlenmiş ve sonuç çıkarılmış veriye bilgi ya da enformasyon denir. Veri tipleri ise şu başlıklarda toplanabilir: 1. BAKIŞ AÇISI 1- Nümerik Veriler: Sayısal-Nümerik-Nicel Veriler de denmektedir. Boy,Yaş gibi süreklilik arzeden değerler Nümerik verilerdir. “Daha fazla” ifadesi ile kullanılabilirler. Sürekli ve süreksiz olarak iki başlıkta ele alınabilir: a) ...

Read More »