Makale

Big Data Nedir?

Üzerinde yaşadığımız dijital çağda internet üzerinde üretilen aktivitelerin bir sonucu olarak, devasa miktarlarda yapısal ve yapısal olmayan veri yığınları oluşmuştur. Ortalama bir insanın anlayamayacağı düzeyde veri oluşuyor. Algılamakta zorluk çekeceğimiz düzeyde gelişen veriye Büyük Veri deniliyor. Bu verilerin kaynağı olarak; yeni teknoloji ile oluşturulan internete bağlı cihazların oluşturduğu verileri, milyarlarca hatta tirilyonlarca sosyal medya güncellemelerini, yazıları, tarihleri, numaraları sıralayabiliriz. Şimdilik! ...

Read More »

Önemli Python Kütüphaneleri

Biliyorsunuz Python Scientific (Bilimsel) programlama için en önemli programlama dili. Bu programlama dilini kullanmak ve ondan bahsetmek oldukça keyifli. Bu yazımda kullandığım ve önemli gördüğüm Önemli Python Kütüphaneleri’ni sizinle paylaşmak istedim: Öncelikle Python kütüphanesi deyince neyi kastediyorum onu bir netleştirelim. Programlama dillerinde (örneğin C ve C++) önceden yazılmış ve çok kullanılan program parçacıkları daha sonra tekrar tekrar kullanılmak üzere arşivlenerek dosyalarda saklanır. ...

Read More »

Microsoft Azure Nedir?

Bu yazımda bir bulut platformu olan Azure dan bahsedeceğim. Microsoft Azure, Microsoft’un “Bulut Bilişim Platformu” dur.  Bulut Bilişim pazarı içersinde Amazon ile birlikte en önemli iki aktörden bir tanesidir. Mayıs ayında Gartner’in Magic Quadrant Yöntemi ile yapılan değerlendirmede*  Microsoft, Amazon Web Services ile birlikte Cloud pazarın açık ara lider iki oyuncusu olduğu gösterilmiştir.   Değerlendirmeye konu olan servislerin tümü kullanıcılara her yönü ile hazır altyapı sunan ...

Read More »

Regresyon Analizi İle Vücut Yağı Nasıl Hesaplanır?

Regresyon Analizi İle Vücut Yağı Nasıl Hesaplanır? Bu örnek bir lineer regresyon modeli örneği olarak da güzel bir örnektir. Vücut yağını gerçeğe yakın olarak hesaplamak,  içersine insanların tamamen suya batırıldığı yorucu, uzun ve pahalı bir yöntemle yapılmaktadır. Bu yöntemde aynı ağırlıktaki yağlı insanlar suda kemikli insanlardan daha hafif kalmaları nedeniyle bir takım hesaplamalarla birlikte gerçeğe yakın sonuçlar üretmektedir. Ortalama 25 ...

Read More »

Analitik Hiyerarşi Süreci ile Araç Seçimi

Daha önceki bir yazımda çok kriterli seçimlerde karar almak için kullanılan Analitik Hiyerarşi Prosesi‘nden bahsetmiştim. Araba almak niyetinde olan bir kişinin önünde piyasanın rekabet koşullarından ötürü çok sayıda seçenek bulunmaktadır. Bunların bazıları uygun fiyatlı olması nedeniyle bazıları ise sürüş konforu ya da estetik nedeniyle ön plana çıkmaktadır. Bu kişi araba almak için araştırma yaptığında seçimini etlileyecek 5-10 Ana Kriter ve çok sayıda ...

Read More »

Sahte Korelasyonlar

Sahte Korelasyonlar

İstatistikle ilgilenen herkesin bilmesi gereken bir şey vardır: Korelasyon nedensellik değildir. Bir çok araştırmacı şu hataya düşer: İki ilişki arasında bir korelasyon varsa biri diğerinin sebebidir. Bu durum ise Sahte Korelasyonlar’ın oluşmasına sebebiyet verir. Aslında Nedensellik ve Korelasyon birbirlerine bağlı kavramlardır. Nedensellikten bahsedebilmek için korelasyon olması gerekir fakat tek başına korelasyon bulunması yeterli değildir. Korelasyon nedensellik değildir fakat nedenselliğe daha ...

Read More »

Excel ile RFM Analizi

RFM analizi pazarlama’da çok kullanılan bir analiz yöntemidir. Genellikle müşteri segmentasyonu için kullanılmaktadır. RFM; Recency, Frequency, Monetary kelimelerinin baş harflerinden oluşur. Recency: Müşterinin son işlem güncelliğini belirtmektedir. Frequency: İşlem sıklığının ölçüsüdür. Monetary ise müşterinin harcadığı toplam paradır. Müşteri satın alma davranışını özetlemek için RFM Analizlerine ihtiyaç duyarız.  Özet olarak bu davranışları ERP programları gibi veri kaynaklarından çekebiliriz. Daha büyük yapılarda ...

Read More »

Normal Dağılım Nedir?

Normal Dağılım istatistikteki en önemli konulardan biridir. Sürekli Dağılım türlerinden biridir ve pratikte bir çok durumda verilerin Normal Dağılım gösteren bir ana kütleden geldiği varsayılır. Bunun nedeni doğa ve insan davranışlarının genelinin Normal Dağılıma uygun olmasıdır. Örnek vermek gerekirse: – İnsanların çoğu ortalama bir boya sahiptir. Ülkemizdeki erkekleri ele alacak olursak çok azı 1.90 üzeridir. Geneli 1.70-1.75 arasında bir boya sahiptir ...

Read More »

Anscombe’nin Dötrlüsü

Anscombe’nin Dötrlüsü  İngiliz asıllı Amerika İstatistikçi Anscombe 1973 yılında yapmış olduğu bir çalışmada, birbirinden çok değişik dağılım gösteren dört farklı veri setinin aynı ortalamaya, aynı standart sapmaya, aynı korelasyona ve aynı regresyon doğrusuna sahip olabileceğini göstermiştir.     Tüm data setlerin de ortalaması (7,5), standart sapması 4,12 korelasyon katsayısı 0,81 ve regresyon doğrusu y=3+0,5x ‘tir. Tüm bu değerler data setleri tanımlıyor gibi görünse ...

Read More »

Kategorik Verileri Özetleme

Bir özet tablodan ya da Veri Özetleme ‘den bahsettiğimizde aklımıza frekans, miktar ya da yüzde değerlerin bulunduğu kategorik veri gösterimi gelmektedir. Bir özet tablo genellikle kategorileri bir sütunda frekans, miktar toplamları ya da yüzde değerlerini bir diğer sütunda tutar. Bir araştırmada iş yerinde 100 tane müşteriye şu soru soruluyor ve alınan cevaplar kaydediliyor. – Yolda 1000 TL bulsaydınız ne yapardınız? ...

Read More »