Tag Archives: ETL

Önemli Python Kütüphaneleri

Biliyorsunuz Python Scientific (Bilimsel) programlama için en önemli programlama dili. Bu programlama dilini kullanmak ve ondan bahsetmek oldukça keyifli. Bu yazımda kullandığım ve önemli gördüğüm Önemli Python Kütüphaneleri’ni sizinle paylaşmak istedim: Öncelikle Python kütüphanesi deyince neyi kastediyorum onu bir netleştirelim. Programlama dillerinde (örneğin C ve C++) önceden yazılmış ve çok kullanılan program parçacıkları daha sonra tekrar tekrar kullanılmak üzere arşivlenerek dosyalarda saklanır. ...

Read More »

Kirpiler ve Tilkiler

Kirpiler ve Tilkiler “Hiçbir şey bireylere ya da gruplara tek hakikate sahip oldukları inancından daha büyük zarar veremez: Özellikle nasıl yaşanacağına, ne olunacağına ve ne yapılacağına dair hakikat – tek hakikate sahip olduğuna inananlara göre farklı olanlar hatalı değildir, onlar hain ya da delidir; ya kısıtlanmaları ya da bastırılmaları gerekmektedir. Sadece kendinin haklı olduğunu, hakikati gören sihirli bir göze sahip ...

Read More »

Analitik Platformların Karşılaştırılması

Analitik Platformlar tipik olarak bir Veri Bilimci’nin ihtiyacı olan araçların bir çoğunu içerisinde bulunduran platformlardır. Analitik Platformların karşılaştırılması konusuna ise bir çok araştırmacı kafa yormaktadır. Bu tip teknoloji araçları araştıran bilindik bir kuruluş olan Gartner bu işlemler için Magic Quadrant adında bir yöntem kullanmaktadır. Daha önce Magic Quadrant Yöntemi ile Karşılaştırma hakkında bir yazı paylaşmıştım. Bu yöntemle pazarda hangi oyuncular, hangi ...

Read More »

Veri Bilimi

Veri Bilimi Üzerinde yaşadığımız dijital çağda, internet üzerinde üretilen aktivitelerin bir sonucu olarak devasa miktarlarda yapısal ve yapısal olmayan veri yığınları oluşmuştur. İnterneti yaygın olarak kullanmaya başladığınız yılları düşünün… 2003 yılında insanlık bir yılda, tüm insanlık tarihi boyunca üretilen veri kadar veri üretti ve aynı hızda üretmeye devam ediyor. Öyle ki IDC istatistiklerine göre 2020’de ulaşılacak veri miktarı, 2009’un 44 ...

Read More »

ETL Nedir?

ETL;  Extract, Transform ve Load kelimelerinin baş harflerinden oluşmaktadır. ETL genel anlamda verilerin seçilmesi ve işe yarar bir şekilde uygun başka bir yerde depolanması sistematiğidir. Günümüzde çok sayıda dağıtık kaynaklardan gelen verilerin tek bir şablonda, kurallara uygun olarak biriktirilmesi önem arz etmektedir. Bir data science uzmanının çok iyi ETL bilgisine sahip olması beklenir. Eğer veriyi alınması gerektiği yerden alınması gereken formatta ...

Read More »

Bir Veri Bilimci (Data Scientist) Hangi Yeteneklere Sahip Olmalıdır?

Bir Veri Bilimi (Data Science) kariyeri yapmak istiyorsanız bazı yetkinliklere sahip olmanız beklenmektedir. Üç safhada ele alınabilecek bu yetkinlikler şunlardır: VERİYİ ELDE ETME Programlama ve Veri Tabanı Becerileri İlk önce mutlaka Java, Pyhton gibi programlama dillerine aşina olmalı ve SQL bilgisine mutlaka sahip olmaldır. Denileiblir ki başlangıç için veriyi elde etmek ve nasıl elde edeceğini bilmek temel düzeyde en önemli ...

Read More »

t-Testi

t-Testi hipotez testleri arasında en yaygın olarak kullanılan testtir. İki gurup verinin ortalamaları arasında belirgin bir farklılık olup olmadığını istatistiksel olarak belirlemeye çalışan bir yaklaşım olarak tanımlanabilir. t-testi’nin bir diğer adı student testidir. Küçük örnekler sınama tekniği olarak da bilinir. Böyle bilinmesinin nedeni n<30 olduğunda veya ana kütle ortalamasının normal olduğuna dair kuşku duyulduğu durumlarda uygulanabilen bir istatistik tekniğidir. Bu ...

Read More »