Bir Veri Bilimi (Data Science) kariyeri yapmak istiyorsanız bazı yetkinliklere sahip olmanız beklenmektedir. Üç safhada ele alınabilecek bu yetkinlikler şunlardır:
VERİYİ ELDE ETME
Programlama ve Veri Tabanı Becerileri
İlk önce mutlaka Java, Pyhton gibi programlama dillerine aşina olmalı ve SQL bilgisine mutlaka sahip olmaldır. Denileiblir ki başlangıç için veriyi elde etmek ve nasıl elde edeceğini bilmek temel düzeyde en önemli yetkinliktir. Veriyi elde etme yöntemi olarak ETL sürecini çok iyi anlamalı ve bu konuda uzman olmalıdır. Eğer veriyi elde edemezseniz zaten onu analiz de edemezsiniz. Ve veriyi elde etme işini başkasına yaptırmayı da düşünemezsiniz.
İşi Anlama ve İş Konusundaki Bilinç Düzeyi
Tıp alanında bir işle uğraşıyorsanız, enerji sektöründeki bir işle uğraştığınızdan çok farklı detaylarla uğraşacaksınız demektir. Hangi veri ne için gerekli, ilk oluşma kaynağı neresi ve hangi alanda depolanıyor gibi bilgiler de ancak iş anlama kısmı aşıldıktan sonra kavranacaktır. Bu kısımda çok fazla soru sormanız ve çalışmanız gerekebilir.
Veri Modelleme, Veri Ambarı Becerileri
Elde edilen verinin belirli bir şablonda yeniden ele alınması yeteneği önemli olacaktır. Bu ele alış yöntemi analiz safhasına kaliteli girdi sağlayacaktır.
ANALİZ
İstatistiksel Araçları Kullanma Becerisi
Excel, SPSS, R, Statistica gibi programların bazılarını bilmek ve birlikte kulanmak, bu yeteneklerle potansiyel desenleri keşfetmek ve korelasyonları meydana çıkarmak bu işin çekirdeğinde yer almaktadır. Tabiri caizse dehanın ortaya çıktığı kısım bu kısımdır. Eğer istatistiksel araçları kullanma becerisine sahip değilseniz hiç bir veriyi analiz edemezsiniz.
Matematik Becerisi
Korelasyonu anlama, çok değişkenli regresyon hakkında bilgi sahibi olma gibi matematik arkaplanı size standart istatistiksel araçların yetenekleri dışında bir bakış açısı sunarak, istisnai durumlar ve büyük hacimli datalarda ki analiz ihtiyaçları için farklı açılardan bakış açıları sunar.
SUNUM
Visualization Araçlarını Kullanma Becerisi
Flare, HighCharts, AmCharts, D3.js, Processing, Google Visualization API, Tableau, Excel, Indesign gibi araçlar çalışmalarınıza görsellik sunmak için size yardmcı olacaktır. Temel anlamda Excel ile ya da paint’le bile bazı işlerinizi görebilirsiniz.
Jargona Uygun Anlatma Yeteneği
Data science uzmanlık alanını tamamlayan ama her uzmandan standart olarak beklenemeyecek bir insan ilişkileri yeteneğidir. İş dünyasının jargonuna alışmış bir data scientist ile teknoloji geek’i bir data scienctistin sunum farklılıkları tartışılmaz. Bu işe değer katmak istiyorsanız işin doğasına uygun ve iş dünyası jargonu ile sunumlar yapmaya alışmalı, ne para getirir ne para götürür, verimlilik için ne yapılmalıdır? gibi sorulara cevap niteliğindeki bilgileri sunumumuza aktarmalıyız.