01. Veri Bilimi Kütüphaneleri

Python Matematik, Bilim ve Mühendislik için açık kanyak kodlu bir çok kütüphaneye sahiptir. Bu konuda 4 kütüphane çok ön plana çıkmaktadır. Özellikle Numpy ve Pandas gibi kütüphaneler ön plana çıkmaktadır.

01.01. Numpy

Numpy, Web sitemde geniş bir tanıtımını bulabileceğiz bilimsel hesaplama konusunda en ünlü kütüphanedir. En temel özellikleri:

  • Python’un eksik olduğu array açığını kapatmak için çok güçlü bir N boyutlu array nesnesi
  • İşlemleri daha az kod ve basit ifadelerle yapmanızı sağlayan çok gelişmiş fonksiyonlar
  • C / C++ ve Fortran kodlarını entegre etmek için araçlar
  • Lineer cebir ve  Fourier dönüşümü konusunda kullanışlı metotlar
  • Çok hızlı Array işlemleri yapabilmesi

Özellikle veri bilimi ile uğraşan geliştiricilerin ilk bakması gereken kütüphanedir.

01.02. pandas

pandas, Python için yüksek performanslı, kullanımı kolay veri yapıları ve veri analizi araçları sağlayan bir kütüphanedir. pandas, veri içeren oldukça karmaşık işlemleri bir iki komut ile yapabilmeyi sağlar. pandas, gruplama, filtreleme ve birleştirme gibi metotların yanı sıra zaman serileri (time series) üzerine de işlem yapabilmeye olanak tanır.

01.03. SciPy

Scipy, Numpy tabanlı bir kütüphanedir ve Numpy’in yeteneklerini genişletmeyi amaçlamıştır. Scipy öne çıkan alt paketleri:

  • cluster: Kümeleme algoritmaları
  • fftpack: Hızlı Fourier Dönüşümü
  • integrate: Integral ve diferansiyel denklem çözücüleri
  • lingalg: Lineer cebir
  • ndimage: Resim işleme için N boyutlu dizi
  • signal: Sinyal işleme
  • stats: İstatiksel dağılım ve fonksiyonlar

01.04. StatModels

Statsmodels, istatiksel testler, istatiksel veri araştırması ve istatistiksel modelin tahmininde sınıflar ve fonksiyonlar sağlayan bir kütüphanedir. Her tahminci (estimator) için kapsamlı bir istatiksel sonuç listesi vardır. Sonuçlar, doğruluğunu test etmek için mevcut istatiksel paketler ile karşılaştırılabilir.