Makine öğrenmesi ve Python deyince akla gelen ilk kütüphane Scikit-learn’dür. Ancak, iyileştirme ve sonuçların yorumlanması içinde kütüphane çalışmaları vardır. Bu bölümde 5 kütüphane kısaca tanıtılacaktır.
XGBoost | LightGBM |
03.01. Scikitlearn
Scikitlearn kütüphanesi veriler üzerine çalışmak için sıklıkla kullanılan Numpy ve SciPy kütüphanelerini taban alır. Kümeleme, regresyon, sınıflama, boyutsal azaltma ve model seçimi gibi birçok makine öğrenmesi ve veri madenciliği işlemlerini sağlar. Bu işlemleri iyileştirme yöntemlerini de sunar. Makine öğrenmesi konusundaki temel bilgiler edinmek istiyorsanız, hazırladığım Makine Öğrenmesi bölümünü bir okumanızı tavsiye ederim.
03.02. XGBoost
XGBoost, yüksek verimli, esnek ve taşınabilir olarak tasarlanmış bir “optimized distributed gradient boosting” kütüphanesidir. Boosting, birçok zayıf metodu öğrenme için bir araya getirip güçlü bir metot elde etme sürecidir. Burada, tahmin edici ardışık olarak eğitilmektedir. En sık kullanılan boosting yöntemleri Adaptive Boosting ve Gradient Boosting’tir. Bu kütüphane, Gradient Boosting süreci üzerinedir.
03.03. LightGBM
LightGBM, gradient boosting konusunda diğer bir kütüphanedir. Geliştiriciler ve katılımcıların kendi ihtiyaçları konusunda iyileştirmeler yaptığı ve geliştirdiği bir kütüphanedir.
03.04. CatBoost
CatBoost, sınıflama ve regresyon için kullanılan Karar Ağacı için hızlı, ölçeklenebilir, yüksek performanslı bir Gradient Boosting kütüphanesidir. CPU ve GPU hesaplamayı destekler. Bu üç Gradient Boosting kütüphanesi proje için en uygunu performans ölçümleri ile tespit edilebilir. Boosting yaklaşımının sonuçları iyileştirme yolunda bir adım olduğunu unutmadan, tahminlerinizi daha iyi hale getirebilirsiniz.