Bu yazımda, gözetimli öğrenme metotlarından sınıflandırma (classification) işleminde kullanılan K-KN (K-Nearest Neighborhood, En Yakın K Komşu) algoritması hakkında bilgi vermeye çalışacağım. Sınıflandırma işleminde K değeri bakılacak eleman sayısını belirler.
Her ne kadar KNN algoritması k-means algoritmasındaki benzer özellikler taşısa da büyük farklılıklar da içermektedir. KNN algoritması bir eğitim verisi içerirken k-means algoritması bir eğitim verisi içermez. Yeni bir değer geldiğinde K değerine mesafeler hesaplanır ve yeni değer bir kümeye ilave edilir. Mesafe hesaplama işleminde ise k-means ve hiyerarşik kümeleme de kullanılan öklid uzaklığı, manhattan uzaklığı gibi mesafe hesaplama yöntemleri kullanılabilir. Bu örneğimizde yine öklid uzaklığı kullanılacaktır.
Bu algoritma beş adımdan oluşur.
- Öncelikle K değeri belirlenir.
- Diğer nesnelerden hedef nesneye olan öklit uzaklıkları hesaplanır.
- Uzaklıklar sıralanır ve en minimum uzaklığa bağlı olarak en yakın komşular bulunur.
- En yakın komşu kategorileri toplanır.
- En uygun komşu kategorisi seçilir.