08. Association Rules (Birliktelik Kuralları)

Birliktelik kuralları, birbiriyle ilişkili olan özelliklerin ortaya çıkarılması ve aralarındaki ilişkinin büyüklüğünün tespit edilmesine yöneliktir. Peki bu ilişkileri çıkarmak ne işimize yarayacak. Örneğin bir markette ürünler arasındaki ilişkilerin ortaya çıkarılması durumunda raf düzenlerini ona göre yapabiliriz. A ürünün alan müşterin B ve C ürünlerine yönelmesi tespit edersek B ve C ürünlerini yakın raflara yerleştirebiliriz. Bu bölümde farklı birliktelik kuralı çıkarıcı algoritmaları anlatmaya çalışacağım.

Birliktelik Kuralları, belli bir destek (Support) değerinin  üstündeki öğeleri bulur ve bundan sonra kalan öğeler arasından belli bir güven (Confidence) üstündeki ait istenilen kuralları üretir. Lift kuralı ile X ve Y’nin istatiksel olarak bağımsız olması durumda ne kadar birlikte geçtiklerini bulunur.

Bu ölçüm değerleri daha iyi anlamak için basit bir örnek yapalım. Bir markette, 1000 satış olsun. A ürünü 80 satışta, B ürünü 100 satışta ve A-B ürünleri beraber 20 satışta satılmış olsun. Bu durumda Support:

  • Support (A) = 80/1000 = 8%, Support(B) = 100/1000 = 10%, Support(A, B) = 20/1000 = 2%

Confidence:

  • B ürünü 100 satış olduğuna göre A ürüne bu grup içinde ne kadar rastlayabiliriz. En fazla 20 olduğu için Confidence(A) = 20/100 = 10%
Lift:
  • Lift = Support(A, B) / Support(A) * Support(B) = (20/1000) / ((80/1000)x(100/1000)) = 2.5

 AIS ve APRIORI algoritmaları üzerinden ürünlerin birleştirme işlemini yapalım. Bu örneklerde Support işlemindeki bölme işlemi yapılmayacak, direkt frekans bilgisi Support olarak kullanılacaktır. 

AIS algoritması 1, 2, 3, vb. durumlar için geçme frekanslarını hesaplar ve belli değerin üzerindeki satışları seçer. (Bu örnek için 2’nin üzerindeki durumlar seçilmiştir.)

AIS algoritmasının kötü tarafı her durum için veri setinin üzerinden tekrar tekrar geçmesidir. APRIORI algoritması bu durumu biraz iyileştirir. 2 gruptan üçlü grupları oluştururken sadece seçilmiş adaylar üzerinden seçim yapar. Bu sayede AIS algoritmasına göre karşılaştırma işlemi azaltılmış olur.