WEKA ile Birliktelik Analizi

WEKA ile Birliktelik Analizi

Weka programı makine öğrenimi için kullanılan içerisinde birçok veri madenciliği algoritması barındıran Yeni Zelanda’da bulunan Waikato Üniversitesi tarafından geliştirilmiş bir yazılımdır. Sunduğu kullanım kolaylığı ve açık kaynak kodlu olması sebebiyle bu günkü popülerliğine erişmiştir. Weka programı açık kaynak kodlu olarak JAVA dili üzerinde geliştirilmiş ve GPL lisansı ile dağıtılmaktadır.
Weka ile sınıflandırma, kümeleme, birliktelik analizi gibi birçok işlemi kod yazmadan hazır olarak sunulan algoritmaları kullanarak yapabiliriz. Bu yazımızda Weka Programını kullanarak nasıl Birliktelik Analizi yapacağımızı anlatacağım. Bu arada Weka programının güncel sürümünü bilgisayarınızda tutmaya özen gösterin.
Analize başlamadan önce kullanacağınız verisetini Weka’ya yüklemeniz gerekiyor. Weka programını açıp Explorer butonuna tıklıyoruz. Açılan pencerede Open File kısmından analiz yapacağımız dosyayı seçebiliyoruz. Eğer işlem yapacağınız dosya aşağıdaki görseldeki formatlardan birindeyse buradan Weka ortamına yükleyebilirsiniz. Eğer veriseti URL olarak mevcutsa OpenURL butonuna tıklayıp URL’yi belirterek yükleme yapabilirsiniz. Verisetiniz SQL, Oracle, Access gibi bir veritabanı ortamındaysa Open DB butonuna tıklayıp veritabanı bağlantınızı yaptıktan sonra yazacağınız sorgu ile verileri Weka’ya aktarabilirsiniz.
Ben verisetini CSV formatında kullanıyorum. Sizlere de bu şekilde kullanmanızı tavsiye ederim. Çünkü veri analizi üzerine çalışıyorsanız birçok veri analiz programı kullanmanız gerekecektir. Hemen hemen tüm veri analiz programı (R Studio, RapidMiner vb.) CSV dosya türünü desteklemektedir.
WEKA ile Birliktelik Analizi
CSV formatındaki verisetini Weka ortamına yükledim. Verisetinde bir mağazada yapılan satışı göstermektedir. 5 tane satışta hangiürünlerin satın alındığı aşağıdaki listede mevcut. Bu ürünlerden en çok hangi ürünlerin birlikte alındığını belirleyeceğiz. 
WEKA ile Birliktelik Analizi
WEKA ile Birliktelik Analizi
Veri setini Weka’ya yükledikten sonra verisetindeki ilişkileri tespit edebilmek için Weka penceresinde üst menüde yer alan Associate butonuna tıklarız. Bu ekranda birliktelik analizinde kullanılan en yaygın algoritma olan Apriori Algortiması otomatik olarak gelir. Eğer başka bir birliktelik analizi algoritması kullanmak istiyorsanız Choose butonuna tıklayıp FP -Growth ve FilteredAssociator seçeneklerinden birini seçebilirsiniz. Ben bu çalışmada Apriori algoritmasını kullanacağım. Algoritmayı seçtikten sonra Start butonuna basarız ve analizi başlatırız. Verisetimde fazla veri olmadığından çok kısa sürecektir. Ancak büyük veri (Big Data) üzerine bir çalışma yapıyorsanız işlem süreniz uzun olacaktır.
Analiz işleminin sonunda sonuçlar Associator output penceresinde gösterilir. Tespit edilen en iyi birliktelik kuralları en aşağıda Best Rules Found başlığı altında listelenir.
WEKA ile Birliktelik Analizi

Analiz sonucunda 10 tane kural elde edildi. Bu kuralların güven aralığı(conf) 1 değerindedir. Bu da bu ürün 1. müşteriye satılmış ise diğer müşterilere de satılmıştır anlamına gelmektedir. WEKA ile Birliktelik Analizi

Share

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir