K-MEANS VE HİYERARŞİK KÜMELEME ALGORİTMANIN WEKA VE MATLAB PLATFORMLARINDA KARŞILAŞTIRILMASI

Günümüz teknolojik gelişmeleri ve gelinen nokta ele alındığında, veri tabanıyönetimi ve veri madenciliğinin büyük önem kazandığı görülmektedir. Geçmişteveri yığınlarının kapladıkları alan ve depolama masrafları firmalar için gereksizbir masraf olarak görülmekteydi. Günümüzde ise veri yığınlarının işlenmesi veyorumlanması sayesinde elde edilen kazanımlar, irili ufaklı tüm resmi ve özelsektör kurum ve kuruluşlarının ilgisini çekmektedir. Bu sebeple günümüzünpopüler çalışma alanlarından biri olan veri madenciliğinin önemi artmaktadır. Verimadenciliğinin sıkça kullanılan yöntemlerinden biri olan kümeleme algoritmalarıise bu alanda çalışma yapacak kişilerin bilgi sahibi olması gereken konulardanbiridir. Bu çalışmamızda iki kümeleme algoritması incelenmiştir. K-Meanskümeleme algoritması ve Hiyerarşik kümeleme algoritması bu doğrultuda elealınmıştır. Ele alınan bu algoritmalar Kandilli iklim verileri kullanılarak WEKAve MATLAB platformlarında teste tabi tutulmuştur. WEKA ve MATLABplatformlarındaki bulgulara göre, her iki yöntemin üstün ve kısıt oluşturan yönleriirdelenmiştir.

___

  • Dubes, C.R., Jain, K.A. Algorithms for Clustering Data. Prentice Hall Englewood Cliffs, New Jersey 07632, pp. 55-141, 1988. ISBN 0-13-022278-X. Kendall, M.G. Discrimination and Classification. In Multivariate Analysis (P.R. Krishnaiah, ed.), Academic Press, Inc., New York, pp. 165-185, 1966. Steinhaus, H. Sur la division des corps meteriels en parties. Bull. Acad. Polon Sci. (in French), 4(12):801-804, 1957. MR.0090073.Zbl.0079.16403.