KÜMELEME PROBLEMLERİNE KÜME ÖRTÜLEME MODELİ YAKLAŞIMI VE BİR UYGULAMA

İstatistiksel verilerin kümelenmesi sorununa genellikle kümeleme analizi teknikleri ile çözüm aranmakta ancak bu teknikler anlamlılık testlerini yeterince dikkate almamaktadır. Bu çalışma ile, istatistiksel yöntemlere göre alınmış çok sayıdaki örneğin kaç farklı ana kitleden geldiği, başka bir ifade ile bu örneklerin kaç farklı kümede toplanabileceği sorununa çözüm getiren bir algoritma önerilmiştir. Algoritma, Türkiye’deki illerin güneşlenme süresi verilerine göre kümelenmesi problemine uygulanmıştır. Bu algoritma kümeleme işlemlerini anlamlılık testlerine uygun olarak yapmaktadır.

A solution to the problem of clustering statistical data is usually approached by clustering analyzing techniques. However, these techniques do not take the signifıcance tests into consideration enough. The question in this study is to determine from how many different populations the samples are coming, when numerous samples are taken statistically. In other words the problem is to fınd out in how many different clusters the samples can be formed. In this study an algorithm for this problem is suggested. The algorithm has been applied to cluster the cities in Turkey according to the amount of daylight. The clustering process used in this algorithm is appropriate for signifıcance tests.