DİSKRİMİNANT ANALİZİ VE BUNUNLA İLGİLİ BAZI PROBLEMLER ÜZERİNDE BİR ARAŞTIRMA

Hangi populasyona ait oldukları kesinlikle bilinmeyen fertlerinayırım ve sınıflandırılmalanm konu edinen diskriminont analiziningenel teorisi incelenmiştir. Optimum sınıflandırma kaidesi çok değişkenli populasyonlar için izah edilerek teori kesikli dağıfış ıgösteren populasyonlar için de genelleştirilmişrir.Araştırmada diskriminan! analizi ile ilg;/i yanlış sınıflanfırma ihtimalleri, kalitatif verilerle yapılan sınıflandınma, değişkenlerin seçimi ve kayıp müşahadeler gibi konular ele alınarak bunlara ait çeşitli metodların mukayesesi yapılmıştır.A RESEARCH ON DISCRIMINANT ANALYSIS AND SOME RELATED TOPICSIn this reseacrh the general theoryof discriminant analysis and some relatedtopi-es such as probalitiy of misclassification,choosing the best variablesand the estimation of the missingobservations were considered.The poblem of classifieation arieswhen an investigator makes a numberof measurements on an individual andwishes to Cıassify the individual intoone of several pupulations on the basiswhere ~(1), ~(2) are the mean vectorsand ~ is the variance - covariancematrLx.. When the parameters ~(ı), ~(2)and ~ are urik.nown, the sample esti·mates of these arç used. The abovementioned statistical formula is thesame as Fisher's linear dlscriminantfunction, except the constant term inczamanbu değişikliğin takriben Y.; 63,6olduğu gösterilmiştir.Kayıp müşahadelerin tahmini içinvaryans - kovanyans matrisinin izininve determinahnm minimum yapılmasınıkriter olarak alan iki met.odunmukayesesi yapılarak bunJarın birbir~lerine olan üstünlükleri izah edilmiştir.Son olarak diskıiminant fonksiyonuiçin kullanılan değişkenJirin seçimindebazı metodlar incelenmiştir.Diskriminant fonksiyonu ile çoklu reğresyonarasındaki ilişkide gösterilerekdeğişkenlerin seçimi için regresyon analiz:indeki tekniklerden birinin kullanılmaSlll111mümkün olabileceği belirtilmiştir.of these measurements . In costructinga precedure of calassification it is desiredto minimise the probalitiy ofmisclassification. For this purpose acalissification procedure was ob~ainedby minimising the expected cost ofmisclassification.Anderson propesed the foI1owingstatistics for the classifictaion of theindividuals into one of two mUıtivariatenormal populations.luded in W (~). In the case where thereare more than two populations, the allocationrule was generalised. The samerule was used to show how to Cıassifyindividuals, with the multivariate qualitativedata.The data used in the researchwas obtained by inkoving the simulation techniques and gathering observationson the student records.Comparing five of the methods. developed to estimate the probalitiyof misclassification, two of them werefound to be the best.Applieation of two different wasiHustrated for the classifieation withthe multivariate' qualitative data. Theeffeet of replacing anonnal variate bya qualitative variate was alsa mentionedfor a speeial ease.The advantages and disadvantagcsof the two methods proposed toestimate the missing observations werediseussed.In the last part of the resareh samewhieh are used to selleet the best variablesfor diseriminant funetion wereeonsidered. The relation between themultiple regression equation and thediseriminant function was iliustrated,and the possibility of the use of oneof the regression teehniques was pointedout for seleeting the best variablesof the discriminant funetion.
Anahtar Kelimeler:

-