Comparison of Artificial Neural Networks and Logistic Regression Analysis in Determining Factors Affecting Alcohol Consumption among Medicine Students

Objectives: The factors that affect students' alcohol use behaviors were examined by logistic regression analysis and artificial neural networks and the efficiency of these methods in identifying alcohol users and non-users was compared using the receiver operating characteristics (ROC) curve method. Study Design: Graduate students of 1-4 years in Trakya University Medical Faculty (2003-2004) were administered a questionnaire to predict their alcohol use behaviors and were assessed with the Frontal Lobe Personality Scale. Results: Logistic regression analysis showed that the following variables highly affected alcohol use behaviors of the students: visiting bars, discos or cafes in their spare time (OR=1.920; p<0.05), the importance of religion (OR=0.454; p<0.001), the number of alcohol-user friends (OR=2.441; p<0.001), insistence of friends on taking alcohol (OR=1.557; p<0.01), and impulsiveness (OR=1.826; p<0.001). Comparison between logistic regression analysis and artificial neural networks showed no differences in terms of the areas under the ROC curves of hyperbolic tangent-hyperbolic tangent function and hyperbolic tangent-logistic function artificial neural networks, but these models showed statistically larger areas than the other models. Conclusion: It may be necessary to take into account the advantages and disadvantages of artificial neural networks and logistic regression in classification and modelling, and to use artificial neural networks to eliminate insignificant variables of logistic regression analysis. Turkish Başlık: Tıp Öğrencilerinde Alkol Kullanımını Etkileyen Faktörlerin Belirlenmesinde Yapay Sinir Ağları ile Lojistik Regresyon Analizi'nin Karşılaştırılması Anahtar Kelimeler: Karşılaştırmalı çalışma; lojistik model; sinir ağları; anket; ROC eğrisi; sigara/psikoloji; öğrenci/ psikoloji Amaç: Bu çalışmada, öğrencilerin alkol kullanımını etkileyen faktörler lojistik regresyon analizi (LR) ve yapay sinir ağları (YSA) ile incelendi ve bu yöntemlerin alkol kullanan ve kullanmayan öğrencileri ayırmadaki etkinlikleri ROC (Receiver Operating Characteristic) eğrisi yöntemiyle karşılaştırıldı. Çalışma Planı: Çalışmada, 2003-2004 eğitim-öğretim yılında Trakya Üniversitesi Tıp Fakültesi'nin 1-4 sınıflarında okuyan öğrencilere Frontal Lob Kişilik Ölçeği ve alkol kullanma alışkanlıklarını belirlemeye yönelik bir anket uygulandı. Bulgular: Lojistik regresyon analizinde, ders dışındaki zamanlarda bar, disko, kafe ya da kahvehaneye gitme (OR=1.920; p<0.05), dinin önem düzeyi (OR=0.454; p<0.001), alkol kullanan arkadaş sayısı (OR=2.441; p<0.001), alkol kullanması için arkadaşların ısrar düzeyi (OR=1.557; p<0.01) ve dürtüsellik (OR=1.826; p<0.001) değişkenlerinin öğrencilerin alkol kullanımı üzerinde etkili oldukları bulundu. Lojistik regresyon analizi ile YSA'lar karşılaştırıldığında, hiperbolik tanjant-hiperbolik tanjant fonksiyonlu ve hiperbolik tanjant-lojistik fonksiyonlu YSA'ların ROC eğrisi altında kalan alanlarının farklı olmadığı, fakat bu modellerin diğer modellerin alanlarından daha büyük oldukları görüldü. Sonuç: Bu çalışmada YSA'ların LR'ye göre avantaj ve dezavantajları göz önünde bulundurularak amaca göre sınıflandırma ve modelleme çalışmalarının yürütülmesi gerektiği, LR yönteminin önemsiz değişkenlerin elenmesi için YSA'da bir ön eleme yöntemi olarak kullanılabileceği sonucuna varıldı.

Comparison of Artificial Neural Networks and Logistic Regression Analysis in Determining Factors Affecting Alcohol Consumption among Medicine Students

Objectives: The factors that affect students' alcohol use behaviors were examined by logistic regression analysis and artificial neural networks and the efficiency of these methods in identifying alcohol users and non-users was compared using the receiver operating characteristics (ROC) curve method. Study Design: Graduate students of 1-4 years in Trakya University Medical Faculty (2003-2004) were administered a questionnaire to predict their alcohol use behaviors and were assessed with the Frontal Lobe Personality Scale. Results: Logistic regression analysis showed that the following variables highly affected alcohol use behaviors of the students: visiting bars, discos or cafes in their spare time (OR=1.920; p<0.05), the importance of religion (OR=0.454; p<0.001), the number of alcohol-user friends (OR=2.441; p<0.001), insistence of friends on taking alcohol (OR=1.557; p<0.01), and impulsiveness (OR=1.826; p<0.001). Comparison between logistic regression analysis and artificial neural networks showed no differences in terms of the areas under the ROC curves of hyperbolic tangent-hyperbolic tangent function and hyperbolic tangent-logistic function artificial neural networks, but these models showed statistically larger areas than the other models. Conclusion: It may be necessary to take into account the advantages and disadvantages of artificial neural networks and logistic regression in classification and modelling, and to use artificial neural networks to eliminate insignificant variables of logistic regression analysis. Turkish Başlık: Tıp Öğrencilerinde Alkol Kullanımını Etkileyen Faktörlerin Belirlenmesinde Yapay Sinir Ağları ile Lojistik Regresyon Analizi'nin Karşılaştırılması Anahtar Kelimeler: Karşılaştırmalı çalışma; lojistik model; sinir ağları; anket; ROC eğrisi; sigara/psikoloji; öğrenci/ psikoloji Amaç: Bu çalışmada, öğrencilerin alkol kullanımını etkileyen faktörler lojistik regresyon analizi (LR) ve yapay sinir ağları (YSA) ile incelendi ve bu yöntemlerin alkol kullanan ve kullanmayan öğrencileri ayırmadaki etkinlikleri ROC (Receiver Operating Characteristic) eğrisi yöntemiyle karşılaştırıldı. Çalışma Planı: Çalışmada, 2003-2004 eğitim-öğretim yılında Trakya Üniversitesi Tıp Fakültesi'nin 1-4 sınıflarında okuyan öğrencilere Frontal Lob Kişilik Ölçeği ve alkol kullanma alışkanlıklarını belirlemeye yönelik bir anket uygulandı. Bulgular: Lojistik regresyon analizinde, ders dışındaki zamanlarda bar, disko, kafe ya da kahvehaneye gitme (OR=1.920; p<0.05), dinin önem düzeyi (OR=0.454; p<0.001), alkol kullanan arkadaş sayısı (OR=2.441; p<0.001), alkol kullanması için arkadaşların ısrar düzeyi (OR=1.557; p<0.01) ve dürtüsellik (OR=1.826; p<0.001) değişkenlerinin öğrencilerin alkol kullanımı üzerinde etkili oldukları bulundu. Lojistik regresyon analizi ile YSA'lar karşılaştırıldığında, hiperbolik tanjant-hiperbolik tanjant fonksiyonlu ve hiperbolik tanjant-lojistik fonksiyonlu YSA'ların ROC eğrisi altında kalan alanlarının farklı olmadığı, fakat bu modellerin diğer modellerin alanlarından daha büyük oldukları görüldü. Sonuç: Bu çalışmada YSA'ların LR'ye göre avantaj ve dezavantajları göz önünde bulundurularak amaca göre sınıflandırma ve modelleme çalışmalarının yürütülmesi gerektiği, LR yönteminin önemsiz değişkenlerin elenmesi için YSA'da bir ön eleme yöntemi olarak kullanılabileceği sonucuna varıldı.