Çarpık dağılımlı verilerde ROC eğrisi altında kalan alan tahmininde transformasyon etkili mi?

Amaç: Hasta ve sağlıklı grupta ölçülen sayısal ölçümlü tanı testinin dağılımının çarpık olması halinde ROC eğrisi altında kalan alan tahmini için kullanılan yöntemleri karşılaştırmaktır.Gereç ve Yöntem: ROC eğrisi altında kalan alan tahmini parametrik ve parametrik olmayan yöntemler kullanılarak yapılabilmektedir. Parametrik yaklaşımlarda sayısal ölçümün hasta ve sağlıklı gruplarında normal dağılım gösterdiği veya dönüşüm teknikleri ile dağılımın normal dağılıma dönüştürülebileceği varsayılmaktadır. Parametrik olmayan yaklaşımlarda ise eğri altında kalan alan sıra istatistikleri kullanılarak hesaplanabildiği gibi, eğrinin çekirdek düzgünleştirme yöntemleri ile elde edilen olasılık yoğunluk fonksiyonu kullanılarak da hesaplanabilmektedir. Bu çalışmada parametrik ve parametrik olmayan yöntemler çarpık olarak üretilmiş veriler ve bir gerçek veri seti kullanılarak karşılaştırılmıştır. Bulgular: Simülasyon çalışmalarında, yöntemlerin gerçek alan değeri tahminleri gerçek alan değeri, örneklem büyüklüğü ve çarpıklık derecesine göre değişim göstermektedir. Normal dağılımdan üretilen çarpık verilerde Mann Whitney yöntemi en az hatayı yaparken, Gamma dağılımından üretilen çarpık verilerde ise normale dönüşüm sonrası Binormal modeli en az hatayı yapmıştır.Sonuç: Çarpık dağılımlı verilerde dönüşüm teknikleri ile parametrik yöntemler kullanılarak ROC eğrisi altında kalan alan değeri tahmin edilebilir. Çarpıklık derecesi fazla olan verilerde parametrik yöntemlerin alan tahmin değerleri gerçek değere daha yakın olduğundan çarpık dağılımlı verilere Box-Cox dönüşümünü uygulamak önerilir.

Is the transformation useful to estimate the area under the ROC curve with skewed data?

Purpose: The aim of this study is to compare the methods used for the estimation of the area under the ROC curve (AUC) with skewed data.Materials and Methods: The area under the ROC curve can be estimated by using parametric or nonparametric methods. In the parametric method, the distributions of biomarker in both patient and non-patient groups are assumed to be normal distribution or transformed to the normal distribution. In non-parametric methods, there are two approaches: using the rank statistics or using the kernel smoothing methods. In this study, these methods are compared by using simulated skewed data and real data.Results: According to the simulation results, the estimates of the investigated methods are affected by the real AUC value, the sample size and the degree of the skewness. For the scenarios with the skewed normal distribution, Mann Whitney method gets the smallest bias value and for the scenario with the gamma distribution, Binormal model with a Box-Cox transformation gets the smallest bias value. Conclusion: For skewed data, after applying transformation techniques, the Binormal model can be used to estimate the AUC. After Box-Cox transformation, the estimate of the Binormal model is very close to the real AUC value for highly skewed data. It is recommended to use this method for this situation. 

___

  • 1. Zhou X, Obuchowski N, McClish D. Statistical Methods in Diagnostic Medicine. New York, Wiley, 2002.
  • 2. Green DM, Swets JA. Signal Detection Theory and Psychophysics. New York, NY, Wiley, 1966.
  • 3. Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine. Clin Chem. 1993;39:561-77.
  • 4. Obuchowski NA. Receiver operating characteristic curves and their use in radiology. Radiology. 2003;229:3-8.
  • 5. Faraggi D, Reiser B. Estimation of the area under the ROC curve. Stat Med. 2002;21:3093-106.
  • 6. McClish DK. Analyzing a portion of the ROC curve. Med. Decis Making. 1989;9:190-5.
  • 7. Metz CE, Herman BA, Shen JH. Maximum likelihood estimation of receiver operating characteristic (ROC) curves from continuously-distributed data. Stat Med. 1998;17:1033-53.
  • 8. Bamber DC. The area above the ordinal dominance graph and the area below the receiver operating characteristic graph. J Math Psychol. 1975;12:387-415.
  • 9. Zou KH, Tempany CM, Fielding JR, Silverman SG. Original smooth receiver operating characteristic curves estimation from continuous data: statistical methods for analyzing the predictive value of spiral CT of ureteral stones. Acad Radiol. 1998;5:680–7
  • 10. Koç M, Bozkurt A, Acartürk E, Şahin DY, Ünal İ. Usefulness of N-terminal pro-B-type natriuretic peptide increase with exercise for predicting cardiovascular mortality in patients with heart failure. Am J Cardiol. 2008;101:1157-62.
  • 11. Box GEP, Cox DR. An analysis of transformations. J R Stat Soc Series B Stat Methodol. 1964;26:211-43.
  • 12. Dag O, Asar O, Ilk O. A methodology to implement Box-Cox transformation when no covariate is available. Commun Stat Simul Comput. 2014;43:1740-59.
  • 13. Xiao-Feng Wang (2012). sROC: Nonparametric Smooth ROC Curves for Continuous Data. R package version 0.1-2. https://CRAN.R-project.org/package=sROC.
  • 14. Robin X, Turck N, Hainard A, Tiberti N, Lisacek F, Sanchez JC, Müller M. “pROC: an open-source package for R and S+ to analyze and compare ROC curves”. BMC Bioinformatics. 2011;12:77.
Cukurova Medical Journal-Cover
  • ISSN: 2602-3032
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 1976
  • Yayıncı: Çukurova Üniversitesi Tıp Fakültesi
Sayıdaki Diğer Makaleler

İki yenidoğan bebekte pnömomediyastinumun kendiliğinden düzelmesi

Hacer Yapıcıoğlu Yıldızdaş, Önder ÖZDEN, Hilmi Serdar İSKİT, Gülseren BİLEN YURDAKUL, Mustafa AKÇALI, Ferda ÖZLÜ, Süreyya SOYUPAK, Mehmet SATAR, Nejat NARLI

Angola ve Demokratik Kongo Cumhuriyeti'nde 2015-2016 yılı sarı humma salgınının sona erişinin deklarasyonu

Saurabh Rambiharilal SHRİVASTAVA, Prateek Saurabh SHRİVASTAVA, Jegadeesh RAMASAMY

Kuzey Kıbrıs’taki tıp fakültesi öğrencilerinin ruhsal bozukluklara yönelik tutumları

İpek SÖNMEZ, Özgür TOSUN, Ferdi KÖŞGER

Behçet hastasında rejyonel anestezi uygulaması

Çiğdem YALÇIN

Yabancı bir organ ile yaşamak: canlıdan karaciğer transplantasyonu yapılan alıcıların danışmanlık gereksinimleri

Özge PEKİN İŞERİ, Özgül KARAYURT, Sezai YILMAZ

Sigaranın akciğer yaşı ve solunum fonksiyon testleri üzerine olan etkisi

Nur Demirbaş, Ruhuşen Kutlu

Şizofreni ve bipolar bozukluğu olan hastalarda içselleştirilmiş damgalanma, benlik saygısı ve algılanan sosyal destek

Hülya KÖK, Satı DEMİR

Üç yaş altı anaplastik ependimom olgularının tedavisi

Begül YAĞCI-KÜPELİ, Serhan Küpeli KÜPELİ

Tonsil non-Hodgkin lenfomalı hastaların değerlendirilmesinde FDG-PET/BT'nin değeri

Muge Öner Tamam

Hemiartroplasti sonrası asetabular erozyonun değerlendirilmesi

Fırat SEYFETTİNOĞLU, Bilal GÜMÜŞ, Cemal KAZIMOĞLU, Hakan ÇİÇEK, Ümit TUHANİOĞLU, Hasan Ulaş OĞUR