Çarpık dağılımlı verilerde ROC eğrisi altında kalan alan tahmininde transformasyon etkili mi?

Amaç: Hasta ve sağlıklı grupta ölçülen sayısal ölçümlü tanı testinin dağılımının çarpık olması halinde ROC eğrisi altında kalan alan tahmini için kullanılan yöntemleri karşılaştırmaktır.Gereç ve Yöntem: ROC eğrisi altında kalan alan tahmini parametrik ve parametrik olmayan yöntemler kullanılarak yapılabilmektedir. Parametrik yaklaşımlarda sayısal ölçümün hasta ve sağlıklı gruplarında normal dağılım gösterdiği veya dönüşüm teknikleri ile dağılımın normal dağılıma dönüştürülebileceği varsayılmaktadır. Parametrik olmayan yaklaşımlarda ise eğri altında kalan alan sıra istatistikleri kullanılarak hesaplanabildiği gibi, eğrinin çekirdek düzgünleştirme yöntemleri ile elde edilen olasılık yoğunluk fonksiyonu kullanılarak da hesaplanabilmektedir. Bu çalışmada parametrik ve parametrik olmayan yöntemler çarpık olarak üretilmiş veriler ve bir gerçek veri seti kullanılarak karşılaştırılmıştır. Bulgular: Simülasyon çalışmalarında, yöntemlerin gerçek alan değeri tahminleri gerçek alan değeri, örneklem büyüklüğü ve çarpıklık derecesine göre değişim göstermektedir. Normal dağılımdan üretilen çarpık verilerde Mann Whitney yöntemi en az hatayı yaparken, Gamma dağılımından üretilen çarpık verilerde ise normale dönüşüm sonrası Binormal modeli en az hatayı yapmıştır.Sonuç: Çarpık dağılımlı verilerde dönüşüm teknikleri ile parametrik yöntemler kullanılarak ROC eğrisi altında kalan alan değeri tahmin edilebilir. Çarpıklık derecesi fazla olan verilerde parametrik yöntemlerin alan tahmin değerleri gerçek değere daha yakın olduğundan çarpık dağılımlı verilere Box-Cox dönüşümünü uygulamak önerilir.

Is the transformation useful to estimate the area under the ROC curve with skewed data?

Purpose: The aim of this study is to compare the methods used for the estimation of the area under the ROC curve (AUC) with skewed data.Materials and Methods: The area under the ROC curve can be estimated by using parametric or nonparametric methods. In the parametric method, the distributions of biomarker in both patient and non-patient groups are assumed to be normal distribution or transformed to the normal distribution. In non-parametric methods, there are two approaches: using the rank statistics or using the kernel smoothing methods. In this study, these methods are compared by using simulated skewed data and real data.Results: According to the simulation results, the estimates of the investigated methods are affected by the real AUC value, the sample size and the degree of the skewness. For the scenarios with the skewed normal distribution, Mann Whitney method gets the smallest bias value and for the scenario with the gamma distribution, Binormal model with a Box-Cox transformation gets the smallest bias value. Conclusion: For skewed data, after applying transformation techniques, the Binormal model can be used to estimate the AUC. After Box-Cox transformation, the estimate of the Binormal model is very close to the real AUC value for highly skewed data. It is recommended to use this method for this situation. 

___

  • 1. Zhou X, Obuchowski N, McClish D. Statistical Methods in Diagnostic Medicine. New York, Wiley, 2002.
  • 2. Green DM, Swets JA. Signal Detection Theory and Psychophysics. New York, NY, Wiley, 1966.
  • 3. Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine. Clin Chem. 1993;39:561-77.
  • 4. Obuchowski NA. Receiver operating characteristic curves and their use in radiology. Radiology. 2003;229:3-8.
  • 5. Faraggi D, Reiser B. Estimation of the area under the ROC curve. Stat Med. 2002;21:3093-106.
  • 6. McClish DK. Analyzing a portion of the ROC curve. Med. Decis Making. 1989;9:190-5.
  • 7. Metz CE, Herman BA, Shen JH. Maximum likelihood estimation of receiver operating characteristic (ROC) curves from continuously-distributed data. Stat Med. 1998;17:1033-53.
  • 8. Bamber DC. The area above the ordinal dominance graph and the area below the receiver operating characteristic graph. J Math Psychol. 1975;12:387-415.
  • 9. Zou KH, Tempany CM, Fielding JR, Silverman SG. Original smooth receiver operating characteristic curves estimation from continuous data: statistical methods for analyzing the predictive value of spiral CT of ureteral stones. Acad Radiol. 1998;5:680–7
  • 10. Koç M, Bozkurt A, Acartürk E, Şahin DY, Ünal İ. Usefulness of N-terminal pro-B-type natriuretic peptide increase with exercise for predicting cardiovascular mortality in patients with heart failure. Am J Cardiol. 2008;101:1157-62.
  • 11. Box GEP, Cox DR. An analysis of transformations. J R Stat Soc Series B Stat Methodol. 1964;26:211-43.
  • 12. Dag O, Asar O, Ilk O. A methodology to implement Box-Cox transformation when no covariate is available. Commun Stat Simul Comput. 2014;43:1740-59.
  • 13. Xiao-Feng Wang (2012). sROC: Nonparametric Smooth ROC Curves for Continuous Data. R package version 0.1-2. https://CRAN.R-project.org/package=sROC.
  • 14. Robin X, Turck N, Hainard A, Tiberti N, Lisacek F, Sanchez JC, Müller M. “pROC: an open-source package for R and S+ to analyze and compare ROC curves”. BMC Bioinformatics. 2011;12:77.
Cukurova Medical Journal-Cover
  • ISSN: 2602-3032
  • Yayın Aralığı: 4
  • Başlangıç: 1976
  • Yayıncı: Çukurova Üniversitesi Tıp Fakültesi
Sayıdaki Diğer Makaleler

Radial kollateral arter perforatör bazlı propellar flep ile dirsek bölgesi rekonstrüksiyonu

İbrahim Tabakan, Cengiz Eser, Eyüphan Gencel, Erol KESİKTAŞ, Osman Metin YAVUZ

Radyografik kontrast maddenin damar dışına kaçmasına bağlı üst ekstremitede kompartman sendromu ve el dorsalinde doku defekti

Ömer KOKAÇYA, İbrahim TABAKAN, Erkan SERVET

Horlama şikayeti ile başvuran obstruktif uyku apnesi hastalarında üst hava yolu kollabsibilitesinin değerlendirilmesi

Nagihan BİLAL, Adin SELÇUK, Bora BİLAL, Göksel KÜTÜK

Osteoporoz ile başvuran tanısı gecikmiş bir hipopituitarizm olgusu

Seher Çetinkaya Altuntaş, Mehtap Evran, Murat Sert, Tamer Tetiker

Variköz dili

Vijayendranath NAYAK, Raghavendra KİNİ, Prasanna Kumar , RAO, Gowri BHANDARKAR, Roopashri Rajesh KASHYAP

Kuzey Kıbrıs’taki tıp fakültesi öğrencilerinin ruhsal bozukluklara yönelik tutumları

İpek SÖNMEZ, Özgür TOSUN, Ferdi KÖŞGER

Elli bir yaşındaki erkekte parotid bezi kistik lenfanjiomu

Manas Bajpai, Nilesh Pardhe, Pradkshana Vijay

Çocukluk çağı miks konnektif doku hastalığı: olgu serisi

Rabia Miray Kışla Ekinci, Sibel Balcı, Derya Ufuk Altıntaş, Mustafa Yılmaz

Çocukluk çağında nadir görülen idiyopatik hipoparatiroidizm ve bazal gangliyon kalsifikasyonu birlikteliği: Fahr hastalığı

Rıza Taner BARAN, Hüseyin DEMİRBİLEK, Serpil BARAN, Mesut PARLAK, Eda PARLAK

Perkütan trakeastominin olağan dışı komplikasyonu: trakeaözofageal defekt

Adnan TAŞ, Hacer TAŞ