Çarpık dağılımlı verilerde ROC eğrisi altında kalan alan tahmininde transformasyon etkili mi?

Amaç: Hasta ve sağlıklı grupta ölçülen sayısal ölçümlü tanı testinin dağılımının çarpık olması halinde ROC eğrisi altında kalan alan tahmini için kullanılan yöntemleri karşılaştırmaktır.Gereç ve Yöntem: ROC eğrisi altında kalan alan tahmini parametrik ve parametrik olmayan yöntemler kullanılarak yapılabilmektedir. Parametrik yaklaşımlarda sayısal ölçümün hasta ve sağlıklı gruplarında normal dağılım gösterdiği veya dönüşüm teknikleri ile dağılımın normal dağılıma dönüştürülebileceği varsayılmaktadır. Parametrik olmayan yaklaşımlarda ise eğri altında kalan alan sıra istatistikleri kullanılarak hesaplanabildiği gibi, eğrinin çekirdek düzgünleştirme yöntemleri ile elde edilen olasılık yoğunluk fonksiyonu kullanılarak da hesaplanabilmektedir. Bu çalışmada parametrik ve parametrik olmayan yöntemler çarpık olarak üretilmiş veriler ve bir gerçek veri seti kullanılarak karşılaştırılmıştır. Bulgular: Simülasyon çalışmalarında, yöntemlerin gerçek alan değeri tahminleri gerçek alan değeri, örneklem büyüklüğü ve çarpıklık derecesine göre değişim göstermektedir. Normal dağılımdan üretilen çarpık verilerde Mann Whitney yöntemi en az hatayı yaparken, Gamma dağılımından üretilen çarpık verilerde ise normale dönüşüm sonrası Binormal modeli en az hatayı yapmıştır.Sonuç: Çarpık dağılımlı verilerde dönüşüm teknikleri ile parametrik yöntemler kullanılarak ROC eğrisi altında kalan alan değeri tahmin edilebilir. Çarpıklık derecesi fazla olan verilerde parametrik yöntemlerin alan tahmin değerleri gerçek değere daha yakın olduğundan çarpık dağılımlı verilere Box-Cox dönüşümünü uygulamak önerilir.

Is the transformation useful to estimate the area under the ROC curve with skewed data?

Purpose: The aim of this study is to compare the methods used for the estimation of the area under the ROC curve (AUC) with skewed data.Materials and Methods: The area under the ROC curve can be estimated by using parametric or nonparametric methods. In the parametric method, the distributions of biomarker in both patient and non-patient groups are assumed to be normal distribution or transformed to the normal distribution. In non-parametric methods, there are two approaches: using the rank statistics or using the kernel smoothing methods. In this study, these methods are compared by using simulated skewed data and real data.Results: According to the simulation results, the estimates of the investigated methods are affected by the real AUC value, the sample size and the degree of the skewness. For the scenarios with the skewed normal distribution, Mann Whitney method gets the smallest bias value and for the scenario with the gamma distribution, Binormal model with a Box-Cox transformation gets the smallest bias value. Conclusion: For skewed data, after applying transformation techniques, the Binormal model can be used to estimate the AUC. After Box-Cox transformation, the estimate of the Binormal model is very close to the real AUC value for highly skewed data. It is recommended to use this method for this situation. 

___

  • 1. Zhou X, Obuchowski N, McClish D. Statistical Methods in Diagnostic Medicine. New York, Wiley, 2002.
  • 2. Green DM, Swets JA. Signal Detection Theory and Psychophysics. New York, NY, Wiley, 1966.
  • 3. Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine. Clin Chem. 1993;39:561-77.
  • 4. Obuchowski NA. Receiver operating characteristic curves and their use in radiology. Radiology. 2003;229:3-8.
  • 5. Faraggi D, Reiser B. Estimation of the area under the ROC curve. Stat Med. 2002;21:3093-106.
  • 6. McClish DK. Analyzing a portion of the ROC curve. Med. Decis Making. 1989;9:190-5.
  • 7. Metz CE, Herman BA, Shen JH. Maximum likelihood estimation of receiver operating characteristic (ROC) curves from continuously-distributed data. Stat Med. 1998;17:1033-53.
  • 8. Bamber DC. The area above the ordinal dominance graph and the area below the receiver operating characteristic graph. J Math Psychol. 1975;12:387-415.
  • 9. Zou KH, Tempany CM, Fielding JR, Silverman SG. Original smooth receiver operating characteristic curves estimation from continuous data: statistical methods for analyzing the predictive value of spiral CT of ureteral stones. Acad Radiol. 1998;5:680–7
  • 10. Koç M, Bozkurt A, Acartürk E, Şahin DY, Ünal İ. Usefulness of N-terminal pro-B-type natriuretic peptide increase with exercise for predicting cardiovascular mortality in patients with heart failure. Am J Cardiol. 2008;101:1157-62.
  • 11. Box GEP, Cox DR. An analysis of transformations. J R Stat Soc Series B Stat Methodol. 1964;26:211-43.
  • 12. Dag O, Asar O, Ilk O. A methodology to implement Box-Cox transformation when no covariate is available. Commun Stat Simul Comput. 2014;43:1740-59.
  • 13. Xiao-Feng Wang (2012). sROC: Nonparametric Smooth ROC Curves for Continuous Data. R package version 0.1-2. https://CRAN.R-project.org/package=sROC.
  • 14. Robin X, Turck N, Hainard A, Tiberti N, Lisacek F, Sanchez JC, Müller M. “pROC: an open-source package for R and S+ to analyze and compare ROC curves”. BMC Bioinformatics. 2011;12:77.
Cukurova Medical Journal-Cover
  • ISSN: 2602-3032
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 1976
  • Yayıncı: Çukurova Üniversitesi Tıp Fakültesi
Sayıdaki Diğer Makaleler

Hemiartroplasti sonrası asetabular erozyonun değerlendirilmesi

Fırat SEYFETTİNOĞLU, Bilal GÜMÜŞ, Cemal KAZIMOĞLU, Hakan ÇİÇEK, Ümit TUHANİOĞLU, Hasan Ulaş OĞUR

Çocukluk çağında lomber intervertebral disk herniasyonu: 7 olgunun sunumu

Derviş Mansuri YILMAZ, Ersin HACIYAKUPOĞLU, Ömer Neşet KİŞİ, Erol AKGÜL, Sebahattin HACIYAKUPOĞLU

İnsan amniotik hücre kültüründe nikotin ve resveratrolün Sox2 ve Sox4 genlerinin ekspresyon seviyeleri üzerindeki etkilerinin real time PCR ile araştırılması

Gamze CÖMERTPAY, Ümit LÜLEYAP, Mehmet Bertan YILMAZ, Turan TUFAN, Perçin PAZARCI

Hemoroidektomi sonrası sıcak su oturma banyosu veya sıcak duş mu etkili: kanıtlar hangi düzeydedir?

Burcu OPAK YÜCEL, Mevlüde KARADAĞ

Çarpık dağılımlı verilerde ROC eğrisi altında kalan alan tahmininde transformasyon etkili mi?

İlker ÜNAL

Horlama şikayeti ile başvuran obstruktif uyku apnesi hastalarında üst hava yolu kollabsibilitesinin değerlendirilmesi

Nagihan BİLAL, Adin SELÇUK, Bora BİLAL, Göksel KÜTÜK

Üniversitede okuyan kız öğrencilerde depresyon prevalansı ve ilişkili faktörler

Ayla AÇIKGÖZ, Ayfer DAYI, Tolga BİNBAY

Araştırma görevlilerinin akılcı ilaç kullanımı konusunda bilgi ve farkındalıkları

Olcay KIROĞLU, Fatih BERKTAŞ, Eda Şahan, Yusuf Karataş

Tonsil non-Hodgkin lenfomalı hastaların değerlendirilmesinde FDG-PET/BT'nin değeri

Muge Öner Tamam

Gestasyonel diabetes mellitus tanısında bir biyobelirteç olarak serum prokalsitonin düzeyi

Süleyman Baldane, Süleyman Hilmi İPEKCİ, Ayşegül KEBAPCILAR, Sedat ABUŞOĞLU, Bahadır ÖZTÜRK, Ali ÜNLÜ, Çetin ÇELİK, Levent KEBAPCILAR