Yasemin GENÇ, Rabia ALBAYRAK, Can ATEȘ, Mustafa Agah TEKİNDAL, Pınar SELVİ, Sibel PERÇİNEL, Koray CEYHAN

Tanı Doğruluğu Çalıșmalarının Kalitelerinin Değerlendirilmesi: STARD Kriterlerinin Türkçe Uyarlaması

Amaç: Bu çalıșmada, tanı doğruluğu çalıșmalarının planlanması ve sonuçlarının raporlanması konusunda bir standardın olușturulması amacıyla çoğunluğunu epidemiyolog ve biyoistatistikçilerin olușturduğu bir grup tarafından 2003 yılında yayınlanan STARD (The STAndards for Reporting of Diagnostic Accuracy) kriterlerinin Türkçeye çevrilmesi ve ülkemizde yapılan çalıșmalarda kullanımının yaygınlaștırılması amaçlanmıștır. Gereç ve Yöntem: 2003 yılında yayınlanan orijinal STARD kriterleri, ilk 4 yazar (RA, MAT, CA, PS) tarafından birbirlerinden bağımsız olarak Türkçeye çevrilmiș ve YG’nin liderliğinde görüș birliğine varılarak son haline getirilmiștir. Dil eșdeğerliliğinin sağlanması amacıyla, Türkçe uyarlaması yapılan STARD kriterleri profesyonel bir tercüman tarafından kontrol edilmiș ve gerekli düzeltmeler yapılmıștır. Son hali verilen Türkçe STARD kriterleri, geri çevirme yöntemi kullanılarak bir bașka profesyonel tercüman tarafından Türkçeden İngilizceye çevrilmiș ve orijinal metin ile üst düzeyde bir benzerlik olduğu saptanmıștır. Daha sonra Türkçeye uyarlanmıș kontrol listesinin araștırmacılar tarafından doğru bir șekilde anlașılıp anlașılmadığını ve tekrar edilebilirlik düzeyini değerlendirmek amacı ile aynı uzmanlık düzeyine sahip iki pataloğa (SP, KC) 20 tanı doğruluğu çalıșması verilmiș ve Türkçe uyarlaması yapılmıș olan STARD kriterlerini kullanarak, yayınların kalitelerini değerlendirmeleri istenmiștir. Gözlemciler arasındaki uyum her bir kriter için gözlemciler arası uyum yüzdesi ve Cohen’in Kappa istatistiği kullanılarak incelenmiștir. Uyum ayrıca toplam raporlanan kriter sayısı kullanılarak Bland-Altman yöntemi ve Sınıf İçi Korelasyon Katsayısı (SKK) kullanılarak da değerlendirilmiștir. Bulgular: İncelenen tanı doğruluğu çalıșmalarında kriterler rapor edilme sıklıkları bakımından büyük bir varyasyon göstermektedir. Kriterlerin bir bölümü bütün makalelerde rapor edilirken bir bölümü ise neredeyse hiç rapor edilmemiștir. Makale bașına toplam raporlanan kriter sayısı 15.9±3.2 (Gözlemci I’in sonucu) olup 25 kriterin en az 10’unun, en fazla 21’inin raporlanmıș olduğu gözlenmiștir. Kriterler için ayrı ayrı hesaplanan gözlemciler arası uyum yüzdelerinin bir kriter için %60 diğerleri için %75 ve üzerinde olduğu gözlenmiștir. İki kriter için Kappa istatistiği elde edilememiș, 3 kriter için önemsiz düzeyde bulunmuș, 20 kriter için ise 0.32’nin üzerinde bulunmuștur. %95 Uyum Limitleri -2.2-3.5 olarak bulunmuș olup bu sonuç iki gözlemci arasındaki uyumun kabul edilebilir düzeyde olduğunu göstermiș, bunun yanında SKK da 0.945 gibi oldukça yüksek bir değer olarak bulunmuștur. Sonuç: Türkçe uyarlaması yapılmıș STARD kriterlerinin ülkemizde tanı doğruluğu çalıșması yapacak olan araștırmacıların yanında dergi hakem ve editörlerin için de bir kılavuz olması umut edilmektedir. Çalıșmalarda metodolojik standartlara uygun ortak bir ölçüt kullanılması, bireysel çalıșmaların yanında meta analizi çalıșmalarının da kalitelerinin artmasını sağlayacaktır

Anahtar Kelimeler:

STARD kriterleri, Tanı doğruluğu çalıșmaları

Tanı Doğruluğu Çalıșmalarının Kalitelerinin Değerlendirilmesi: STARD Kriterlerinin Türkçe Uyarlaması

Keywords:

-,

PDF

___

Genç Y. Tanı Testi Çalışmalarında Metodolojik Standartların Kullanılması. Ankara Üniversitesi Tıp Fakültesi Mecmuası. 2003;56:4:259-264.
Littenberg B, Moses LE. Estimating diagnostic accuracy from multiple conflicting reports: A new metaanalytic method. Med Decis Making 1993;13:313-321.
Reid MC, Lachs MS, Feinstein AR. Use of methodological standards in diagnostic test research: Getting better but still not good. JAMA 1995;274:645-651.
Lijmer JG, Mol BW, Heisterkamp S, et al. Empirical evidence of deign-related bias in studies of diagnostic tests. JAMA 1999;282:1061-1066.
Nelemans PJ, Leiner T, Henrica CW, Joseph M.A, Engelshoven V. Peripheral arterial disease: Metaanalysis of the diagnostic performance of MR angiography. Radiol 2000;217:105-114.
De Vries S.O., Hunnink MGM, Polak JF. Summary receiver operating characteristic curves as a technique for metaanalysis of the diagnostic performance of duplex ultrasonography in peripheral ar-terial disease. Acad Radiol 1996;3:361-369.
Bossuyt PM, Reitsma JB, Bruns DE, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD initiative. Clin Chem 2003;49:1 1-6.
Whiting P, Rutjes AW, Reitsma JB, Bossuyt PM, Kleijnen J. The development of QUADAS: A tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews. BMC Med Res Methodol 2003;3:25.
Whiting PF, Weswood ME, Rutjes AW, et al. Eva-luation of QUADAS, a tool for the quality assessment of diagnostic accuracy studies. BMC Med Res Methodol 2006;6:9.
Bossuyt PM, Reitsma JB, Bruns DE, et al. The STARD statement for reporting studies of diagnostic accuracy: Explanation and elaboration. Clin Chem 2003;49:1 7-18.
Ateş C, Öztuna D, Genç Y. Sağlık araştırmalarında sınıf içi korelasyon katsayısının kullanımı. Türkiye Klinikleri J Bios-tat. 2009;1:59-64.
Lee J, Koh D, Ong CN. Statistical evaluation of agreement between two methods for measuring a quantitative variable. Comput Biol. Med. 1989;19: 61-70.
Fleiss JF, Chapter 1: Reliability of Measurement. In the Design and Analysis of Clinical Experiments. John Wiley & Sons, London. 1986;1-33.
Stengel D, Bauwens K, Rademacher G, Mutze S, Ekkernkamp A. Association between compliance with methodological standarts of diagnostic research and reported test accuracy: metaanalysis of focused assesment of US for trauma. Radiol 2005;236:102111.
Smidt N, Rutjes AWS, Van der Windt AWM et al. Quality of reporting of diagnostic accuracy studies. Radiol 2005;235:347-353.
Smidt N, Rutjes AWS, Van der Windt DAWM at al. Reproducibility of the STARD checklist: An instrument to assess the quality of reporting of diagnostic accuracy studies. BMC Medical Res Methodol 2006;6:12.
Vach W. The dependence of Cohen’s Kappa on the prevalence does not matter. J Clin Epidemiol 2005;58:655-661.