Beagle Genotip Atama Yönteminin Değerlendirilmesi ve Bir Uygulama
Bu çalışma, genotip atama yöntemlerinden olan Beagle programının tanıtılarak, oluşturulan üç farklı senaryoda atama performansının değerlendirilmesi amacıyla gerçekleştirilmiştir. Populasyon tabanlı atama yöntemleri içerisinde yer alan Beagle programı eksik tek nükleotit polimorfizmler (Single Nucleotid Polimorfizm, SNP) ve gözlemlenmiş SNP’ler arasındaki bağlantı dengesizliği (Linkage Disequilibrium, LD) bilgileri ile lokal haplotip küme (Browning) modelini kullanarak, eksik genotipleri tahmin etmede yüksek oranda atama doğruluğu sunmaktadır. Bu amaçla, çalışmada 1000 Genom Projesi’nde dizilenmiş 191 bireyin 22. kromozomu üzerinde bulunan 1356 SNP bilgileri kullanılarak, veri seti %20, %50 ve %70 oranlarında şansa bağlı olarak kesilerek üç farklı senaryo oluşturulmuştur. Üç senaryo sonucunda elde edilen Alelik-R2 değerleri, %90’dan büyük olarak elde edilmiş ve yüksek doğruluk derecesine sahip atamalar yapılmıştır. Çalışmada tanıtımı amaçlanan Beagle programında referans veri setlerinin büyüklükleri arasındaki farklılıkların, atama doğruluğu üzerine belirgin bir etkisi saptanamamıştır. Sonuç olarak, Beagle programında farklı büyüklüklere sahip örneklerden elde edilen sonuçlar doğrultusunda, yüksek doğruluk derecesinde atamalar yapabildiğini göstermiştir.
Evaluation of Beagle Genotype Imputation Method and An Application
This study describes the genotype imputation method using the Beagle program and was completed with the aim of evaluating the imputation performance in three different scenarios. A population-based imputation method, the Beagle program uses linkage disequilibrium (LD) information between missing single nucleotid polimorfizm (SNP) and observed SNPs, the local haplotype cluster (Browning) model to offer high rates of imputation accuracy for estimation of deficient genotypes. With this aim, the study used 1356 SNP data from the 22nd chromosome of 191 individuals in the 1000 Genome project, cutting the dataset at random rates of 20%, 50% and 70% to create three different scenarios. The Allelic-R2 values obtained as a result of the three scenarios were larger than 90% and imputations with high degree of accuracy were made. In this study the differences in the size of the reference datasets in the Beagle program were not identified to have a clear effect on imputation accuracy. In conclusion, in terms of results obtained from samples with different sizes using the Beagle program, imputations with high accuracy could be made.
___
- Referans 1: Doç. Dr. Ecevit EYDURAN
Referans 2: Yrd. Doç.Dr. Şenol ÇELİK
Referans 3. Yrd. Doç. Dr. Yılmaz KAYA