HIV-1 Proteaz Özgünlüğünün Yeni Bir Öznitelik Temsili Yöntemi ile Proteomik Analizi

Bu çalışmada HIV-1 proteaz enzimi bölünme kısımlarının tahmini için Fizikokimyasal Tabanlı Kodlama Yöntemi (FTKY) adı verilen yeni bir öznitelik kodlama yöntemi uygulandı. FTKY, seçilen en iyi 10-fk (fizikokimyasal), 20-fk, 30-fk, 40-fk ve 50-fk özelliğe göre sınıf doğruluğu, duyarlık ve Alıcı İşletim Karakteristiği Eğrisi Altında Kalan Alan (AİKAA) değerleri bakımından Doğrusal Destek Vektör Makineleri (DDVM) yöntemi kullanılarak test edilmiştir. Testlerde güncel iki HIV-1 proteaz veri seti, PR-1625 ve PR-3261 kullanılmıştır. Elde edilen deneysel sonuçlara göre 10-fk’ya göre yapılan kodlamalarda, PR-1625 veri seti üzerinde en yüksek performans elde edilirken PR-3261’de ise en düşük performans elde edilmiştir. Elde edilen deneysel sonuçlara göre FTKY, tek sınıflandırıcı üzerinde PR-1625 üzerinde en yüksek sınıf doğruluğunu % 95,21 ile en iyi 10-fk, PR-3261 üzerinde ise % 94,37 sınıf doğruluğu ile en iyi 30-fk vermiştir.

Proteomic analysis of HIV-1 protease specificity with a new feature encoding method

In this study a new feature encoding scheme named FTKY (Physicochemical Based Encoding Method) has been developed for HIV-1 protease site prediction. FTKY has been tested according to selected best 10-pc(physicochemical), 20-pc, 30-pc, 40-pc and 50-pc by means of accuracy, specificity and AUROC (Area Under Receiver Operating Charecteristic Curve) on Linear Support Vector Machines. Tests have been conducted on two up-to-date HIV-1 protease datasets, PR-1625 and PR-3265. According to empirical results, FTKY has been performed better prediction of accuracy 95.21 % on PR-1625 according to best 10-pc and accuracy 94.37 % when using PR-3261 according to best 30-pc on a standalone classifier.

___

  • Beck Z.Q., Hervio L, Dawson P.E., Elder J.H., Madison E.L., Identification of efficiently cleaved substrates for HIV-1 protease using a phage display library and use in in inhibitor development. Virology 274 (2): 391-401, 2000.
  • Graves, B.J., Hatada, M.H., Miller, J. K., Graves, M.C., Roy, S., Cook, C.M., Krohn, A., Martin, J.A., Roberts, N.A., In Structure and Function of the Aspartic Protease: Genetics, Structure and Mechanisms. Dunn, B., Ed. Plenum: New York; p. 455, 1992.
  • Kuo-Chen Chou, Prediction of Human Immunodeficiency Virus Protease Cleavage Sites in Proteins, Analytical Biochemistry. 233, 1-14, 1996.
  • [4] Cai Y.D., Chou K.C., Artificial neural network model for predicting HIV protease cleavage sites in protein. Adv Eng Software, 29: 119-128, 1998.
  • Rögnvaldsson, T., You, L., Why neural networks should not be used for HIV-1 protease cleavage site prediction. Bioinformatics, 1702-1709, 2003.
  • Nanni L, Lumini A., MppS: an ensemble of Support Vector Machine based on multiple physicochemical properties of amino-acids. Neuro Computing, 69: 1688-1690, 2006.
  • Carlotta Orsenigo, Carlo Vercellis, Predicting HIV Protease-Cleavable Peptides by Discrete Support Vector Machines. Machine Learning and Data Mining in Bioinformatics, 197-206, 2007.
  • Kawashima, S., Kanehisa, M., AAindex: amino acid index database, Nucleic Acids Res. 20 (1): 374, 2000. (www.genome.jp/aaindex/)
  • Schechter, I., Berger, A. 1967. On the size of the active site in proteases. Biochemical and Biophysical Research Commuications 27, 157-162, 1967.
  • Kontijevskis, A., Wikberg, J.E., Computational proteomics analysis of HIV-1 protease interactome. Proteins-Structure Function and Bioinformatics 68(1): pp. 305-312, 2007.
  • Schilling, O., Overall, C.M., Proteome-derived, database-searchable peptide libraries for identifying protease cleavage sites. Nat Biotechnol 26(6): pp. 685-694, 2008.
  • Rognvaldsson, T., Etchells, T.A., How to find simple and accurate rules for viral protease cleavage specificities. BMC Bioinformatics 10: 149, 2009.
  • Wang, L., Support Vector Machines: Theory and Applications, Springer, 2005.
  • Gök M., Özcerit A.T., Linear Support Vector Machines for HIV-1 Protease Site Detection, ISSD'09, Sarajevo, Bosnia Herzogovia, pp. 381-384, 2009.
  • [15] Narayanan, A., Wu X., Yang, Z.R., Mining viral protease data to extract cleavage knowledge. bioinformatics, 18: suppl 1, pp. 5-13, 2002.
  • Akdemir, B., Tahmin uygulamalarında performans geliştirmek için kullanılan normalizasyon metotlarına yeni bir yaklaşım. Doktora Tezi, Selçuk Üniversitesi, 2009.
  • Jain A., Nandakumar K., Score normalization in multimodal biometric systems. Pattern Recognition, 38(12): pp. 2270-2285, 2005.
  • Fawcett, T., ROC graphs: Notes and practical considerations for researchers. Technical Report, HP Laboratories. California, USA, 2004.
  • Elmali, F., Altin Standarth ve Altin Standartsiz Durumlarda, Yari Parametrik ve Parametrik Olmayan ROC eğrisi yöntemlerinin karşılaştırılması. Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü Doktora Tezi, 2009.
  • Junshui, M.A., Y.I., Zhao., OSU SVM Toolbox for MATLAB, 2002. (http://sourceforge.net/projects/svm/)
  • Duda, R.O., hart, P.E., Stork, D.G., Pattern Classification, 2nd edition. John Wiley & Sons Inc, 2001.
Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi-Cover
  • ISSN: 1012-2354
  • Yayın Aralığı: Yılda 3 Sayı
  • Başlangıç: 1985
  • Yayıncı: Erciyes Üniversitesi