University of Crete
E-Locus Institutional Repository
2017 (EN)
Εξελικτικά μοντέλα αμινοξικών υποκαταστέσεων βασιζόμενα στην γειτονική τριτοταγή δομή τους
Evolutionary models of amino acids substitutions based on their neighborhood tertiary structure

Πριμέτης, Ηλίας Ν.

Τζαμαρίας, Δημήτρης
Ηλιόπουλος, Ιωάννης
Παυλίδης, Παύλος

Οι ενδοπρωτεϊνικές αλληλεπιδράσεις βασίζονται στα αμινοξέα που παίρνουν μέρος σε αυτές. Υποτίθεται ότι οι ενεργειακά ευνοϊκές αλληλεπιδράσεις διατηρούνται, ενώ οι μη ευνοϊκές εξαλείφονται κατά την εξέλιξη. Εμείς χρησιμοποιήσαμε τον Protein Interaction Statistics (PrInS) αλγόριθμο για να περιγράψουμε στατιστικά τις αλληλεπιδράσεις των αμινοξέων, χρησιμοποιώντας πρωτεϊνικές δομές. Ο αλγόριθμος PrInS παράγει έναν βαθμολογικό πίνακα που περιγράφει την συχνότητα των αλληλεπιδράσεων μεταξύ των αμινοξέων στις πρωτεϊνικές δομές. Σε αυτή την έρευνα, χρησιμοποιήσαμε τις πρωτεϊνικές δομές των άλφα ελικοειδών πρωτεϊνών της μεμβράνης από την RCSB PDB βάση δεδομένων. Ο βαθμολογικός πίνακας που προέκυψε, μετατράπηκε σε έναν πίνακα αποστάσεων (Ευκλείδια, Manhattan και Pearson) M των αμινοξέων, όπου η τιμή Μij σημαίνει την απόσταση μεταξύ των γειτονιών των αμινοξέων i και j. Για να ελέγξουμε την εγκυρότητα της μεθοδολογίας μας, μετρήσαμε τις παρατηρημένες αμινοξικές υποκαταστάσεις στα 224 alignments ομόλογων πρωτεϊνών και τις συσχετίσαμε με τον πίνακα Μ. Υποθέτοντας της ανθρώπινες πρωτεϊνικες αλληλουχίες ως σημείο αναφοράς, υπολογίσαμε την απόσταση μεταξύ του ανθρώπου και των άλλων 19 ειδών (16 πρωτεύοντα και 3 άλλα θηλαστικά) για όλες τις 224 πρωτεϊνες των δεδομένων μας, χρησιμοποιώντας την προσέγγιση μας και τους πίνακες αμινοξικών υποκαταστάσεων BLOSUM62 και PAM120. Τα αποτελέσματα ήταν συγκρίσιμα, το οποίο υποδηλώνει ότι η δική μας προσέγγιση συλλαμβάνει πληροφορίες για την πρωτεϊνική εξέλιξη με παρόμοιο τρόπο με τους πίνακες αμινοξικών υποκαταστάσεων BLOSUM62 και PAM120. Τελικά, οι πίνακες αποστάσεων μετατράπηκαν σε πίνακες αναλογιών για τον υπολογισμό της πιθανοφάνειας των multiple alignments και των πρωτεϊνικών περιοχών κάθε multiple alignment. (EL)
Intra-protein interactions depend on the involved amino acids. It is assumed that the energetically favourable interactions have been preserved, while the unfavourable have been eliminated during evolution. We have used the Protein Interaction Statistics (PrInS) algorithm to statistically describe interactions between amino acids using protein structures. PrInS produces a scoring matrix to describe the frequency of amino acid interactions in the protein structures. In this project, we used structures of alpha helical membrane proteins from the RCSB PDB database. The resulting scoring matrix was converted to an amino acids distance (Euclidean, Manhattan or Pearson) matrix M, where Mij value denotes the distance between the neighbourhoods of amino acid i and j. To test the validity of our methodology, we counted the observed number of amino acid changes in 224 alignments of homologous proteins and we correlated them with the M matrix. Assuming human protein sequences as a reference, we calculated the distance between human and 19 other species (16 primates and 3 other mammals) for all 224 proteins of our dataset, using our approach, BLOSUM62 and PAM120 amino acid substitution matrices. Outcomes were comparable, suggesting that our approach captures information about protein evolution process in a similar fashion as BLOSUM62 and PAM120. Finally, distance matrices were converted to rate matrices to calculate the likelihood of multiple alignments and the likelihood of each site in alignments. (EN)


Δομική βιολογία
Υπολογιστική βιολογία
Structural biology
Computational biology

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)


