Οι ενδοπρωτεϊνικές αλληλεπιδράσεις βασίζονται στα αμινοξέα που παίρνουν μέρος σε αυτές.
Υποτίθεται ότι οι ενεργειακά ευνοϊκές αλληλεπιδράσεις διατηρούνται, ενώ οι μη ευνοϊκές
εξαλείφονται κατά την εξέλιξη. Εμείς χρησιμοποιήσαμε τον Protein Interaction Statistics (PrInS)
αλγόριθμο για να περιγράψουμε στατιστικά τις αλληλεπιδράσεις των αμινοξέων, χρησιμοποιώντας
πρωτεϊνικές δομές. Ο αλγόριθμος PrInS παράγει έναν βαθμολογικό πίνακα που περιγράφει την
συχνότητα των αλληλεπιδράσεων μεταξύ των αμινοξέων στις πρωτεϊνικές δομές. Σε αυτή την
έρευνα, χρησιμοποιήσαμε τις πρωτεϊνικές δομές των άλφα ελικοειδών πρωτεϊνών της μεμβράνης
από την RCSB PDB βάση δεδομένων. Ο βαθμολογικός πίνακας που προέκυψε, μετατράπηκε σε
έναν πίνακα αποστάσεων (Ευκλείδια, Manhattan και Pearson) M των αμινοξέων, όπου η τιμή Μij
σημαίνει την απόσταση μεταξύ των γειτονιών των αμινοξέων i και j. Για να ελέγξουμε την
εγκυρότητα της μεθοδολογίας μας, μετρήσαμε τις παρατηρημένες αμινοξικές υποκαταστάσεις στα
224 alignments ομόλογων πρωτεϊνών και τις συσχετίσαμε με τον πίνακα Μ. Υποθέτοντας της
ανθρώπινες πρωτεϊνικες αλληλουχίες ως σημείο αναφοράς, υπολογίσαμε την απόσταση μεταξύ του
ανθρώπου και των άλλων 19 ειδών (16 πρωτεύοντα και 3 άλλα θηλαστικά) για όλες τις 224
πρωτεϊνες των δεδομένων μας, χρησιμοποιώντας την προσέγγιση μας και τους πίνακες αμινοξικών
υποκαταστάσεων BLOSUM62 και PAM120. Τα αποτελέσματα ήταν συγκρίσιμα, το οποίο
υποδηλώνει ότι η δική μας προσέγγιση συλλαμβάνει πληροφορίες για την πρωτεϊνική εξέλιξη με
παρόμοιο τρόπο με τους πίνακες αμινοξικών υποκαταστάσεων BLOSUM62 και PAM120. Τελικά,
οι πίνακες αποστάσεων μετατράπηκαν σε πίνακες αναλογιών για τον υπολογισμό της
πιθανοφάνειας των multiple alignments και των πρωτεϊνικών περιοχών κάθε multiple alignment.
(EL)
Intra-protein interactions depend on the involved amino acids. It is assumed that
the energetically favourable interactions have been preserved, while the unfavourable
have been eliminated during evolution. We have used the Protein Interaction Statistics
(PrInS) algorithm to statistically describe interactions between amino acids using protein
structures. PrInS produces a scoring matrix to describe the frequency of amino acid
interactions in the protein structures. In this project, we used structures of alpha helical
membrane proteins from the RCSB PDB database. The resulting scoring matrix was
converted to an amino acids distance (Euclidean, Manhattan or Pearson) matrix M,
where Mij value denotes the distance between the neighbourhoods of amino acid i and
j. To test the validity of our methodology, we counted the observed number of amino
acid changes in 224 alignments of homologous proteins and we correlated them with
the M matrix. Assuming human protein sequences as a reference, we calculated the
distance between human and 19 other species (16 primates and 3 other mammals) for
all 224 proteins of our dataset, using our approach, BLOSUM62 and PAM120 amino
acid substitution matrices. Outcomes were comparable, suggesting that our approach
captures information about protein evolution process in a similar fashion as BLOSUM62
and PAM120. Finally, distance matrices were converted to rate matrices to calculate the
likelihood of multiple alignments and the likelihood of each site in alignments.
(EN)