Οι μεμβρανικές πρωτεΐνες επιτελούν µια σειρά από πολύ σημαντικές λειτουργίες,
απαραίτητες για τη ζωή του κυττάρου. Τη μεγάλη πλειοψηφία των διαμεμβρανικών
πρωτεϊνών, αποτελούν πρωτεΐνες των οποίων τα διαμεμβρανικά τμήματα έχουν τη
δομή α-έλικας η οποία αποτελείται κυρίως από υδρόφοβα αμινοξικά κατάλοιπα που
διαπερνούν το υδρόφοβο εσωτερικό της λιπιδικής διπλοστιβάδας. Η μεγάλη
σπουδαιότητα των διαμεμβρανικών πρωτεϊνών, αλλά και οι εγγενείς δυσκολίες που
παρουσιάζονται σε προσπάθειες κρυστάλλωσης τους, καθιστούν απαραίτητη τη
δημιουργία υπολογιστικών αλγορίθμων οι οποίοι θα πρέπει να προβλέπουν σχετικά
αξιόπιστα και γρήγορα τη δευτεροταγή τους δομή αλλά και τα πιθανά λειτουργικά
τους χαρακτηριστικά. Αποφασιστικής σημασίας για τη μελέτη της δομής μιας
διαμεμβρανικής πρωτεΐνης είναι η εύρεση της τοπολογίας της στη μεμβράνη, δηλαδή
ο αριθμός των διαμεμβρανικών τμημάτων, η θέση τους στην ακολουθία της πρωτεΐνης
και ο προσανατολισμός τους σε σχέση με το επίπεδο της μεμβράνης. Στα πλαίσια
της διατριβής αυτής αναπτύχθηκαν υπολογιστικές μέθοδοι, βασισμένες σε σύγχρονες
μαθηματικές τεχνικές, με τις οποίες θα μπορεί να γίνεται πρόγνωση της δομής και
της λειτουργίας μεμβρανικών πρωτεϊνών. Συγκεκριμένα, επικεντρωθήκαμε στις α-
ελικοειδείς διαμεμβρανικές πρωτεΐνες και στην κατηγορία των περιφερειακών
μεμβρανικών πρωτεϊνών. Παράλληλα δημιουργήθηκαν δημόσια διαθέσιμες βάσεις
δεδομένων με στοιχεία σχετικά με τη δομή και τη λειτουργία των μεμβρανικών
πρωτεϊνών και ιδιαίτερων χαρακτηριστικών τους. Η μέθοδος LPLRpred που
αναπτύχθηκε, επιτρέπει την εύρεση μιας περιοχής στην ακολουθία των πρωτεϊνών η
οποία μπορεί να αποτελέσει θέση εισαγωγής αλληλουχιών στόχων στα πειράματα
προσδιορισμού της τοπολογίας των διαμεμβρανικών πρωτεϊνών. Η πληροφορία αυτή
μπορεί να χρησιμοποιηθεί για την καθοδήγηση των πειραμάτων με υπολογιστικό
τρόπο και να οδηγήσει σε ελαχιστοποίηση του αριθμού και του κόστους τους. Η
βάση δεδομένων ExTopoDB που κατασκευάστηκε αποτελεί την πλέον ενημερωμένη,
παγκόσμια πηγή πειραματικών δεδομένων για την τοπολογία α-ελικοειδών
διαμεμβρανικών πρωτεϊνών. Στις διαμεμβρανικές πρωτεΐνες οι περιοχές οι οποίες
φωσφορυλιώνονται και γλυκοζυλιώνονται εδράζονται στον κυτταροπλασματικό και
εξωκυττάριο χώρο αντίστοιχα. Η μέθοδος HMMpTM εισήγαγε ένα σημαντικό
χαρακτηριστικό στην πρόγνωση της τοπολογίας των α-ελικοειδών διαμεμβρανικών
πρωτεϊνών αξιοποιώντας αυτή την πληροφορία. Η μέθοδος GPCRpipe επιτρέπει το
διαχωρισμό των συζευγμένων με G-πρωτεΐνες υποδοχέων (GPCRs) από άλλες
κατηγορίες πρωτεϊνών και παρέχει σημαντικές πληροφορίες για τη δομή και
λειτουργία τους. Η ανάλυση που πραγματοποιήθηκε για τις περιφερειακές
μεμβρανικές πρωτεΐνες παρέχει σημαντικές πληροφορίες για τη δομή και τη
λειτουργία τους στη μεμβράνη. Από τη μελέτη του δικτύου αλληλεπιδράσεων των
περιφερειακών μεμβρανικών πρωτεϊνών αναδεικνύονται πρωτεΐνες οι οποίες έχουν
κεντρικό ρόλο και μπορούν να αποτελέσουν στόχους της φαρμακευτικής έρευνας και
περαιτέρω πειραματικής μελέτης. Η βάση mpMoRFsDB που κατασκευάστηκε, μαζί με
την ανάλυση που πραγματοποιήθηκε αποτελεί την πρώτη μελέτη του φαινομένου της
εγγενούς έλλειψης δομής στις αλληλεπιδράσεις των μεμβρανικών πρωτεϊνών και
παρέχει σημαντικά δεδομένα για την περαιτέρω μελέτη του φαινομένου στις
πρωτεΐνες αυτές.
(EL)
Membrane proteins perform a variety of very important biological functions
necessary for the survival of the cell. The vast majority of transmembrane
proteins are proteins whose transmembrane segments form an alpha-helix composed
of mainly hydrophobic residues, spanning the lipid bilayer hydrophobic
interior. The importance of transmembrane proteins, as well as the inherent
difficulties in crystallizing and obtaining a three-dimensional structure of
these proteins, dictates the need for developing computational algorithms and
tools that may allow a reliable and fast prediction of their structural and
functional features. In order to understand their function we must acquire
knowledge about their structure and topology in relation to the membrane. By
topology, we refer to the knowledge of the number and the exact localization of
transmembrane segments, as well as their orientation with respect to the lipid
bilayer. In this study, we developed novel algorithms and computer software,
based on modern mathematical methods and machine learning approaches, to
predict the structure and function of membrane proteins. We focused on two
major groups; alpha-helical transmembrane proteins and peripheral membrane
proteins. In addition, we constructed specialized, publicly available
databases containing information about the structure and function of membrane
proteins. The LPLRpred method allows the determination of a region across a
protein sequence that can be used for the insertion of target sites when
studying the topology of alpha-helical transmembrane proteins. This
information may be used to minimize the number and the cost of experiments and
computationally guide the design of new experiments. The ExTopoDB database is
the most up-to-date worldwide resource including experimental information about
the topology of alpha-helical transmembrane proteins. The database might be a
valuable tool for researchers, in order to design new experiments and, also,
for bioinformaticians, since it provides a large representative set that can be
used for training and testing prediction algorithms. Phosphorylation and
glycosylation are post-translational modifications (PTMs) that occur in a
compartment-specific manner and therefore the presence of a phosphorylation or
glycosylation site in a transmembrane protein provides valuable topological
information. We examined the combination of phosphorylation and glycosylation
site prediction with transmembrane protein topology prediction. The HMMpTM
method integrates a novel feature in topology prediction. It is not just a
consensus of post-translational modification and topology prediction but
integrates in a single Hidden Markov Model phosphorylation and glycosylation
prediction in order to more accurately predict the orientation of transmembrane
proteins in membranes. Given that the general topology prediction algorithms
perform poorly in the case of GPCRs, we developed a specialized method for
their structural topological annotation, and functional classification.
GPCRpipe is a pipeline for the accurate detection and annotation of GPCRs in
proteomes. Moreover, GPCRpipe may offer information regarding the family of
GPCRs in which the predicted proteins may belong to and the coupling
specificity to certain families of G-proteins. A study of the molecular
interactions of peripheral membrane proteins was performed in order to obtain
insights about their role and organization, in relation to the human plasma
membrane. The mpMoRFsDB database and the analysis of MoRFs in membrane proteins
is the first study of such protein regions in membrane proteins and provide
insights about the disorder-based protein-protein interactions in membrane
proteins.
(EN)