Μέθοδοι ανάλυσης τρισδιάστατων σχημάτων για αναζήτηση ομοιότητας πρωτεϊνών και protein docking

 
This item is provided by the institution :

Repository :
National Archive of PhD Theses
see the original item page
in the repository's web site and access all digital files if the item*
share



PhD thesis (EN)

2014 (EN)

3D shape analysis approaches for protein docking and similarity search
Μέθοδοι ανάλυσης τρισδιάστατων σχημάτων για αναζήτηση ομοιότητας πρωτεϊνών και protein docking

Axenopoulos, Apostolos
Αξενόπουλος, Απόστολος

Οι λειτουργίες των πρωτεϊνών πραγματοποιούνται κυρίως μέσω των αλληλεπιδράσεών τους με άλλα μόρια. Η έρευνα στο πεδίο των αλλλεπιδράσεων των πρωτεϊνών έχει προσελκύσει το ενδιαφέρον των επιστημόνων εδώ και δεκαετίες και εξακολουθεί να παραμένει ένα από τα σημαντικότερα προβλήματα στο χώρο της βιολογίας. Μεταξύ άλλων, το ενδιαφέρον στρέφεται στην ανάπτυξη υπολογιστικών μεθόδων ικανών να προβλέψουν με αυτόματο τρόπο την τρισδιάστατη δομή των συμπλόκων μορίων πρωτεϊνών, όπως το “Protein Docking”. Στην παρούσα διατριβή, προτείνονται καινοτόμες μέθοδοι για την υποβοήθηση των διαδικασιών του protein docking και της αναζήτησης πρωτεϊνικών δομών. Οι προτεινόμενες μέθοδοι βασίζονται στην ιδέα ότι όταν δυο πρωτεΐνες αλληλεπιδρούν οι επιφάνειές τους στην περιοχή σύνδεσης πρέπει να παρουσιάζουν γεωμετρική συμπληρωματικότητα (εκτός από τη φυσικοχημική συμπληρωματικότητα).Η πρώτη μέθοδος για protein docking βασίζεται στο ταίριασμα γεωμετρικά συμπληρωματικών επιφανειών. Η βασική ιδέα του αλγορίθμου είναι η χρήση ενός περιγραφέα (descriptor) που υπολογίζει ομοιότητα τρισδιάστατων σχημάτων (3D shape similarity) για τον υπολογισμό γεωμετρικής συμπληρωματικότητας, δεδομένου ότι ισομεγέθη συμπληρωματικά τμήματα επιφανειών τείνουν να έχουν παρόμοιο σχήμα. Μια σημαντική ιδιότητα του προτεινόμενου περιγραφέα είναι η αμεταβλητότητά του κατά την περιστροφή των επιφανειακών τμημάτων. Το ταίριασμα των συμπληρωματικών τμημάτων πραγματοποιείται με σύγκριση κατά ζεύγη των αντίστοιχων περιγραφέων, παρέχοντας έτσι ένα γρήγορο γεωμετρικό φιλτράρισμα. Με τον τρόπο αυτό, αποφεύγονται οι εξαντλητικές μετατοπίσεις και περιστροφές και επιταχύνεται η διαδικασία του docking.Η δεύτερη μέθοδος αποτελεί επέκταση της προηγούμενης με στόχο τη δημιουργία αλγορίθμου για docking που παρέχει μεγαλύτερη σταθερότητα όταν οι πρωτεΐνες παρουσιάζουν σχετική ευκαμψία (flexibility). Η περίπτωση του “unbound docking”, όπως αλλιώς λέγεται, απαιτεί οι δυο επιφάνειες να παρουσιάζουν “κατά προσέγγιση” συμπληρωματικότητα, παρά “ακριβή” συμπληρωματικότητα όπως συμβαίνει στην περίπτωση του “bound docking”. Πειραματικά αποτελέσματα απέδειξαν ότι ο βελτιωμένος αλγόριθμος είναι πιο εύρωστος στα θέματα ευξαμψίας των πρωτεϊνών. Επιπλέον, παρουσίαζεται μια νέα συνάρτηση βαθμολόγησης (scoring function), η οποία συνδυάζει γεωμετρική συμπληρωματικότητα με φυσικοχημικούς παράγοντες, όπως δυναμικά Coulomb, δυνάμεις van der Waals, υδροφοβικότητα. Η συνάρτηση δέχεται ως είσοδο τη λίστα με τις υποψήφιες θέσεις (πιθανά σύμπλοκα) και παράγει μια νέα κατάταξη όπου τα σωστά σύμπλοκα εμφανίζονται συχνότερα στις πρώτες θέσεις.Η τελευταία μέθοδος είναι μια προσέγγιση για σύγκριση ομοιότητας τρισδιάστατων πρωτεϊνικών δομών. Μια από τις πιθανές εφαρμογές της είναι στο πρόβλημα του “virtual screening”, της αναζήτησης όμοιων προσδετών (ligands) μέσα από βάσεις μορίων, με στόχο το σχεδιασμό φαρμάκων. Πιο συγκεκριμένα, ένας νέος περιγραφέας σχήματος προτείνεται, ο οποίος συνδιάζει τοπικά (local), καθολικά (global) και υβριδικά (local-global) χαρακτηριστικά σχήματος. Πειραματικά αποτελέσματα αποδεικνύουν ότι ο προτεινόμενος περιγραφέας είναι κατάλληλος για αναζήτηση ομοιότητας ακόμα και όταν τα μόρια-προσδέτες παρουσιάζουν σχετική ευκαμψία. Παράλληλα, είναι εξίσου αποτελεσματικός στην αναζήτηση ομοιότητας άκαμπτων (rigid) πρωτεϊνών. Λόγο του μικρού του μεγέθους (compactness), ο νέος περιγραφέας είναι κατάλληλος για γρήγορη αναζήτηση όμοιων μορίων ακόμα και από πολύ μεγάλες βάσεις.
Protein functions are carried out through their interactions with other biological molecules. Research in protein interactions has attracted special interest from the scientific community for decades and still remains a hot research topic. Among others, there is an increasing interest to develop computational methods that automatically predict the 3D structure of protein-protein complexes, such as protein-protein docking. In this thesis, we propose novel approaches to assist protein-protein docking and protein similarity search. The proposed methods are based on the fact that when two proteins interact, their surfaces at the binding site demonstrate geometric complementarity (apart from physicochemical complementarity). The first docking method is based on geometric complementarity matching of the molecular surfaces. The basic idea of this algorithm is to use a descriptor that measures 3D shape similarity for computing shape complementarity, since equally-sized complementary surface patches tend to have similar shapes. A basic property of the proposed shape descriptor is its invariance to rotations of the surface patches. Complementarity matching is achieved through pairwise comparison of the local shape descriptors, thus, providing a fast geometric filtering and avoiding the exhaustive translational and rotational search of existing docking techniques.The second docking method extends this work in order to produce a docking algorithm that is robust to relatively small conformational changes of the interacting proteins. Since accurate surface complementarity has been proven to be inappropriate in unbound docking, the new method allows binding of surfaces with approximate surface complementarity. Experiments proved that the improved algorithm is more robust to conformational changes. Furthermore, a new scoring function is presented, which combines geometric complementarity with physicochemical factors, such as Coulomb potentials, van der Waals forces, hydrophobicity. The scoring function takes as input the list of candidate poses and a new rank list is produced having more near-native poses in the first positions. The last method that is proposed in this dissertation is an approach for molecular shape comparison. It aims to assist the problem of virtual screening, a process that is commonly used in rational drug design. More specifically, a new shape descriptor is proposed that combines local, global and hybrid local-global shape features. It is experimentally proven that the proposed compound descriptor is appropriate for similarity search of flexible ligands, while at the same time is robust in shape comparison of rigid proteins. Due to its compactness, the new descriptor enables fast screening of similar ligands to a target molecule from very large compound databases.

PhD Thesis

Biological Sciences
Βιολογία
Computer and Information Sciences
Φυσικές Επιστήμες
3d pattern recognition
Βιοπληροφορική
Αναζήτηση τρισδιάστατων προτύπων
Protein docking
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Natural Sciences
Ανάλυση τρισδιάστατων σχημάτων
Αναζήτηση ομοιότητας πρωτεΐνών
Bioinformatics
Protein similarity search
3D shape analysis


English

2014


University of Thessaly (UTH)
Πανεπιστήμιο Θεσσαλίας




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)