Ανάπτυξη ευφυών μεθόδων για την ανάλυση και διαχείριση γενετικής πληροφορίας

 
This item is provided by the institution :
University of Ioannina
Repository :
Repository of UOI Olympias
see the original item page
in the repository's web site and access all digital files if the item*
share



PhD thesis (EN)

2012 (EN)
Ανάπτυξη ευφυών μεθόδων για την ανάλυση και διαχείριση γενετικής πληροφορίας

Λάμπρος, Χρήστος Δ.

Τζαφλίδου, Μαργαρίτα (EL)
Λάμπρος, Χρήστος Δ.
Πανεπιστήμιο Ιωαννίνων Σχολή Ιατρικής Τμήμα Ιατρικής Τομέας Μορφολογικός - Κλινικοεργαστηριακός. Εργαστήριο Ιατρικής Φυσικής
-

Στην παρούσα διατριβή παρουσιάζεται μεθοδολογία για την αναγνώριση της πρωτεϊνικής αναδίπλωσης η οποία ισοδυναμεί με την εύρεση της δομής του μορίου της πρωτεΐνης στο χώρο. Η μέθοδος είναι πλήρως αυτοματοποιημένη και δεδομένης μιας αλληλουχίας αμινοξέων αγνώστου δομής μπορεί να την ταξινομήσει με υψηλό ποσοστό επιτυχίας σε μία από τις γνωστές κατηγορίες πρωτεϊνικής αναδίπλωσης. Η μεθοδολογία έχει πολύ χαμηλό υπολογιστικό κόστος και καλά αποτελέσματα σε σχέση με τις υπάρχουσες μεθόδους που αναφέρονται στη διεθνή βιβλιογραφία. Αναλυτικότερα, στο πρώτο κεφάλαιο παρουσιάζεται σύντομη εισαγωγή για το γενετικό υλικό και τις πρωτεΐνες. Περιγράφεται η ροή της πληροφορίας στη μοριακή βιολογία και αναλύεται γιατί είναι τόσο σημαντική η γνώση της δομής των πρωτεϊνών για την κατανόηση της λειτουργίας του ανθρώπινου οργανισμού. Περιγράφεται επίσης σε γενικές γραμμές η συμβολή των υπολογιστικών μεθόδων στην ανάλυση της γενετικής πληροφορίας και στην εξαγωγή χρήσιμων γνώσεων για τη βιολογία. Στο δεύτερο κεφάλαιο αρχικά παρουσιάζονται οι δυσκολίες που εμφανίζονται κατά την προσπάθεια αναγνώρισης της πρωτεϊνικής αναδίπλωσης. Ακολουθεί βιβλιογραφική ανασκόπηση των ήδη δημοσιευμένων μεθόδων για την αντιμετώπιση του προβλήματος και εντοπισμός των αδύνατων σημείων τους. Στο τρίτο κεφάλαιο εισάγεται η προτεινόμενη μεθοδολογία. Περιγράφεται το κρυμμένο Μαρκοβιανό μοντέλο (Hidden Markov Model) που χρησιμοποιείται για την αναγνώριση πρωτεϊνικής αναδίπλωσης και ο τρόπος που αυτό εκπαιδεύεται με βάση δεδομένα αλληλουχιών πρωτεϊνών. Στη συνέχεια αναλύεται ο τρόπος που ταξινομούνται πρωτεΐνες αγνώστου δομής. Tέλος αξιολογείται η ικανότητα ταξινόμησης του μοντέλου με αλληλουχίες από βάσεις δεδομένων πρωτεϊνών, καθώς και με τη σύγκριση των εξαγόμενων αποτελεσμάτων με άλλες μεθόδους που έχουν προταθεί στη βιβλιογραφία. Στο τέταρτο κεφάλαιο εισάγονται συγκεκριμένες βελτιώσεις στο μοντέλο. Οι βελτιώσεις αυτές παρουσιάζονται σε δύο στάδια. Στο πρώτο στάδιο μεταβάλλεται η δομή του και στο δεύτερο στάδιο μεταβάλλεται ο τρόπος υπολογισμού των αποτελεσμάτων των υπό ταξινόμηση αλληλουχιών ως προς το μοντέλο (scoring). Οι αλλαγές οδηγούν σε απλοποίηση του μοντέλου και ταυτόχρονα καλύτερη ικανότητα ταξινόμησης των πρωτεϊνών αγνώστου δομής. Σε κάθε στάδιο η αποτελεσματικότητα της νέας μορφής του μοντέλου αξιολογείται με δεδομένα αλληλουχιών πρωτεϊνών. Τα εξαγόμενα αποτελέσματα συγκρίνονται με αυτά που προκύπτουν όταν εφαρμόζεται η αρχική μορφή του μοντέλου στα ίδια δεδομένα. Στο πέμπτο κεφάλαιο παρουσιάζεται ένα υβριδικό σύστημα που αποτελεί μια εναλλακτική προσέγγιση για την ταξινόμηση των πρωτεϊνών αγνώστου δομής. Συγκεκριμένα γίνεται συνδυασμός χρήσης μιας Μαρκοβιανής αλυσίδας και του κρυμμένου Μαρκοβιανού μοντέλου αφενός και αφετέρου μεθόδου βελτιστοποίησης που οδηγεί σε ακόμα καλύτερα αποτελέσματα. Στο έκτο κεφάλαιο παρουσιάζονται τα συμπερασμάτα της διατριβής. Πιο συγκεκριμένα εκτιμώνται τα πλεονεκτήματα και οι αδυναμίες κάθε σταδίου της προτεινόμενης μεθοδολογίας. Επιπλέον διερευνώνται οι δυνατότητες μελλοντικής επέκτασης και βελτίωσης του συστήματος.

doctoralThesis

Πρωτεΐνες (EL)

Πανεπιστήμιο Ιωαννίνων (EL)
University of Ioannina (EN)

Greek

2012


Πανεπιστήμιο Ιωαννίνων Σχολή Ιατρικής Τμήμα Ιατρικής Τομέας Μορφολογικός - Κλινικοεργαστηριακός. Εργαστήριο Ιατρικής Φυσικής (EL)



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)