see the original item page
in the repository's web site and access all digital files if the item*

PhD thesis (EN)

2008 (EN)
Φυλογενετική ανάλυση βιολογικής δεδομένων
Phylogenetic analysis of biological data

Κολλιδά, Χρυσούλα Ε.

Οι πολλαπλές συστοιχίσεις ακολουθιών αποτελούν το πρώτο βήμα για την κατασκευή φυλογενετικών δέντρων και η ποιότητά τους κρίνεται εν πολλοίς από τις συγκεκριμένες αυτές αρχικές συστοιχίσεις. Έτσι, για να μπορέσει κανείς να εκτιμήσει ένα φυλογενετικό δέντρο, που απεικονίζει την εξελικτική σχέση μεταξύ ενός συνόλου δεδομένων (πχ. πρωτεϊνών), θα πρέπει να κάνει σωστή πολλαπλή συστοίχιση. Η παρούσα διατριβή εισάγει μία νέα προσέγγιση για τον υπολογισμό πολλαπλών συστοιχίσεων ακολουθιών που σκοπό έχει να χρησιμοποιηθεί στη συνέχεια στη μεθοδολογία υπολογισμού φυλογενετικών δέντρων για να παραχθούν έτσι περισσότερο αξιόπιστα φυλογενετικά δέντρα. Πιο συγκεκριμένα, θεμελιώνονται μαθηματικά τα ασαφή κρυφά μαρκοβιανά μοντέλα για την περίπτωση βιολογικών δεδομένων (π.χ. πρωτεϊνών) ορίζοντας αρχικά τα χαρακτηριστικά ενός ασαφούς μοντέλου και στη συνέχεια προσδιορίζοντας τα τρία βασικά προβλήματα στα οποία το ασαφές κρυφό μαρκοβιανό μοντέλο μπορεί να δώσει λύση. Έπειτα, αναπτύσσονται οι τρεις νέες ασαφείς τεχνικές: ο ασαφής εμπρός αλγόριθμος, ο ασαφής πίσω αλγόριθμος και ο ασαφής αλγόριθμος Βιτέρμπι. Στη συνέχεια προτείνεται μία μεθοδολογία βελτιστοποίησης του νέου ασαφούς μαρκοβιανού μοντέλου που σκοπό έχει αρχικά τη μελέτη της ευρωστίας του νέου μοντέλου όταν αυτό συγκρίνεται με ένα γενικότερο μοντέλο, και στη συνέχεια την επιλογή των βέλτιστων συστοιχίσεων μέσω της μεγιστοποίησης των ποιοτικών χαρακτηριστικών τους, έτσι ώστε να μπορούν να χρησιμοποιηθούν στη φυλογενετική ανάλυση για την παραγωγή περισσότερο αξιόπιστων φυλογενετικών δέντρων. Η αξιολόγηση, τόσο της μεθοδολογίας βελτιστοποίησης του νέου μοντέλου, όσο και της φυλογενετικής ανάλυσης πραγματοποιείται με τη σύγκρισή του με άλλες κλασικές μεθόδους παραγωγής πολλαπλών συστοιχίσεων, συμπεριλαμβανομένης αυτής του κλασικού μαρκοβιανού μοντέλου
Aligning a multitude of sequences is the first step for producing phylogenetic trees, and the phylogenetic tree analysis depends a lot on these initial alignments. So, in order to estimate a phylogenetic tree that depicts the evolutionary relationship among multiple biological data (such as proteins), a right multiple sequence alignment is critical. This thesis deals with a new approach in producing multiple sequence alignments that are going to be used in the methodology of producing phylogenetic trees with greater reliability. More specifically, the fuzzy profile hidden markov model for the case of biological data (such as proteins) is mathematically founded, by initially defining the characteristic of the fuzzy model and then, determining the three basic problems that the fuzzy profile hidden markov model deals with. Afterwards, three new techniques are developed in order to handle the new model: the fuzzy forward, the fuzzy backward and the fuzzy Viterbi algorithm. Then a methodology is proposed in order to: a) study the robustness of the new model when compared with a more generic model, and b) to optimize the model, through the maximization of its qualitative results, in order to produce optimal multiple sequence alignments that can be used in phylogenetic analysis for the production of more reliable phylogenetic trees. The validation of both the new model optimization procedure and the phylogenetic analysis is realized with the comparison with other classic multiple sequence alignment methods including the classic profile hidden markov model

PhD Thesis / Διδακτορική Διατριβή

Fuzzy hidden Markov models
Mutliple sequence alignment
Ασαφή κρυφά Μαρκοβιανά μοντέλα
Πολλαπλή συστοίχιση ακολουθιών

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)



Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Επιστημών Υγείας, Τμήμα Ιατρικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license ( Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license ( You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.

*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)