Reliability of parsimony methods for inferring phylogenetic trees

Αξιοπιστία φειδωλών μεθόδων προσδιορισμού φυλογενετικών σχημάτων
Reliability of parsimony methods for inferring phylogenetic trees

Papathanassopoulou, Aegli
Παπαθανασοπούλου, Αίγλη

PhD Thesis

2007


Two versions of MP are proposed, MP6-5 and MP6-4 that enable reducing the number of misleading informative sites that cause the problem of homoplasy. The determination of the number of informative and non-informative sites for N taxa enables analyzing all possible trees for 4, 5 and 6 taxa, under the parsimony criterion. The analysis shows that the number of parsimony trees with homoplasy increases with respect to the number of taxa. Likewise, a new multiple cDNA sequences alignment method is proposed, which is based on protein structural superposition. During the evolution, the 3-dimensional structural features of proteins are conserved, despite the changes in amino acid sequences. Starting with the superposition of experimental 3d structures of a protein from different organisms, the alignment of their aminoacid sequences is performed and then, through the correlation of their codons, the alignment of their original cDNA sequences, is achieved. The relative efficiencies of the maximum parsimony (MP) and the two proposed versions, MP6-5 and MP6-4, in obtaining the correct tree for simulated nucleotide sequence data, are studied. The results obtained indicate that, for DNA sequences of 300 - 1200 nucleotides, version MP6-5 is always better than MP because it reduces the possibility of proposing an incorrect topology. MP6-4 is better than MP in case of symmetrical evolution. The relative efficiencies of MP, the two proposed versions, i.e. MP6-5 and MP6-4, and UPGMA, in obtaining the correct tree for restriction-site data, are also studied. With the exception of applying MP6-4 in a large, varying substitution rate of 0.1, the results show that both MP6-5 and MP6-4 are better than MP. All the algorithms, i.e. MP, MP6-5 and MP6-4, run on actual data. This data consists of six aligned sequences of cDNA from four enzyme families, namely SOD, DHFR, TIM and ADH. The multiple cDNA sequences alignment makes use of the new proposed method. All these algorithms reconstruct the same evolutionary trees. In addition, the results show a good correlation with the evolutionary schemes proposed by the NCBI taxonomy. This provides a good indication that the new method of multiple alignment of nucleotide sequences provides reliable data to evolutionary studies.
Προτείνονται οι τεχνικές βελτιώσεις, MP6-5 και MP6-4, της ισοβαρούς φειδωλής μεθόδου για τον προσδιορισμό των εξελικτικών σχημάτων οι οποίες αντιμετωπίζουν την ομοπλασία των παραπλανητικών θέσεων. Με τον προσδιορισμό του πλήθους των πληροφοριακών και μη πληροφοριακών θέσεων και των σχετικών μαθηματικών αποδείξεων, γίνεται δυνατή η ανάλυσή της συμπεριφοράς της ισοβαρούς φειδωλής μεθόδου στο σύνολο των δυνατών πληροφοριακών θέσεων 4, 5 η 6 εξελικτικών μονάδων. Διαπιστώνεται ότι, όταν αυξάνει ο αριθμός Ν των εξελικτικών μονάδων, η συμμετοχή των εξεταζόμενων δέντρων, που υπόκεινται στο πρόβλημα της ομοπλασίας, επίσης αυξάνει. Επιπροσθέτως, προτείνεται ένας νέος τρόπος πολλαπλής στοίχισης ακολουθιών cDNA, που βασίζεται στην δομική στοίχιση της τρισδιάστατης δομής των πρωτεϊνών. Στην παρούσα διατριβή, αξιολογείται η αποτελεσματικότητα των προτεινόμενων τεχνικών βελτιώσεων MP6-5 και MP6-4 ως προς εκείνην της ισοβαρούς φειδωλής μεθόδου (MP) (i) σε τεχνητά δεδομένα και (ii) σε πραγματικά δεδομένα. Τα αποτελέσματα δείχνουν ότι: 1) σε προσομοιωμένες νουκλεοτιδικές ακολουθίες DNA μήκους 300-1200 βάσεων (i) η MP6-5 είναι καλύτερη από την MP και (ii) η MP6-4 είναι καλύτερη από την MP όταν η εξέλιξη έχει συμβεί συμμετρικά. 2) σε συγκριτικούς χάρτες περιοριστικών θέσεων οι τεχνικές βελτιώσεις MP6-5, MP6-4 είναι καλύτερες από τη μέθοδο MP. 3) σε πραγματικά δεδομένα στοιχισμένων ακολουθιών cDNA τεσσάρων οικογενειών ενζύμων SOD, DHFR, TIM, ADH, από μακρινούς εξελικτικά οργανισμούς: • οι τεχνικές βελτιώσεις MP6-5, MP6-4 και η μέθοδος MP προτείνουν, ως πλέον φειδωλές, τις ίδιες τοπολογίες • στις τρεις οικογένειες ενζύμων, SOD, TIM, ADH, τα προτεινόμενα, από όλους τους εφαρμοζόμενους αλγόριθμους, πλέον φειδωλά σχήματα είναι όμοια με τα εξελικτικά σχήματα που υποδεικνύει η NCBI taxonomy. Στην οικογένεια DHFR το προτεινόμενο εξελικτικό σχήμα έρχεται μεν σε αντίθεση με εκείνο της NCBI taxonomy, η αντίθεση ωστόσο περιορίζεται μόνο σε έναν εξελικτικό κλάδο (ομαδοποίηση αρχαιοβακτηρίου με βακτήρια). Από τα παραπάνω προκύπτει η ένδειξη ότι ο νέος τρόπος πολλαπλής στοίχισης των νουκλεοτιδικών ακολουθιών παρέχει αξιόπιστα δεδομένα σε εξελικτικές μελέτες.

Γεωπονικές Επιστήμες και Κτηνιατρική ➨ Γεωπονική Βιοτεχνολογία

Agricultural and Veterinary Sciences
Γεωπονική Βιοτεχνολογία
Γεωπονικές Επιστήμες και Κτηνιατρική
Δομική στοίχιση αμινοξικών ακολουθιών
Φειδωλή μέθοδος
Agricultural Biotechnology
Multiple cDNA sequence alignment
Structural alignment
SOD
Parsimony methods
Homoplasy
Πολλαπλή στοίχιση ακολουθιών cDNA
Διϋπροφολική αφυδρογονάση DHER
DHER
Ομοπλασία
Ισομεράση φωσφοτριόζης TIM
TIM
Υπεροξειδάση υδρογόνου SOD
Informative sites
Πληροφοριακές θέσεις

Greek

Agricultural University of Athens
Γεωπονικό Πανεπιστήμιο Αθηνών

Γεωπονικό Πανεπιστήμιο Αθηνών. Τμήμα Γεωπονικής Βιοτεχνολογίας. Εργαστήριο Γενετικής




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)