Two versions of MP are proposed, MP6-5 and MP6-4 that enable reducing the number of misleading informative sites that cause the problem of homoplasy. The determination of the number of informative and non-informative sites for N taxa enables analyzing all possible trees for 4, 5 and 6 taxa, under the parsimony criterion. The analysis shows that the number of parsimony trees with homoplasy increases with respect to the number of taxa. Likewise, a new multiple cDNA sequences alignment method is proposed, which is based on protein structural superposition. During the evolution, the 3-dimensional structural features of proteins are conserved, despite the changes in amino acid sequences. Starting with the superposition of experimental 3d structures of a protein from different organisms, the alignment of their aminoacid sequences is performed and then, through the correlation of their codons, the alignment of their original cDNA sequences, is achieved. The relative efficiencies of the maximum parsimony (MP) and the two proposed versions, MP6-5 and MP6-4, in obtaining the correct tree for simulated nucleotide sequence data, are studied. The results obtained indicate that, for DNA sequences of 300 - 1200 nucleotides, version MP6-5 is always better than MP because it reduces the possibility of proposing an incorrect topology. MP6-4 is better than MP in case of symmetrical evolution. The relative efficiencies of MP, the two proposed versions, i.e. MP6-5 and MP6-4, and UPGMA, in obtaining the correct tree for restriction-site data, are also studied. With the exception of applying MP6-4 in a large, varying substitution rate of 0.1, the results show that both MP6-5 and MP6-4 are better than MP. All the algorithms, i.e. MP, MP6-5 and MP6-4, run on actual data. This data consists of six aligned sequences of cDNA from four enzyme families, namely SOD, DHFR, TIM and ADH. The multiple cDNA sequences alignment makes use of the new proposed method. All these algorithms reconstruct the same evolutionary trees. In addition, the results show a good correlation with the evolutionary schemes proposed by the NCBI taxonomy. This provides a good indication that the new method of multiple alignment of nucleotide sequences provides reliable data to evolutionary studies.
Προτείνονται οι τεχνικές βελτιώσεις, MP6-5 και MP6-4, της ισοβαρούς φειδωλής μεθόδου για τον προσδιορισμό των εξελικτικών σχημάτων οι οποίες αντιμετωπίζουν την ομοπλασία των παραπλανητικών θέσεων. Με τον προσδιορισμό του πλήθους των πληροφοριακών και μη πληροφοριακών θέσεων και των σχετικών μαθηματικών αποδείξεων, γίνεται δυνατή η ανάλυσή της συμπεριφοράς της ισοβαρούς φειδωλής μεθόδου στο σύνολο των δυνατών πληροφοριακών θέσεων 4, 5 η 6 εξελικτικών μονάδων. Διαπιστώνεται ότι, όταν αυξάνει ο αριθμός Ν των εξελικτικών μονάδων, η συμμετοχή των εξεταζόμενων δέντρων, που υπόκεινται στο πρόβλημα της ομοπλασίας, επίσης αυξάνει. Επιπροσθέτως, προτείνεται ένας νέος τρόπος πολλαπλής στοίχισης ακολουθιών cDNA, που βασίζεται στην δομική στοίχιση της τρισδιάστατης δομής των πρωτεϊνών. Στην παρούσα διατριβή, αξιολογείται η αποτελεσματικότητα των προτεινόμενων τεχνικών βελτιώσεων MP6-5 και MP6-4 ως προς εκείνην της ισοβαρούς φειδωλής μεθόδου (MP) (i) σε τεχνητά δεδομένα και (ii) σε πραγματικά δεδομένα. Τα αποτελέσματα δείχνουν ότι: 1) σε προσομοιωμένες νουκλεοτιδικές ακολουθίες DNA μήκους 300-1200 βάσεων (i) η MP6-5 είναι καλύτερη από την MP και (ii) η MP6-4 είναι καλύτερη από την MP όταν η εξέλιξη έχει συμβεί συμμετρικά. 2) σε συγκριτικούς χάρτες περιοριστικών θέσεων οι τεχνικές βελτιώσεις MP6-5, MP6-4 είναι καλύτερες από τη μέθοδο MP. 3) σε πραγματικά δεδομένα στοιχισμένων ακολουθιών cDNA τεσσάρων οικογενειών ενζύμων SOD, DHFR, TIM, ADH, από μακρινούς εξελικτικά οργανισμούς: • οι τεχνικές βελτιώσεις MP6-5, MP6-4 και η μέθοδος MP προτείνουν, ως πλέον φειδωλές, τις ίδιες τοπολογίες • στις τρεις οικογένειες ενζύμων, SOD, TIM, ADH, τα προτεινόμενα, από όλους τους εφαρμοζόμενους αλγόριθμους, πλέον φειδωλά σχήματα είναι όμοια με τα εξελικτικά σχήματα που υποδεικνύει η NCBI taxonomy. Στην οικογένεια DHFR το προτεινόμενο εξελικτικό σχήμα έρχεται μεν σε αντίθεση με εκείνο της NCBI taxonomy, η αντίθεση ωστόσο περιορίζεται μόνο σε έναν εξελικτικό κλάδο (ομαδοποίηση αρχαιοβακτηρίου με βακτήρια). Από τα παραπάνω προκύπτει η ένδειξη ότι ο νέος τρόπος πολλαπλής στοίχισης των νουκλεοτιδικών ακολουθιών παρέχει αξιόπιστα δεδομένα σε εξελικτικές μελέτες.