Πρόβλεψη της κωδικής περιοχής βιολογικών αλληλουχιών

 
see the original item page
in the repository's web site and access all digital files if the item*
share




2008 (EN)
Prediction of coding region in biological sequences
Πρόβλεψη της κωδικής περιοχής βιολογικών αλληλουχιών

Τζανής, Γεώργιος Κωνσταντίνου

The rapid technological advances have resulted in an increased rate by which data arecollected. These data are usually stored in a variety of media and formats (e.g. files,databases, etc.) waiting to be analyzed sometime in the future. However, the traditionaldata analysis techniques cannot always handle these data efficiently and effectively. Thebasic reasons are the large volume and the peculiarities (e.g. noise, high dimensionspace) of the data. Therefore, the use of techniques that cure these problems is consideredindispensable. The fields of machine learning and knowledge discovery fromdatabases provide the necessary techniques.Biology is one of the fields that demand the use of machine learning and knowledgediscovery techniques. Since the conduction of large scale experiments and projects,like the Human Genome Project, became possible, the rate by which biologicaldata are collected has been exponentially increased. The need to manage and analyzethese data has driven to the emergence a new and promising field, namely bioinformatics.This dissertation deals with the bioinformatics problem of coding region predictionin biological sequences. This is an important task demanded for the annotation andmapping of organisms’ genomes. The first chapters present the fields of machinelearning, knowledge discovery, molecular biology and bioinformatics. The next chaptersdescribe the methodology that was developed for the prediction of coding regions inbiological sequences, as well as the experiments that were conducted for evaluating thismethodology.
Η ραγδαία ανάπτυξη της τεχνολογίας έχει οδηγήσει στην αύξηση του ρυθμού παραγω-γής δεδομένων. Τα δεδομένα αυτά συνήθως αποθηκεύονται σε διάφορα μέσα και μεδιάφορες μορφές (π.χ. αρχεία, βάσεις δεδομένων, κ.α.), ώστε αργότερα να είναι δυνατήη ανάλυσή τους. Ωστόσο, οι παραδοσιακές τεχνικές ανάλυσης δεδομένων πολλές φορέςαδυνατούν να διαχειριστούν τα δεδομένα αποδοτικά και αποτελεσματικά με κύριεςαιτίες το μεγάλο όγκο και τις ιδιαιτερότητες (π.χ. θόρυβος, μεγάλος αριθμός διαστάσεων) των δεδομένων. Για το λόγο αυτό κρίνεται επιτακτική η χρήση τεχνικών πουαντιμετωπίζουν τα παραπάνω προβλήματα. Τέτοιες τεχνικές προσφέρουν τα επιστημονικά πεδία της μηχανικής μάθησης και της ανακάλυψης γνώσης από βάσεις δεδομένων.Η βιολογία είναι μια από τις επιστήμες για τις οποίες κρίνεται απαραίτητη η εφαρμογή τεχνικών μηχανικής μάθησης και ανακάλυψης γνώσης. Από τη στιγμή πουέγινε εφικτή η διεξαγωγή πειραμάτων και ερευνητικών προγραμμάτων ευρείας κλίμακας, όπως για παράδειγμα το πρόγραμμα του ανθρώπινου γονιδιώματος (Human GenomeProject), ο ρυθμός με τον οποίο συλλέγονται τα βιολογικά δεδομένα έχει αυξηθείεκθετικά. Η ανάγκη διαχείρισης και ανάλυσης των βιολογικών δεδομένων έχει οδηγήσει στην εμφάνιση μιας νέας και υποσχόμενης επιστημονικής περιοχής, της βιοπληροφορικής.Η παρούσα διατριβή κινείται στα πλαίσια της βιοπληροφορικής και πραγματεύεται το πρόβλημα της πρόβλεψης της κωδικής περιοχής βιολογικών αλληλουχιών, μιασημαντική διαδικασία που απαιτείται για την επισημείωση και χαρτογράφηση τωνγονιδιωμάτων των οργανισμών. Στα πρώτα κεφάλαια παρουσιάζονται τα επιστημονικάπεδία της μηχανικής μάθησης, της ανακάλυψης γνώσης, της μοριακής βιολογίας και τηςβιοπληροφορικής. Στη συνέχεια παρουσιάζεται η μεθοδολογία που αναπτύχθηκε γιατην πρόβλεψη της κωδικής περιοχής βιολογικών αλληλουχιών και τα πειράματα πουεκτελέστηκαν για την αξιολόγησή της μεθοδολογίας.

info:eu-repo/semantics/masterThesis
Postgraduate Thesis / Μεταπτυχιακή Εργασία

Gene prediction
Μοριακή βιολογία
Ανακάλυψη γνώσης σε βάσεις δεδομένων
Μηχανική μάθηση
Machine learning
Βιοπληροφορική
Knowledge discovery in databases
MANTIS
Molecular biology
Πρόβλεψη γονιδίων
Bioinformatics

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

2008
2009-06-21T21:00:00Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)