This item is provided by the institution :

Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*

2005 (EN)
Επιλογή Γονιδίων και Κατάτμηση Δεδομένων Πειραμάτων με Μικροσυστοιχίες: Το σύστημα MineGene με Μικροσυστοιχίες: Το σύστημα MineGene
Gene Selection & Clustering Microarray Data: The MineGene System

Καντεράκης, Αλέξανδρος (EL)
Kanterakis, Alexandros (EN)

Τα τελευταία χρόνια είμαστε μάρτυρες μίας επανάστασης η οποία ξεκίνησε με την ολοκλήρωση της αποκωδικοποίησης του ανθρώπινου γονιδιώματος. Το DNA, το μόριο που περιέχει τις γενετικές μας πληροφορίες έχει αναλυθεί θέτοντας νέες υποσχέσεις και προκλήσεις για την κατανόηση του ρόλου των γενετικών παραγόντων στην υγεία και ασθένεια των ανθρώπων. Επιπλέον, οι μικροσυστοιχίες DNA είναι συσκευές που μετράνε τη ταυτόχρονη έκφραση πολλών χιλιάδων γονιδίων, επιτρέποντας την ταχύτατη καταγραφή της έκφρασης των γονιδίων. Παρόλο που αυτές οι τεχνολογικές εξελίξεις μας οδηγούν στην κατανόηση της γενετικής βάσης διάφορων ασθενειών είναι προφανές ότι πρέπει να συμπεριλάβουμε και την γνώση που έχει αποκτηθεί από την κλινική εμπειρία. Στην παρούσα εργασία παρουσιάζουμε αρχικά τις ιδιότητες και τα κύρια στοιχεία ενός αποκεντρωμένου σύγχρονου πληροφοριακού συστήματος το οποίο χρησιμοποιεί συγκεκριμένες γνωστές οντολογίες και επισημειώσεις για διαχείριση δεδομένων που έχουν παραχθεί από πειράματα με μικροσυστοιχίες και αναλύουμε διάφορες υπάρχουσες υλοποιήσεις. Στη συνέχεια οραματιζόμαστε ένα συνεργικό κλινικό-γενομικό σενάριο λήψης αποφάσεων όπου ο γονότυπος και ο φαινότυπος των ασθενών θα αξιοποιείται για διάγνωση και θεραπεία. Επιπροσθέτως παρουσιάζουμε δύο πρωτότυπους αλγόριθμους μηχανικής μάθησης που υλοποιούν την ολοκλήρωση αυτών των δεδομένων κατά τη διαδικασία λήψης ιατρικών αποφάσεων. Ο πρώτος είναι ένας επιβλεπόμενος αλγόριθμος για επιλογή γονιδίων ο οποίος βασίζεται στη βαθμολόγηση γονιδίων μέσω μίας εντροπικής μετρικής. Ο δεύτερος είναι ένας μη επιβλεπόμενος γραφο-θεωρητικός αλγόριθμος για ιεραρχική κατάτμηση. Τέλος παρουσιάζουμε την υλοποίηση των παραπάνω μεθόδων, την εφαρμογή τους σε πραγματικά δεδομένα καθώς επίσης και την σύγκρισή τους με άλλες δημοσιευμένες προσεγγίσεις. (EL)
Over the last years we witness a revolution initiated by the completion of the Human Genome Project. DNA, the molecule that encodes our genetic information, has been fully sequenced setting new promises and challenges for understanding the role of genetic factors in human health and diseases. Moreover, DNA Microarrays are devices that measure the expression of many thousands of genes in parallel permitting the rapid profiling of gene expressions. Although these technological advances lead us to the understanding of the genetic base of various diseases it is evident that we need to integrate the knowledge normally processed in the clinical setting. In this Thesis we present firstly the features and components of a seamless modern information system for microarray data management that follows specific well-known ontologies and annotations alongside with some existing implementations. Furthermore we envisage a synergic clinico-genomic decision making scenario, where patient’s genotypic and phenotypic profile will be utilized for disease diagnose and treatment. Consequently we present two novel machine learning algorithms that facilitate the integration of such data in the medical decision process. The first is a supervised gene selection algorithm based on gene ranking through an entropic metric. The second is an unsupervised graph theoretical hierarchical clustering approach. These methods have been implemented and applied to real-world datasets and compared to other publishes approaches. (EN)

Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης


Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης

*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)