Ανάπτυξη πληροφοριακού συστήματος για την επεξεργασία δεδομένων γενετικών τόπων που βρίσκονται σε ανισορροπία σύνδεσης

This item is provided by the institution :
National Documentation Centre (EKT)   

Repository :
National Archive of PhD Theses  | ΕΚΤ NA.Ph.D.   

see the original item page
in the repository's web site and access all digital files if the item*



Development of a management information system for the statistical analysis of genetic loci that show linkage disequilibrium
Ανάπτυξη πληροφοριακού συστήματος για την επεξεργασία δεδομένων γενετικών τόπων που βρίσκονται σε ανισορροπία σύνδεσης

Thriskos, Paschalis
Θρήσκος, Πασχάλης

PhD Thesis

2008


Σκοπός αυτής της διατριβής είναι η ανάπτυξη βιοπληροφορικών μεθόδων για την εξαγωγή συμπερασμάτων από πληθυσμιακές μελέτες με δεδομένα για το Μείζον Σύμπλεγμα Ιστοσυμβατότητας (ΜΣΙ). Ειδικότερα είναι η δημιουργία ενός πληροφοριακού συστήματος για τη διαχείριση δεδομένων από γενετικούς τόπους που βρίσκονται σε ανισορροπία σύνδεσης (linkage disequilibrium). Το σύστημα που έχει αναπτυχθεί ονομάζεται DHLAS (Database HLA Analysis System) και συνδυάζει την διαχείριση γενετικών δεδομένων - μέσω μιας Βάσης Δεδομένων (ΒΔ) - για το ΜΣΥ και την στατιστική τους επεξεργασία . Αν και υπάρχουν αρκετά στατιστικά προγράμματα που χρησιμοποιούν αλγορίθμους για την ανάλυση και επεξεργασία γενετικών δεδομένων, κανένα από αυτά δεν συνδυάζει μια (ΒΔ) και στατιστική επεξεργασία. Η διαδικασία που συνήθως ακολουθείται είναι η δημιουργία ενός ενδιάμεσου αρχείου με τα δεδομένα, το οποίο στη συνέχεια χρησιμοποιείται από το λογισμικό στατιστικής ανάλυσης. Παράλληλα βελτιώθηκε μια νέα μέθοδος για την ταξινόμηση αντικειμένων σε πληθυσμιακές ομάδες. Η μέθοδος αυτή βασίζεται στη μη παραμετρική δενδρική ταξινόμηση γνωστή ως CART (Classification and Regression Tree) και χρησιμοποιήθηκε για την κατάταξη ατόμων σε πληθυσμιακές ομάδες δοθέντος του HLA (Human Lycosyte Antigen) προφίλ του καθενός. Εξετάστηκε επίσης η χρήση νευρωνικών δικτύων (neural networks - NN) και μηχανών διανυσματικής υποστήριξης (support vector machines - SVM) για την κατηγοριοποίηση και ταξινόμηση υποκειμένων στις πληθυσμιακές ομάδες. Τα νευρωνικά δίκτυα (NN) και οι μηχανές διανυσματικής αναζήτησης (SVM) έχουν τύχει ιδιαίτερης προσοχής τα τελευταία χρόνια. Και αυτό γιατί έχει η χρήση τους σε προβλήματα κατηγοριοποίησης έχει δώσει σημαντικά αποτελέσματα και επιπλέον η υπολογιστική ισχύς και δύναμη που χρειάζεται είναι προσιτή και διαθέσιμη σε χαμηλό κόστος. Τέλος έγινε συγκριτική μελέτη για την αξιολόγηση των αποτελεσμάτων των τριών διαφορετικών ταξινομητών.
The aim of this dissertation is to develop bioinformatic methods to examine and analyze MHC population data. In particular, to design and develop an informatics system to manage genetic data in linkage disequilibrium. The system that has been developed is called DHLAS (Database HLA Analysis System) and combines data management facilities – which are supported by a Relational Database Management System (RDBMS) – as well as advanced statistical procedures. Although there are numerous statistical software packages that use diverse algorithms to analyze genetic, the researcher usually produces an intermediate data file which is supplied to a statistical application data. None of these tools integrates a RDBMS targeting genetic population studies together with the appropriate statistical methods to analyze these data. Furthermore, a methodology to classify subjects has been enhanced and applied to MHC population data. This methodology is based on a non-parametric decision tree approach known as CART (Classification and Regression Tree) and it has been used to categorize subjects into different population groups given their HLA profile. The application of artificial neural networks (ANN) and support vector machines (SVM) was also examined in the context of classifying individuals into different ethnic groups. This stems from the fact that ANN and SVM have been used in the past few years in different and diversified applications and have shown remarkable results. Besides the computational power need to solve these problems nowdays is easily accessible at a very low cost. Finally, a comparative study was carried out to evaluate the results of these three different classification methods.

Βασική Ιατρική
Ιατρική και Επιστήμες Υγείας

Πληροφοριακά συστήματα
Basic Medicine
Major histocompatibility complex (MHC)
Medical and Health Sciences
Ανισορροπία σύνδεσης
Μηχανές ταξινόμησης
Νόμος Hardy - Weinberg
Linkage equilibrium
Hardy - Weinberg equilibrium (HWE)
Classification engines
Μείζον σύμπλεγμα ιστοσυμβατότητας
Υπολογισμός απλότυπων
Human leucosyte antigens (HLA)
Ανθρώπινα λευκοκυτταρικά αντιγόνα
Management information systems
Βασική Ιατρική
Haplotype estimation
Ιατρική και Επιστήμες Υγείας

Greek

University of Thessaly (UTH)
Πανεπιστήμιο Θεσσαλίας

Πανεπιστήμιο Θεσσαλίας. Σχολή Επιστημών Υγείας. Τμήμα Ιατρικής. Τομέας Κλινικοεργαστηριακός. Εργαστήριο Βιομαθηματικών - Βιομετρίας




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)