Ανάλυση πολυκαναλικών εικόνων χρωμοσωμάτων

This item is provided by the institution :
National Documentation Centre (EKT)   

Repository :
National Archive of PhD Theses  | ΕΚΤ NA.Ph.D.   

see the original item page
in the repository's web site and access all digital files if the item*



Ανάλυση πολυκαναλικών εικόνων χρωμοσωμάτων

Karvelis, Petros
Καρβέλης, Πέτρος

PhD Thesis

2012


The study of chromosomes is one of the major areas of study for modern genetics because the chromosomes are the carriers of all the genetic material (DNA) of an organism that are transferred from generation to generation by means of reproduction. The assignment of each chromosome to each class from a chromosome image takes time and demands great experience to avoid mistakes that can lead to misdiagnosis. For this reason there have been developed algorithms for image processing and automated analysis of chromosomes. There are several methods and techniques for the cultivation of chromosomes each of which leads to a different type of image. For example, if the chromosomes are cultured according to the protocol G-Banding the resulting image is a gray level image. In this thesis we deal with M-FISH protocol which leads to a multichannel image (6 channels). In this technique the biological experiment has been constructed so that each of the 24 chromosome types (1-22, X, Y) would be reflected in a different color. The purpose of this thesis is the identification and classification of human chromosomes from multichannel M-FISH images. Initially, we developed a method based on the Watershed transform for the region segmentation (grouping pixels with similar characteristics) of chromosomes. The Watershed transform requires a measure of separability between similar areas and for this reason we chose to calculate the multichannel gradient. In this way we achieve a clear separation between areas with different color corresponding to a different chromosome class. The segmentation results are quite satisfactory compared to other methods reported in the literature on the same M-FISH basis images. After segmentation we perform region classification using a statistical classifier that employs the Bayes rule. This classifier is simple to develop and implement and provides satisfactory classification performance. Compared with existing approaches that use Pixel by Pixel classification the proposed region-based method showed better results. We also study the effectiveness image smoothing using Vector Median Filtering and its variants and provide comparative experimental results. One of the problems in the chromosome classification methodologies using multichannel M-FISH images is the fact that they demand a labeled training set to build the classifier. For example a Bayes classifier requires estimating the parameters such as mean and covariance for each of the 24 chromosomes classes. The existence of a methodology that does not require a labeled training set is therefore essential. Such an unsupervised methodology is presented in this thesis. First, we segment the M-FISH image using the Watershed transform to remove the background. Then we estimate which of the remaining pixels have been hybridized or not using the EM algorithm in each of the 5 channels of the image. Then we use a Gaussian Mixture Model to classify each pixel into one of the 24 classes of chromosomes. To build this model for the first time we exploit prior information about which chromosome class emits to each of the five channels. The adaptation of the parameters of Gaussian Mixture Model by using the Maximum a Posterior Expectation Maximization method (MAP EM) results in an increase in the rate of correct classification. It is noteworthy that the proposed unsupervised methodology achieves higher classification rates when compared to supervised classification methodologies. One of the problems for automatic chromosome segmentation methods is the problem of the occlusion of chromosomes. In particular, two important factors influencing the segmentation are the following Chromosomes that overlap with one another, Chromosomes which adjoin one another. We have developed a method that addresses both these problems successfully. Initially we apply a recursive Watershed transform to get an initial assessment of areas of chromosomes. Then for each area of the Watershed transform we determine high curvature points around the perimeter of the chromosomal region. From these points will begin a gradient path which crosses the region and separates the chromosome region where two chromosomes are tangent to each other. If two or more chromosomes overlap each other, then the path splits the chromosomes into pieces. Then we form the Region Adjacency Graph and categorize each area using a region Bayes classifier. If a pair of neighboring regions shares the same class then they are joined together. The method was tested on chromosome images and the success rate of the method was satisfactory. In addition we compared the method with other segmentation methodologies such as the pale paths and the results were much better, especially for the case of overlapping chromosomes.
Η µελέτη των χρωµοσωµάτων αποτελεί έναν από τους σηµαντικότερους τοµείς µελέτης για τη σύγχρονη Γενετική διότι τα χρωµοσώµατα αποτελούν τους φορείς όλου του γενετικού υλικού (DNA) ενός οργανισµού που µεταβιβάζονται από γενιά σε γενιά µε την βοήθεια της αναπαραγωγής. Τα χρωµοσώµατα ανήκουν σε κατηγορίες και η ανάθεση κάθε χρωµοσώµατος στην κατηγορία του από µια εικόνα χρωµοσωµάτων απαιτεί χρόνο αλλά και µεγάλη εµπειρία για την αποφυγή λαθών που µπορούν να οδηγήσουν σε εσφαλµένη διάγνωση. Για το λόγο αυτό αναπτύχθηκαν τεχνικές για την επεξεργασία και ανάλυση εικόνων χρωµοσωµάτων και τον αυτόµατο χαρακτηρισµό τους. Υπάρχουν αρκετοί τρόποι και τεχνικές για την καλλιέργεια των χρωµοσωµάτων η κάθε µια από τις οποίες οδηγεί και σε διαφορετικό τύπο εικόνας. Για παράδειγµα αν τα χρωµοσώµατα καλλιεργηθούν σύµφωνα µε το πρωτόκολλο G-Banding η εικόνα που προκύπτει είναι µια γκρι (grey-scale) εικόνα. Στην παρούσα διατριβή ασχολούµαστε µε το πρωτόκολλο M-FISH το οποίο οδηγεί σε µια πολυκαναλική εικόνα (6 καναλιών). Στην τεχνική αυτή το βιολογικό πείραµα έχει κατασκευαστεί έτσι ώστε η κάθε µια από τις 24 κατηγορίες χρωµοσωµάτων (1-22,Χ,Υ) να αποτυπώνεται µε διαφορετικό χρώµα. Αντικείµενο της παρούσας διατριβής είναι η αναγνώριση και κατηγοριοποίηση των ανθρωπίνων χρωµοσωµάτων από πολυκαναλικές εικόνες M-FISH. Αρχικά αναπτύξαµε µια µέθοδο βασισµένη στον µετασχηµατισµό Watershed για την κατάτµηση (οµαδοποίηση εικονοστοιχείων µε παρόµοια χαρακτηριστικά) των χρωµοσωµάτων σε περιοχές. Ο µετασχηµατισµός Watershed απαιτεί ένα µέτρο διαχωρισηµότητας µεταξύ όµοιων περιοχών και γι’ αυτό το λόγο επιλέξαµε τον υπολογισµό της πολυκαναλικής παραγώγου. Με αυτό τον τρόπο εξασφαλίζεται ο σαφής διαχωρισµός µεταξύ περιοχών µε διαφορετικό χρώµα και επιπλέον αφαιρούµε το υπόβαθρο (background). Τα αποτελέσµατα της κατάτµησης είναι αρκετά ικανοποιητικά συγκρινόµενα µε αυτά της βιβλιογραφίας για την ίδια βάση εικόνων M-FISH. Για την ταξινόµηση κάθε περιοχής χρησιµοποιήσαµε έναν στατιστικό ταξινοµητή βασισµένο στον κανόνα του Bayes. Ο ταξινοµητής αυτός είναι απλός στην υλοποίηση του και έχει χρησιµοποιηθεί και σε άλλες µελέτες. Σε σύγκριση µε ήδη υπάρχουσες µεθοδολογίες οι οποίες χρησιµοποιούν Pixel by Pixel κατηγοριοποίηση η µέθοδος µας (που βασίζεται σε ταξινόµηση περιοχών) εµφάνισε καλύτερα αποτελέσµατα. Τέλος, µελετούµε την αποτελεσµατικότητα των φίλτρων διανυσµατικού διαµέσου (Vector Median Filtering) και παραλλαγών του εάν εφαρµοστούν στην εικόνα πριν την ταξινόµηση. Η αποτελεσµατικότητα των φίλτρων ∆ιαµέσου εξετάζεται συγκρίνοντας το ποσοστό σωστής ταξινόµησης πριν και µετά την χρήση των φίλτρων αυτών. Ένα από τα προβλήµατα που εµφανίζουν όλες οι µεθοδολογίες κατηγοριοποίησης χρωµοσωµάτων από πολυκαναλικές εικόνες M-FISH είναι η προϋπόθεση ύπαρξης ενός συνόλου εκπαίδευσης για την εκπαίδευση του ταξινοµητή. Στην περίπτωση για παράδειγµα ενός ταξινοµητή Bayes απαιτείται η εκτίµηση των παραµέτρων όπως της µέσης τιµής και του πίνακα συµµεταβλητότητας για κάθε µια από τις 24 κατηγορίες χρωµοσωµάτων. Η ύπαρξη µιας µεθοδολογίας που θα είναι ανεξάρτητη από το σύνολο εκπαίδευσης που επιλέγουµε έχει σηµαντική αξία. Μια τέτοια µεθοδολογία παρουσιάζεται στην διατριβή αυτή. Αρχικά λαµβάνουµε µια κατάτµηση της εικόνας M-FISH µε την χρήση της µεθοδολογίας Watershed (αποµακρύνοντας το υπόβαθρο) και κατόπιν εκτιµούµε ποια από τα εικονοστοιχεία έχουν υβριδοποιηθεί ή όχι µε την χρήση του αλγορίθµου EM σε κάθε ένα από τα 5 κανάλια της εικόνας µας. Στην συνέχεια χρησιµοποιούµε ένα πολυκαναλικό Gaussian Mixture Model για την κατηγοριοποίηση κάθε εικονοστοιχείου σε µια από τις 24 κατηγορίες χρωµοσωµάτων. Στο µοντέλο αυτό χρησιµοποιείται για πρώτη φορά εκ των προτέρων πληροφορία σχετικά µε το σε ποιο κανάλι εκπέµπει κάθε κατηγορία χρωµοσώµατος. Η περαιτέρω εκπαίδευση των παραµέτρων του Gaussian Mixture Model από τον αλγόριθµο Maximum A Posterior Expectation Maximization (MAP EM) επιτρέπει την αύξηση του ποσοστού σωστής κατηγοριοποίησης. Η µεθοδολογία αυτή επιτυγχάνει ακόµη καλύτερα ποσοστά συγκρινόµενη ακόµη µε µεθοδολογίες ταξινόµησης µε επίβλεψη. ∆ύο σηµαντικοί παράγοντες επηρεάζουν την κατάτµηση των εικόνων χρωµοσωµάτων και είναι οι εξής : Χρωµοσώµατα που επικαλύπτουν το ένα το άλλο, Χρωµοσώµατα που εφάπτονται το ένα στο άλλο. Προτείνουµε µια µέθοδο που αντιµετωπίζει και τα δύο αυτά προβλήµατα µε επιτυχία. Αρχικά εφαρµόζουµε έναν επαναληπτικό µετασχηµατισµό Watershed ώστε να πάρουµε µια αρχική εκτίµηση των περιοχών των χρωµοσωµάτων. Στην συνέχεια εντοπίζουµε σηµεία υψηλής κύρτωσης πάνω στην περίµετρο της χρωµοσωµατικής περιοχής. Ξεκινώντας από τα σηµεία αυτά, θα δηµιουργούµε ένα µονοπάτι παραγώγου (Gradient Path) το οποίο διασχίζει την περιοχή χρωµοσώµατος και διαχωρίζει την περιοχή όταν δύο χρωµοσώµατα εφάπτονται το ένα στο άλλο. Αν δυο ή και περισσότερα χρωµοσώµατα επικαλύπτονται τότε το µονοπάτι διαχωρίζει σε δύο τµήµατα την περιοχή των χρωµοσωµάτων. Στην συνέχεια σχηµατίζουµε τον γράφο γειτνίασης περιοχών (Region Adjacency Graph) και κατηγοριοποιούµε κάθε περιοχή κάνοντας χρήση ενός ταξινοµητή περιοχών Bayes. Για κάθε ζεύγος γειτονικών περιοχών που έχουν την ίδια κατηγορία ενώνουµε τις δύο αυτές περιοχές. Συγκριτικά αποτελέσµατα µε άλλες µεθόδους δείχνουν την ανωτερότητα της µεθόδου ιδιαίτερα στην περίπτωση των επικαλυπτόµενων χρωµοσωµάτων.

Φυσικές Επιστήμες ➨ Επιστήμες Ηλεκτρονικών Υπολογιστών & Πληροφορικής

Επεξεργασία εικόνας
Image processing
Χρωμοσώματα
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Natural Sciences
Computer and Information Sciences
Chromosomes
Φυσικές Επιστήμες

Greek

Πανεπιστήμιο Ιωαννίνων
University of Ioannina

Πανεπιστήμιο Ιωαννίνων. Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)