Επεξεργασία εικόνων μικροσυστοιχιών με χρήση ευφυών μεθόδων πληροφοριακών συστημάτων

 
This item is provided by the institution :

Repository :
National Archive of PhD Theses
see the original item page
in the repository's web site and access all digital files if the item*
share



PhD thesis (EN)

2011 (EN)
Microarray image processing using intelligent information systems
Επεξεργασία εικόνων μικροσυστοιχιών με χρήση ευφυών μεθόδων πληροφοριακών συστημάτων

Γιαννακέας, Νικόλαος

Microarrays provide a simple way to measure the level of hybridization of known probes of interest with one or more samples under different conditions. Microarray image processing consists of three main stages. The first stage, called spot addressing and gridding, is the procedure for the detection of each spot in the image and the isolation of each spot into a cell. In the second stage, which is known as segmentation stage, each spot of the image is segmented, to separate the signal from the background pixels. Finally, in the third stage the intensity of each spot is extracted and several quantities can be calculated.For the first stage a generalized method for the spot addressing and the gridding of microarray images is introduced, where the spots are structured either in hexagonal or in rectangular grid. Initially the method indentifies the grid of the image. Next, the method utilizes the properties of both the rectangular and the hexagonal grid, to estimate the locations of the non-hybridized spots. This step detects a number of empty spots in each iteration of the proposed Growing Concentric Polygon (GCP) algorithm. The GCP algorithm grows a rectangular or a hexagonal form, for the rectangular structured images or the hexagonal structured images, respectively, detecting a number of spots on the polygon’s contour. For the segmentation stage a novel pixel-by-pixel supervised segmentation method, which is based on classification techniques, is proposed. The method classifies the pixels of the image into three categories using Bayes classifier or Support Vector Machines (SVM). Apart from the signal and the background pixels, the third class includes pixels of artefacts, pixels of the contour of the spot, and pixels of inner holes which exist in donut spots. A set of features from each pixel is used as input for the classification. The proposed method, is advantageous compared to the clustering-based methods, due to the direct characterization of each pixel to the designated category. Otherwise, using clustering techniques different clusters are generated but no distinction exists between them unless a set of rules is applied to separate them. For the evaluation of the method, both rectangular and hexagonal structured images are employed from the Standard Microarray Database, CNV370 beadchip of Illumina, as well as, simulated images generated by the Nykters simulator. The method results in high accuracy in the detection of the spots ranging from 92 – 99% depending on the dataset used. Additionally, high accuracy results are performed in the segmentation stage, where the signal and background pixels are extracted. Pixels from artefacts are excluded from the intensity extraction stage, to provide more reliable values for the levels of hybridization.
Η παρούσα διδακτορική διατριβή στοχεύει στην εξαγωγή βιολογικών δεδομένων από εικόνες που παράγονται από το πείραμα των μικροσυστοιχιών. Σύμφωνα με την υπάρχουσα βιβλιογραφία διάφορες μέθοδοι έχουν προταθεί την επεξεργασία των εικόνων των μικροσυστοιχιών, οι οποίες συνήθως ακολουθούν τα τρία ακόλουθα στάδια:1. Εντοπισμός των κηλίδων και τοποθέτηση πλέγματος: στοχεύει στον ακριβή εντοπισμό της θέσης κάθε κηλίδας. Η αυτοματοποίηση αυτού του βήματος είναι κρίσιμη για τη διευκόλυνση της ανάλυσης του μεγάλου αριθμού πειραμάτων.2. Κατάτμηση: διαχωρίζει τα εικονοστοιχεία σήματος από τα εικονοστοιχεία υποβάθρου. 3. Εξαγωγή έντασης: αποτελείται από τον υπολογισμό της μέσης έντασης των κηλίδων σε σχέση με την ένταση του υποβάθρου. Κατά την διάρκεια της διατριβής υλοποιήθηκε μια αυτόματη μέθοδος για το πρώτο στάδιο της επεξεργασίας, τον εντοπισμό των κηλίδων. Για πρώτη φορά παρουσιάστηκε στην βιβλιογραφία μια μέθοδος, η οποία μπορεί να επεξεργαστεί εικόνες μικροσυστοιχιών με διαφορετική προσέγγιση εκτύπωσης των μικροσυστοιχιών. Δύο είναι οι προσεγγίσεις για την εκτύπωση της μικροσυστοιχίας: (α) ανιχνευτές τοποθετημένοι στις κορυφές τετραγωνικού πλέγματος και (β) ανιχνευτές τοποθετημένοι στις κορυφές εξαγωνικού πλέγματος. Η γενικευμένη μέθοδος η οποία υλοποιήθηκε αρχικά αναγνωρίζει το πλέγμα της εικόνας, και στην συνέχεια υλοποιεί έναν καινοτόμο αλγόριθμο για να εντοπίσει τα κέντρα όλων των ανιχνευτών στην εικόνα. Ο αλγόριθμος αυτός, οποίος ονομάστηκε Αλγόριθμος Ομόκεντρων Αναπτυσσόμενων Πολυγώνων, εκμεταλλεύεται τις κοινές ιδιότητες των δύο πλεγμάτων εντοπίζοντας τα κέντρα επάνω στο περίγραμμα ομόκεντρων τετραγώνων ή εξαγώνων. Επίσης βελτιστοποιεί τις θέσεις των κέντρων που παράγονται. Τέλος η μέθοδος κάνει χρήση του διαγράμματος Βορονόι για να απομονώσει τον κάθε ανιχνευτή.Στην συνέχεια της διατριβής προχωρήσαμε στην υλοποίηση μιας καινοτόμου μεθόδου για την κατάτμηση (δεύτερο στάδιο επεξεργασίας) των εικόνων με χρήση τεχνικών ταξινόμησης. Η μέθοδος αυτή καινοτομεί σε τρία σημεία, με σκοπό να αποκλείσει από την ποσοτικοποίηση της υβριδοποίησης τα εικονοστοιχεία που προέρχονται από διάφορα τεχνουργήματα της εικόνας. Για τον σκοπό αυτό (α) επεκτάθηκε το διάνυσμα των χαρακτηριστικών των εικονοστοιχείων, (β) εισήχθη τρίτη κλάση εικονοστοιχείων με σκοπό να λειτουργήσει ως δεξαμενή των εικονοστοιχείων που δεν θέλουμε να συμπεριλάβουμε στις ποσοτικοποιημένες τιμές και τέλος (γ) για πρώτη φορά έγινε τεχνικών ταξινόμησης για τον χαρακτηρισμό των εικονοστοιχείων στις τρεις κλάσεις.Για την αξιολόγηση των μεθόδων χρησιμοποιήθηκαν εικόνες μικροσυστοιχιών από την βάση δεδομένων μικροσυστοιχιών του Στάνφορντ, εικόνες μικροσυστοιχιών από σταθμό της Illumina, αλλά και προσομοιωμένες εικόνες από των προσομοιωτή του Nykter και των συνεργατών του, ο οποίος χρησιμοποιείται ευρέως στην βιβλιογραφία. Τα αποτελέσματα της διατριβή για τον εντοπισμό των ανιχνευτών παρουσίασαν υψηλά ποσοστά ακρίβεια, τα οποία κυμαίνονται από 92-99%, ενώ η γενικευμένη μέθοδος που υλοποιήθηκε παρουσίασε εξίσου υψηλά ποσοστά με εξειδικευμένες μεθόδους για τις δύο προσεγγίσεις εκτύπωσης. Όσον αφορά στην κατάτμηση επιλέχθηκαν με ακρίβεια τα εικονοστοιχεία σήματος και τα εικονοστοιχεία υποβάθρου, από τα οποία εξήχθησαν οι ποσοτικοποιημένες τιμές. Από την ποσοτικοποίηση εξαιρέθηκαν με επιτυχία εικονοστοιχεία από τεχνουργήματα που εμφανίστηκαν στις εικόνες

Image processing
Segmentation
Microarrays
Τοποθέτηση πλέγματος
Ευφυή συστήματα
Μικροσυστοιχίες
Microarray gridding
Εντοπισμός κηλίδων
Επεξεργασία εικόνας
Spot addressing
Κατάτμηση
Μηχανική μάθηση
Machine learning
Intelligent systems
Spot detection

Εθνικό Κέντρο Τεκμηρίωσης (ΕΚΤ) (EL)
National Documentation Centre (EKT) (EN)

Greek

2011


Πανεπιστήμιο Ιωαννίνων
University of Ioannina



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)