Ανάλυση πολυκαναλικών εικόνων χρωμοσωμάτων

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Ολυμπιάς
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2012 (EL)

Ανάλυση πολυκαναλικών εικόνων χρωμοσωμάτων

Καρβέλης, Πέτρος Σ.

Λύκας, Αριστείδης (EL)
Καρβέλης, Πέτρος Σ.
Πανεπιστήμιο Ιωαννίνων Σχολή Θετικών Επιστημών Τμήμα Μηχανικών Η/Υ και Πληροφορικής
-

Η µελέτη των χρωµοσωµάτων αποτελεί έναν από τους σηµαντικότερους τοµείς µελέτης για τη σύγχρονη Γενετική διότι τα χρωµοσώµατα αποτελούν τους φορείς όλου του γενετικού υλικού (DNA) ενός οργανισµού που µεταβιβάζονται από γενιά σε γενιά µε την βοήθεια της αναπαραγωγής. Τα χρωµοσώµατα ανήκουν σε κατηγορίες και η ανάθεση κάθε χρωµοσώµατος στην κατηγορία του από µια εικόνα χρωµοσωµάτων απαιτεί χρόνο αλλά και µεγάλη εµπειρία για την αποφυγή λαθών που µπορούν να οδηγήσουν σε εσφαλµένη διάγνωση. Για το λόγο αυτό αναπτύχθηκαν τεχνικές για την επεξεργασία και ανάλυση εικόνων χρωµοσωµάτων και τον αυτόµατο χαρακτηρισµό τους. Υπάρχουν αρκετοί τρόποι και τεχνικές για την καλλιέργεια των χρωµοσωµάτων η κάθε µια από τις οποίες οδηγεί και σε διαφορετικό τύπο εικόνας. Για παράδειγµα αν τα χρωµοσώµατα καλλιεργηθούν σύµφωνα µε το πρωτόκολλο G-Banding η εικόνα που προκύπτει είναι µια γκρι (grey-scale) εικόνα. Στην παρούσα διατριβή ασχολούµαστε µε το πρωτόκολλο M-FISH το οποίο οδηγεί σε µια πολυκαναλική εικόνα (6 καναλιών). Στην τεχνική αυτή το βιολογικό πείραµα έχει κατασκευαστεί έτσι ώστε η κάθε µια από τις 24 κατηγορίες χρωµοσωµάτων (1-22,Χ,Υ) να αποτυπώνεται µε διαφορετικό χρώµα. Αντικείµενο της παρούσας διατριβής είναι η αναγνώριση και κατηγοριοποίηση των ανθρωπίνων χρωµοσωµάτων από πολυκαναλικές εικόνες M-FISH. Αρχικά αναπτύξαµε µια µέθοδο βασισµένη στον µετασχηµατισµό Watershed για την κατάτµηση (οµαδοποίηση εικονοστοιχείων µε παρόµοια χαρακτηριστικά) των χρωµοσωµάτων σε περιοχές. Ο µετασχηµατισµός Watershed απαιτεί ένα µέτρο διαχωρισηµότητας µεταξύ όµοιων περιοχών και γι’ αυτό το λόγο επιλέξαµε τον υπολογισµό της πολυκαναλικής παραγώγου. Με αυτό τον τρόπο εξασφαλίζεται ο σαφής διαχωρισµός µεταξύ περιοχών µε διαφορετικό χρώµα και επιπλέον αφαιρούµε το υπόβαθρο (background). Τα αποτελέσµατα της κατάτµησης είναι αρκετά ικανοποιητικά συγκρινόµενα µε αυτά της βιβλιογραφίας για την ίδια βάση εικόνων M-FISH. Για την ταξινόµηση κάθε περιοχής χρησιµοποιήσαµε έναν στατιστικό ταξινοµητή βασισµένο στον κανόνα του Bayes. Ο ταξινοµητής αυτός είναι απλός στην υλοποίηση του και έχει χρησιµοποιηθεί και σε άλλες µελέτες. Σε σύγκριση µε ήδη υπάρχουσες µεθοδολογίες οι οποίες χρησιµοποιούν Pixel by Pixel κατηγοριοποίηση η µέθοδος µας (που βασίζεται σε ταξινόµηση περιοχών) εµφάνισε καλύτερα αποτελέσµατα. Τέλος, µελετούµε την αποτελεσµατικότητα των φίλτρων διανυσµατικού διαµέσου (Vector Median Filtering) και παραλλαγών του εάν εφαρµοστούν στην εικόνα πριν την ταξινόµηση. Η αποτελεσµατικότητα των φίλτρων ∆ιαµέσου εξετάζεται συγκρίνοντας το ποσοστό σωστής ταξινόµησης πριν και µετά την χρήση των φίλτρων αυτών. Ένα από τα προβλήµατα που εµφανίζουν όλες οι µεθοδολογίες κατηγοριοποίησης χρωµοσωµάτων από πολυκαναλικές εικόνες M-FISH είναι η προϋπόθεση ύπαρξης ενός συνόλου εκπαίδευσης για την εκπαίδευση του ταξινοµητή. Στην περίπτωση για παράδειγµα ενός ταξινοµητή Bayes απαιτείται η εκτίµηση των παραµέτρων όπως της µέσης τιµής και του πίνακα συµµεταβλητότητας για κάθε µια από τις 24 κατηγορίες χρωµοσωµάτων. Η ύπαρξη µιας µεθοδολογίας που θα είναι ανεξάρτητη από το σύνολο εκπαίδευσης που επιλέγουµε έχει σηµαντική αξία. Μια τέτοια µεθοδολογία παρουσιάζεται στην διατριβή αυτή. Αρχικά λαµβάνουµε µια κατάτµηση της εικόνας M-FISH µε την χρήση της µεθοδολογίας Watershed (αποµακρύνοντας το υπόβαθρο) και κατόπιν εκτιµούµε ποια από τα εικονοστοιχεία έχουν υβριδοποιηθεί ή όχι µε την χρήση του αλγορίθµου EM σε κάθε ένα από τα 5 κανάλια της εικόνας µας. Στην συνέχεια χρησιµοποιούµε ένα πολυκαναλικό Gaussian Mixture Model για την κατηγοριοποίηση κάθε εικονοστοιχείου σε µια από τις 24 κατηγορίες χρωµοσωµάτων. Στο µοντέλο αυτό χρησιµοποιείται για πρώτη φορά εκ των προτέρων πληροφορία σχετικά µε το σε ποιο κανάλι εκπέµπει κάθε κατηγορία χρωµοσώµατος. Η περαιτέρω εκπαίδευση των παραµέτρων του Gaussian Mixture Model από τον αλγόριθµο Maximum A Posterior Expectation Maximization (MAP EM) επιτρέπει την αύξηση του ποσοστού σωστής κατηγοριοποίησης. Η µεθοδολογία αυτή επιτυγχάνει ακόµη καλύτερα ποσοστά συγκρινόµενη ακόµη µε µεθοδολογίες ταξινόµησης µε επίβλεψη. ∆ύο σηµαντικοί παράγοντες επηρεάζουν την κατάτµηση των εικόνων χρωµοσωµάτων και είναι οι εξής : Χρωµοσώµατα που επικαλύπτουν το ένα το άλλο, Χρωµοσώµατα που εφάπτονται το ένα στο άλλο. Προτείνουµε µια µέθοδο που αντιµετωπίζει και τα δύο αυτά προβλήµατα µε επιτυχία. Αρχικά εφαρµόζουµε έναν επαναληπτικό µετασχηµατισµό Watershed ώστε να πάρουµε µια αρχική εκτίµηση των περιοχών των χρωµοσωµάτων. Στην συνέχεια εντοπίζουµε σηµεία υψηλής κύρτωσης πάνω στην περίµετρο της χρωµοσωµατικής περιοχής. Ξεκινώντας από τα σηµεία αυτά, θα δηµιουργούµε ένα µονοπάτι παραγώγου (Gradient Path) το οποίο διασχίζει την περιοχή χρωµοσώµατος και διαχωρίζει την περιοχή όταν δύο χρωµοσώµατα εφάπτονται το ένα στο άλλο. Αν δυο ή και περισσότερα χρωµοσώµατα επικαλύπτονται τότε το µονοπάτι διαχωρίζει σε δύο τµήµατα την περιοχή των χρωµοσωµάτων. Στην συνέχεια σχηµατίζουµε τον γράφο γειτνίασης περιοχών (Region Adjacency Graph) και κατηγοριοποιούµε κάθε περιοχή κάνοντας χρήση ενός ταξινοµητή περιοχών Bayes. Για κάθε ζεύγος γειτονικών περιοχών που έχουν την ίδια κατηγορία ενώνουµε τις δύο αυτές περιοχές. Συγκριτικά αποτελέσµατα µε άλλες µεθόδους δείχνουν την ανωτερότητα της µεθόδου ιδιαίτερα στην περίπτωση των επικαλυπτόµενων χρωµοσωµάτων.

doctoralThesis

Επεξεργασία εικόνας (EL)


Αγγλική γλώσσα

2012


Πανεπιστήμιο Ιωαννίνων Σχολή Θετικών Επιστημών Τμήμα Μηχανικών Η/Υ και Πληροφορικής (EL)




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.