Developing an integrated interoperable framework for the unified access to heterogeneous multimedia medical data

 
This item is provided by the institution :

Repository :
National Archive of PhD Theses
see the original item page
in the repository's web site and access all digital files if the item*
share



PhD thesis (EN)

2011 (EN)

Δημιουργία διαλειτουργικού πλαισίου για την ενοποιημένη πρόσβαση σε ετερογενή πολυμεσικά ιατρικά δεδομένα
Developing an integrated interoperable framework for the unified access to heterogeneous multimedia medical data

Κοκκινάκη, Αλεξάνδρα
Kokkinaki, Alexandra

The research scope of this particular thesis, focused in the study, representation, management and integration of biosignals, in the cardiology domain. ECGs constitute cardiology domain biosignals, which are traditionally store, either in electronic data formats, which are mainly proprietary, or converted to widely accepted ECG coding standards like EDF (European Data Format), SCP-ECG (Standard communications protocol for computer assisted electrocardiography) etc. Apart from the signal itself, most of these standards encompass the equally important context and content meta-data of the signal. Biosignal context refers to information about patient demographics, diagnosis, recording equipment, researcher/investigator, etc while annotation and interpretation information constitute part of the bio-signal content. This thesis was motivated by the requirement of an integrated and interoperable environment, for the unified study of mainly heterogeneous biosignals, originating from different population groups and recorded under diverse conditions. Interoperability, defined as a prerequisite in this work, introduced the notion of standards, which are numerous in the healthcare domain. Most of the standards encode ECGs in flat file formats, which lack the information necessary to support meaningful analysis, interoperability and integration of multiple resources. To address the above mentioned issues, knowledge representation technologies were studied, the selection of which typically constitutes a critical decision step during data integration process. Ontologies were chosen as the representation structure, since they enable the reuse of domain knowledge without reinventing the wheel. Furthermore, ontologies constitute the backbone of the semantic web and can be easily comprehensible by humans and machines. Next, data integration approaches were studied resulting in the definition of a biosignal integration methodology, which employed the conceptual data integration model and the Local As View approach. In the scope of the proposed data integration methodology, the global ontology was modeled according to ecgML mark up language hierarchy, which encompasses the structure and content of the most widely accepted standards in the cardiology domain. Additionally ontologies were introduced, not only as structures for the virtual unification of the underlying sources but also as platforms for the transparent content and context based searching from multiple data sources. The decoupling of the content and context of the signal was also proposed, in order to achieve its semantic enrichment and enable structured and comprehensible searching. Applying the above mentioned methodology to heterogeneous sources of ECG signals, induced the development of ROISES (Research Oriented Integration System of ECG Sources), which aimed at the semantic integration of the sources and enabled unified content and context base searching. The global ontology, which constituted the system’s search structure, enabled the clinician to follow alternative diagnostic and therapeutic pathways that could possible lead to hidden knowledge and unexpected results. The clinician could easily express queries constructed upon a structured terminology and redefine the relations among concepts. Such concepts could emerge after the meta analysis of the therapeutic procedure, based on diagnosis and the possibility of reevaluation of diagnosis and finally its mapping to standardized clinical guidelines. The next step included studying of ontology learning approaches, in order to develop a new ontology enrichment method, designed specifically for ROISES. The resources that were encapsulated to the system consisted of ECG collections encoded in EDF and SCP-ECG standards and a relational database for the management of patients with chronic diseases. Leveraging ROISES with new resources and resources with more data, induced the need for the semantic enrichment of the global ontology. Dynamic Terminology Enhancement Method (DTEM) was developed to address this issue, based on UMLS Metathesaurus services and machine learning techniques. Research and application of different machine learning techniques like Support Vector Machines and decision tree learning algorithms lead to the selection of the ones that rendered the most efficient results pertaining accuracy, specificity and sensitivity. DTEM manipulated the medical terms that were not mapped to any concepts in the global ontology, to primarily determine their suitability as potential classes in the global ontology hierarchy and secondarily, given the suitability of a medical term, elucidate its location in the hierarchy. The innovation of this study was related to both the approaches proposed and their application domain. More specifically, the proposed methodology lead to the implementation of a unified interoperable framework for studying and managing biosignals, by employing medical technology and medical terminology standards, both defined as ontologies. The global ontology, designed in a prototype hierarchical structure, provides alternative diagnostic and therapeutic pathways to the medical researcher that may lead to unexpected results. Concerning the application domain, semantic data integration has not been applied to biomedical signals and particularly ECG’s. This thesis substantially contributed to the dynamic semantic enrichment of ROISES data integration system, presented in chapter 5. The proposed approach enabled the dynamic enrichment of the global ontology with concepts originating from the resources. In this scope this approach, based on machine learning and UMLS Metathesaurus, added new concepts in the taxonomy of the global ontology in a semi-automatic manner. Additionally it contributed to the enrichment of the system’s search criteria in order to study the various parameters of ECG biosignals, revealing implicit knowledge and promoting research in the cardiology domain. Adding new data into existing resources and new resources encoded in various standards apart from SCP-ECG and EDF, constitutes a future step towards the system’s extension. Applying slight changes to the structure and terminology of the global ontology, could also allow for the encapsulation of other biomedical signals like EEG. Finally, adding real data, medical guidelines and therapeutic pathways will foster the system’s capability for medical decisions support.
Το ερευνητικό πλαίσιο της συγκεκριμένης διδακτορικής διατριβής επικεντρώθηκε στη µελέτη, αναπαράσταση, διαχείριση και ενοποίηση του βιοϊατρικού σήµατος στον τοµέα της καρδιολογίας, δηλαδή το Ηλεκτροκαρδιογράφηµα (ΗΚΓ). Τα ΗΚΓ σήµατα αποθηκεύονται σε ηλεκτρονική µορφή είτε στο µορφότυπο που έχει καθοριστεί από την κατασκευάστρια εταιρία του Ηλεκτροκαρδιογράφου, είτε µετατρέπονται σε κάποιο κοινά αποδεκτό πρότυπο κωδικοποίησης όπως το EDF (European Data Format), το SCP-ECG (Standard communications protocol for computer assisted electrocardiography) κ.λ.π. Εκτός από το σήµα, τα πρότυπα αυτά περιλαµβάνουν επίσης τα µεταδεδοµένα του περιεχοµένου του σήµατος καθώς και δεδοµένα σχετικά µε το εννοιολογικό πλαίσιο δηµιουργίας του, δηλαδή τα δηµογραφικά στοιχεία του ασθενούς, τη συσκευή καταγραφής, τη διάγνωση, τον ερευνητή κ.λ.π. Τα µεταδεδοµένα του περιεχοµένου του σήµατος σχετίζονται µε τις επισηµειώσεις του γιατρού και µε κλινικά ερµηνευτικά δεδοµένα. Κίνητρο αυτής της διατριβής αποτέλεσε η αναγκαιότητα παροχής ενός ολοκληρωµένου και διαλειτουργικού περιβάλλοντος µελέτης των βιοϊατρικών σηµάτων, που προέρχονταν από διαφορετικές πληθυσµιακές οµάδες, συνθήκες λήψης και καταγραφής και παρουσιάζαν ετερογένεια σε διάφορα επίπεδα. Η απαίτηση για διαλειτουργικότητα εισήγαγε την έννοια των προτύπων, ο αριθµός των οποίων στον τοµέα της ιατρικής είναι τεράστιος. Τα ΗΚΓ σήµατα παραδοσιακά αποθηκεύονται σε µορφότυπους δυαδικής µορφής οι οποίοι δεν περιλαµβάνουν την απαραίτητη πληροφορία για αποτελεσµατική ανάλυση, ενοποίηση και διαλειτουργικότητα των πολλαπλών και ετερογενών πηγών δεδοµένων. Αρχικά µελετήθηκαν οι τεχνολογίες αναπαράστασης γνώσης, η επιλογή των οποίων κατά κανόνα αποτελεί κρίσιµο βήµα στην ολοκλήρωση δεδοµένων. Ως δοµή αναπαράστασης επιλέχθηκε η οντολογία γιατί δίνει τη δυνατότητα επαναχρησιµοποίησης της καταγεγραµµένης και σχετικής µε τον τοµέα γνώσης, χωρίς να χρειάζεται να την κωδικοποιήσει από την αρχή. Επίσης η οντολογία αποτελεί τη ραχοκοκαλιά του σηµασιολογικού ιστού και είναι εύκολα κατανοητή από ανθρώπους και υπολογιστές. Στη συνέχεια µελετήθηκαν προσεγγίσεις ολοκλήρωσης δεδοµένων και ορίστηκε µια µεθοδολογία ολοκλήρωσης βιοϊατρικών σηµάτων, που στηρίχθηκε στο εννοιολογικό µοντέλο ενοποίησης δεδοµένων και στην προσέγγιση Local As View. Στα πλαίσια της προτεινόµενης µεθοδολογίας ολοκλήρωσης, επιλέχθηκε η µοντελοποίηση της καθολικής οντολογίας να γίνει βάσει της γλώσσας ecgML, η οποία ενσωµατώνει τη δοµή και το περιεχόµενο των πιο αποδεκτών προτύπων στον τοµέα της Ηλεκτροκαρδιογραφίας. Επίσης προτάθηκε η χρήση της οντολογίας ταυτόχρονα ως δοµής για την παροχή ενοποιηµένης εικονικής όψης των υποκείµενων πηγών αλλά και ως πλατφόρµας διαφανούς έκφρασης ενιαίων συνδυαστικών ερωτηµάτων προς τις υποκείµενες πηγές. Προτάθηκε ακόµα ο διαχωρισµός του περιεχοµένου (content) από το ιατρικό πλαίσιο δηµιουργίας (context) των σηµάτων, προκειµένου να επιτευχθεί ο σηµασιολογικός εµπλουτισµός τους και να επιτραπεί η αναζήτησή τους µε δοµηµένα και κατανοητά κριτήρια. Το σύστηµα ROISES (Research Oriented Integration System of ECG Sources) προέκυψε ως εφαρµογή της παραπάνω µεθοδολογίας σε ΗΚΓ σήµατα. Το σύστηµα, επιτρέπει τη σηµασιολογική ολοκλήρωση ετερογενών ΗΚΓ σηµάτων και την αναζήτησή τους βάσει του περιεχοµένου και του ιατρικού πλαισίου δηµιουργίας τους. Η καθολική οντολογία, που αποτελεί τη δοµή έκφρασης ερωτηµάτων του συστήµατος, δίνει στο γιατρό τη δυνατότητα να ακολουθήσει εναλλακτικά διαγνωστικά και θεραπευτικά µονοπάτια που πιθανόν να τον οδηγήσουν σε απρόσµενα αποτελέσµατα. Ο ιατρός έχει τη δυνατότητα να εκφράσει τα ερωτήµατά του µέσω δοµηµένης ιατρικής ορολογίας και να επαναπροσδιορίσει τις σχέσεις µεταξύ των εννοιών που µπορεί να προκύψουν από την µετα-ανάλυση της θεραπευτικής αγωγής, βάσει της διάγνωσης, την πιθανότητα επαναξιολόγησης της διάγνωσης και την αντιστοίχιση µε προτυποποιηµένες κλινικές ιατρικές οδηγίες. Στη συνέχεια, µελετήθηκαν οι προσεγγίσεις οντολογικής µάθησης που έχουν προταθεί µέχρι σήµερα, προκειµένου να αναπτυχθεί µια νέα προσέγγιση οντολογικού εµπλουτισµού µε εφαρµογή το σύστηµα ROISES. Οι πηγές που ενσωµατώθηκαν στο σύστηµα αποτελούνταν από συλλογές καρδιογραφηµάτων κωδικοποιηµένων κατά τα πρότυπα EDF και SCP-ECG και µια βάση δεδοµένων για τη διαχείριση ασθενών µε χρόνιες παθήσεις. Η επέκταση του συστήµατος µε νέες πηγές και των πηγών µε νέα δεδοµένα, οδήγησε στην ανάγκη για σηµασιολογικό εµπλουτισµό της καθολικής οντολογίας. Η µέθοδος DTEM (Dynamic Terminology Enhancement Method) αναπτύχθηκε για να υλοποιήσει την παραπάνω απαίτηση, βασιζόµενη στις υπηρεσίες του UMLS Μεταθησαυρού και τις τεχνικές της µηχανικής µάθησης. Η διερεύνηση και εφαρµογή διαφόρων τεχνικών της µηχανικής µάθησης όπως Μηχανές ∆ιανυσµάτων Υποστήριξης, και αλγορίθµων µάθησης δένδρων ταξινόµησης οδήγησε στην επιλογή αυτών που έδωσαν τα καλύτερα αποτελέσµατα σε ακρίβεια, ευαισθησία και ειδικότητα. Η µέθοδος εκµεταλλεύτηκε τους ιατρικούς όρους που δεν αντιστοιχίζονται µε κάποια έννοια της καθολικής οντολογίας κατά τη διάρκεια της αντιστοίχισης, προκειµένου να διερευνήσει την καταλληλότητά τους ως πιθανές υποψήφιες κλάσεις στην καθολική οντολογία, και στη συνέχεια δεδοµένης της καταλληλότητάς τους, να προτείνει τις πιθανές θέσεις τους στην ιεραρχία της. Η εργασία παρουσιάζει πρωτοτυπία τόσο σε ότι αφορά τις προσεγγίσεις που προτάθηκαν όσο και στο πεδίο εφαρµογής τους. Συγκεκριµένα, η µεθοδολογία που προτάθηκε, οδήγησε στη δηµιουργία ενός ενιαίου διαλειτουργικού πλαισίου µελέτης και διαχείρισης βιοϊατρικών σηµάτων, µέσω της χρήσης ιατροτεχνολογικών προτύπων και προτύπων κωδικοποίησης της ιατρικής ορολογίας, τα οποία ορίστηκαν µε τη µορφή των οντολογιών. Η καθολική οντολογία µε την πρότυπη ιεραρχική δοµή της, δίνει στο γιατρό τη δυνατότητα να ακολουθήσει εναλλακτικά διαγνωστικά και θεραπευτικά µονοπάτια που πιθανόν να τον οδηγήσουν σε απρόσµενα αποτελέσµατα. Όσον αφορά το πεδίο εφαρµογής, τα βιοϊατρικά σήµατα και πιο συγκεκριµένα τα ΗΚΓ, αποτέλεσαν δεδοµένα στα οποία δεν έχει εφαρµοστεί η σηµασιολογική ολοκλήρωση δεδοµένων. Η διατριβή συνεισφέρει επίσης ουσιαστικά στο ζήτηµα του δυναµικού σηµασιολογικού εµπλουτισµού του συστήµατος ολοκλήρωσης δεδοµένων ROISES, που παρουσιάστηκε στο κεφ. 5. Η προσέγγιση που προτάθηκε επέτρεψε το δυναµικό εµπλουτισµό της καθολικής οντολογίας µε έννοιες που προέρχονταν από τα δεδοµένα των πηγών. Προτάθηκε µια καινοτόµος προσέγγιση βασισµένη στη µηχανική µάθηση και το λεξικό UMLS, που επέτρεψε την ηµιαυτόµατη προσθήκη νέων εννοιών στην ιεραρχία της καθολικής οντολογίας. Η προσέγγιση αυτή συνέβαλλε στην ανανέωση των κριτηρίων αναζήτησης και έρευνας των παραµέτρων του σήµατος ενώ παράλληλα εµπλούτισε την εµφανή γνώση µε επαγωγική µη εµφανή γνώση, προάγοντας την έρευνα και την υιοθέτηση νέων ιατρικών πρακτικών. Η προσθήκη νέων δεδοµένων στις ήδη υπάρχουσες πηγές και νέων πηγών ΗΚΓ σηµάτων κωδικοποιηµένων µε πρότυπα διαφορετικά από το SCP-ECG και το EDF, είναι ένα από τα επόµενα βήµατα επέκτασης του συστήµατος. Η εφαρµογή µικρών αλλαγών στη δοµή της καθολικής οντολογίας, µπορεί να επιτρέψει την εισαγωγή επιπλέον σηµάτων εκτός από το ΗΚΓ, όπως το Ηλεκτροεγκεφαλογράφηµα. Ο εµπλουτισµός του συστήµατος µε πραγµατικά δεδοµένα καθώς και µε ιατρικές οδηγίες και θεραπευτικές οδούς θα προσδώσει στο σύστηµα τη δυνατότητα στήριξης της ιατρικής απόφασης.

PhD Thesis

Σημασιολογική αναζήτηση ηλεκτροκαρδιαγραφημάτων
Semantic searching of ECG signals
Σύστημα ολοκλήρωσης ΗΚΓ δεδομένων
ECG integration system
Ontology enrichment
Οντολογικός εμπλουτισμός
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Natural Sciences
Computer and Information Sciences
Φυσικές Επιστήμες
Σημασιολογική ενοποίηση ηλεκτροκαρδιογραφημάτων
Semantic integration of ECG signals


Greek

2011


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ)
Aristotle University Of Thessaloniki (AUTH)




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)