This item is provided by the institution :

Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*
share




1999 (EN)

Οικονομία και Συνέπεια Θηραυρών Όρων
Economy and Consistency in Thesauri

Ντοάς, Δημήτρης Ν (EL)
Ntoas, Dimitris N (EN)

Ένας θησαυρός όρων είναι μια εννοιλογική δομή που περιγράφει έννοιες ενός πεδίου γνώσης με τη χρήση ενός λεξιλογίου όρων και τριών τύπων συσχετίσεων μεταξύ αυτών: συσχετίσεις ισοδυναμίας, ιεραρχικές συσχετίσεις και συσχετίσεις συνάφειας. Υπάρχουν πολλοί θησαυροί όρων που ασχολούνται με το ίδιο πεδίο γνώσης, με αποτέλεσμα να είναι επιθυμητή η συγχώνευσή τους με χρήση σημασιολογικών συσχετίσεων που θα δηλώνουν το κατά πόσο δυο έννοιες των θησαυρών αναπαριστούν την ίδια έννοια. Τόσο η συνένωση θησαυρών, όσο και η κατασκευή από το μηδέν ενός θησαυρού είναι μια πολύ επίπονη διαδικασία, η οποία μπορεί να προκαλέσει δηλώσεις συσχετίσεων που να οδηγήσουν σε ασυνέπεια το θησαυρό. Επομένως είναι αναγκαία η έρευνα για τον σχεδιασμό και την υπολοποίηση ενός συστήματος το οποίο θα ανιχνεύει τις δηλώσεις συσχετίσεων που οδηγούν το θησαυρό σε ασυνεπή κατάσταση. Στην εργασία αυτή, εντοπίσαμε τις σημαντικότερες περιπτώσεις ασυνέπειας σε ένα θησαυρό και προσπαθήσαμε να προτείνουμε τις αντίστοιχες λύσεις. Στην προσπάθειά μας αυτή συνέβαλε και η Περιγραφική Λογική. Η Περιγραφική Λογική παράγει εννοιολογικές γλώσσες οι οποίες είναι αρκετά κοντά στη φυσική γλώσσα. Επιπλέον η περιγραφική λογική παρέχει ένα τυπικό πλαίσιο μέσα στο οποίο είναι δυνατή η αντιμετώπιση των προβλημάτων που έχουμε περιγράψει. Αν και στην υλοποίηση η απόδοση των συστημάτων περιγραφικής λογικής δεν ήταν η αναμενόμενη, μας βοήθησαν να αναπτύξουμε το θεωρητικό υπόβαθρο, το οποίο θα μπορεί να εφαρμοστεί στην περίπτωση των θησαυρών όρων. Ιδιαίτερη βαρύτητα δώσαμε στην αντιμετώπιση ασυνεπειών κατά την παραγωγή σύνθετων όρων. Έπρεπε να θέσουμε περιορισμούς ως προς το ποιοί όροι μπορούν να συνδυαστούν με ποιούς και πώς θα γίνει αυτός ο συνδυασμός. Για το λόγο αυτό ορίσαμε μια σειρά από συσχετίσεις μεταξύ των κατηγοριών όρων οι οποίες ορίζουν ποιοι όροι μπορούν να συνδυαστούν και με ποιό τρόπο. Για την υλοποίηση ενός τέτοιου συστήματος χρησιμοποιήσαμε το μοντέλο δεδομένων της γλώσσας Telos του συστήματος Σημασιολογικού Ευρετηριασμού (Semantic Index System, SIS) και ένα απλό εννοιολογικό σχήμα. Χρησιμοποιώντας το SIS ως πλατφόρμα ανάπτυξης, υλοποιήσαμε σε C++ τις διαδικασίες σύνθεσης δυναμικών όρων καθώς και κάποιων λειτουργιών σχετικών με αυτούς. Επίσης πραγματοποιήσαμε ένα πείραμα για την αντικατάσταση των μη συνεπών σύνθετων όρων του θησαυρού όρων ΑΑΤ (Arts & Architecture Thesaurus) με τους αντίστοιχους που δημιουργεί το σύστημά μας. (EL)
A thesaurus is a conceptual structure representing concepts from a patricular domain of discourse using a controlled vocabulary and three types of relationships between concepts: equivalence, hierarchical and associative relationships. There are cases that several thesauri concern the same domain of knowledge, which we would like to merge using relationships denoting the degree to which two rerms represent the same concept. The merging of thesauri as well as the construction of a thesaurus is an exceptionally hard and time consuming task, which can result in an inconsistent thesaurus. Thus, research is necessary concerning the design and implementation of a system which would be able to find any relationship or term declaration that may lead a thesaurus to an inconsistent state. During our research, we traced the most important cases of a thesuarus' inconsistency and tried to propose a solution. In this task we used Description Logic. Description Logic produces conceptual languages that are expressive and quite close to natural language. Further more, Description Logic provides a formal framework for addressing the above issues. Although the performance of systems based on Description Logic wasn't satisfactory, Description Logic helped us build a theoretical background which if adjusted to the framework of thesauri can confront the cases of inconsistency that we have defined. Maintaining consistency during the formation of compound terms was one of the most important parts of our research. We had to define a set of constraints on whether two terms can be combined and on the way that such a combination can be accomplished. We used the Telos data model of the Semantic Index System for the implementation of such a system. Using SIS as a platform, we have implemented the formation of compound termsand a set of relevant operations in C++. We have conducted an experiment of replacing inconsistent compound terms of the AAT thesaurus with those that our system produced and thge results were encouraging. (EN)

text
Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης


1999-12-02
1999-11-01


Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)