Τεχνικές μηχανικής μάθησης για σημασιολογικό χαρακτηρισμό αναφορών σε επιστημονικές δημοσιεύσεις

 
see the original item page
in the repository's web site and access all digital files if the item*
share




2016 (EN)
Τεχνικές μηχανικής μάθησης για σημασιολογικό χαρακτηρισμό αναφορών σε επιστημονικές δημοσιεύσεις

Χανδρινός, Ιωάννης

Τα επιστημονικά άρθρα και οι επιστημονικές δημοσιεύσεις που δημοσιοποιούνται, κατά παράδοση αποτελούν σημαντικές πηγές εξαγωγής γνώσης και βοηθήματα λήψης αποφάσεων και εξαγωγής συμπερασμάτων για ερευνητές αλλά και απλούς αναγνώστες που ασχολούνται ή ειδικεύονται στο θέμα διατριβής τους. Η ανάγνωση μιας δημοσίευσης με τη σειρά της μπορεί να οδηγήσει τον αναγνώστη προς αναζήτηση παρόμοιων δημοσιεύσεων, τις οποίες μπορεί να βρει μέσω των αναφορών που γίνονται από μία δημοσίευση προς μία άλλη. Υπάρχει όμως τρόπος να καταλάβει ο αναγνώστης ποια επιστημονικά άρθρα έχουν μεγάλη αξία για την επιστημονική κοινότητα, ώστε να επικεντρωθεί σε αυτά ως κύρια πηγή πληροφοριών του, και ποια όχι; Σίγουρα ο αριθμός των αναφορών που έχει δεχθεί η δημοσίευση από άλλες επιστημονικές δημοσιεύσεις είναι συνήθως καταλυτικός παράγοντας για την εξαγωγή συμπερασμάτων όσον αφορά την βαρύτητα της στον τομέα της, αλλά ποιος μπορεί να εγγυηθεί πως οι περισσότερες από αυτές τις αναφορές έχουν γίνει με θετικό υπόβαθρο και όχι για λόγους κατάρριψης των υποθέσεων της δημοσίευσης ή κριτικής αυτής; Σε αυτό το σημείο είναι που μπαίνει στο παιχνίδι η οντολογία CiTO, η οποία εκτελεί αυτόν ακριβώς το ρόλο, δηλαδή τον χαρακτηρισμό του τύπου των αναφορών που γίνονται ως προς μία δημοσίευση, και κατηγοριοποιεί το κείμενο που περικλείει την αναφορά με βάση τα χαρακτηριστικά αυτά. Δυστυχώς όμως, είτε επειδή δεν υπάρχει κάποιο εργαλείο αυτόματης απόδοσης των ετικετών της οντολογίας αυτής για λόγους πολυπλοκότητας της διαδικασίας, είτε λόγω άγνοιας τρόπου χρήσης της οντολογίας από τους συγγραφείς, οι περισσότεροι συγγραφείς επιστημονικών άρθρων αμελούν να χρησιμοποιήσουν τις ετικέτες της οντολογίας CiTO στα άρθρα τους, με αποτέλεσμα να χάνεται σημαντική πληροφορία που θα μπορούσε να αξιοποιηθεί προς όφελος των αναγνωστών αλλά και της επιστημονικής κοινότητας. Στο άρθρο αυτό περιγράφουμε τα βήματα που ακολουθήσαμε για την ανάπτυξη μιας εφαρμογής που αυτοματοποιεί την απόδοση ετικετών της οντολογίας, καθώς και το γνωστικό υπόβαθρο πάνω στο οποίο βασιστήκαμε.
Scientific articles and scientific publications of public nature, traditionally are significant sources of knowledge extraction and provide decision making support for researchers, as well as plain readers of the article. Reading of the article, can sometimes lead the reader to search for similar publications, which he can find through the citations of the current article for other publications. Nevertheless, is there a way for the reader to conclude which articles may have a major scientific impact in the field of concern, so that he will be able to only focus to them? Certainly the number of citations a publication has received is usually a catalytic factor for understanding its importance, but who can guarantee that these citations have a positive and not a negative background? This is where the CiTO ontology comes into play by offering a solution to this problem. The CiTO ontology is widely used for the characterization of citations. As a result, it provides help in categorizing the text surrounding those citations. Unfortunately, though, either due to lack of knowledge about the ontology or due to lack of an automatic CiTO tagging application, most writers neglect to use the ontology in their papers. This leads to information loss, information which could have been reclaimed by the readers or the scientific community. In our article we describe the steps we followed for the development of an application that automatically categorizes a citation based on the CiTO properties it most closely resembles.

info:eu-repo/semantics/bachelorThesis
Graduate Thesis / Πτυχιακή Εργασία

Ontology
Μηχανική μάθηση
Machine learning
Αναφορά
Citation
Οντολογία

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

Greek

2016
2016-10-31T12:17:43Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)