Ανάπτυξη προγράμματος εντοπισμού λογοκλοπών σε ελληνικά δοκίμια

 
This item is provided by the institution :

Repository :
Library and Information Center ESTIA
see the original item page
in the repository's web site and access all digital files if the item*
share




2017 (EN)

Ανάπτυξη προγράμματος εντοπισμού λογοκλοπών σε ελληνικά δοκίμια

Μπάγιος, Αλέξανδρος Θ.

Συστήματα σχεδιασμένα ώστε η λειτουργία τους να βασίζεται στην αξιοποίηση της'πλαισιακής' γνώσης είναι αρκετά και συναντώνται σε διαφορετικούς θεματικούς κλάδους. Μετην εκμετάλλευση του τρόπου λειτουργίας αυτής της αρχιτεκτονικής γίνεται ναυλοποιηθούν συστήματα που παρουσιάζουν στοιχεία επαναληπτικότητας κατά τηνεκτέλεσή τους. Ένα πεδίο εφαρμογής αυτής της αρχιτεκτονικής είναι ο εντοπισμόςλογοκλοπών. Αναγνωρίζοντας την επαναληπτικότητα στον τρόπο ταύτισης όμοιων φράσεωνμεταξύ πηγών, η εφαρμογή ενός αλγορίθμου αναγνώρισης πλαισίου μπορεί να αποφέρειθετικά αποτελέσματα ως προς την ποιότητα των αποτελεσμάτων αλλά καιτην απόδοση του συστήματος που εκτελεί τη διαδικασία αυτή. Ενώ υπάρχει έναςαξιόλογος αριθμός ηλεκτρονικών εργαλείων για τον εντοπισμό λογοκλοπών, εφαρμογές για τον εντοπισμό λογοκλοπών που να απευθύνονται συγκεκριμένα σε ελληνικά δοκίμια σπανίζουν.Αντικείμενο της πτυχιακής εργασίας είναι η υλοποίηση μίας εφαρμογής ανοιχτού κώδικα γιατον εντοπισμό λογοκλοπών προσαρμοσμένη στην ανάλυση ελληνικών κειμένων με τη χρήσηενός αλγορίθμου ταύτισης πλαισίου. Προκειμένου να λειτουργήσει αυτό το σύστημα,θα πρέπει να υλοποιηθούν μέθοδοι εξαγωγής κειμένου, αναζήτησησφράσεων στο διαδίκτυο και αποθήκευσησ εγγραφών στη μνήμη του συστήματος. Με μία βασική υλοποίηση του προγράμματος μπορούμε να καταλήξουμε σε συμπεράσματα τόσο για την ποιότητα της ανάλυσης στον τομέα των λογοκλοπών, όσο και για την απόδοση του συγκεκριμένου μοντέλου. Στο σύστημα που αναπτύχθηκε στη γλώσσα Java, υλοποιούνται τεχνικές αναγνώρισηςκειμένου και εξαγωγής κειμένου, όπως επίσης μέθοδοι αναζήτησης φράσεων στοδιαδίκτυο χρησιμοποιώντας τις υπηρεσίες των μηχανών αναζήτησης Google, Bing και Yahoo.Συμπεριλαμβάνονται επίσης διαδικασίες για την εξαγωγή κειμένου από διαδικτυακές σελίδεςκαθώς και τη διατήρηση και ενημέρωση ενός εσωτερικού αποθετηρίου της μορφής μίαςσχεσιακής βάσης δεδομένων.

graduate_thesis
Πτυχιακή Εργασία (EL)
Graduate Thesis (EN)

web scraping
Λογισμικό εφαρμογών - Ανάπτυξη
μηχανές αναζήτησης
Πλαίσιο
αναγνώριση πλαισίου
Λογισμικό ανοιχτού κώδικα
λογοκλοπές


2017-07-10


Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)