Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Ελλάνικος (Hellanicus)
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2012 (EL)

Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών (EL)

Κούρτης, Ιωάννης - Χρήστος

Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων. Άλλο. (EL)

Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικών κειμένων στο διαδίκτυο, τα προβλήματα πνευματικής ιδιοκτησίας συνεχώς αυξάνονται και η εύρεση του πραγματικού συγγραφέα ενός κειμένου καθώς και η απόδειξη ότι τα έργα του δεν είναι αντιγραφή ή παραλλαγή κάποιων άλλων, κρίνεται επιτακτική. Στο κείμενο αυτό θα μελετήσουμε μία τεχνική full fingerprinting εύρεσης λογοκλοπής σε κείμενα χρησιμοποιώτας ένα αναγνωρισμένο corpus αρχείων που δημοσιεύτηκε το 2010 (PAN10). Η μελέτη μας αφορά περιπτώσεις “external plagiarism” όπου από μία συλλογή τοπικών κειμένων (source-documents) προσπαθούμε να βρούμε αν υπάρχουν σε ύποπτα κείμενα (suspicious-documents) περιπτώσεις λογοκλοπής, και να προσδιορίσουμε τα ακριβή όρια στα κείμενα αυτά., χρησιμοποιώντας τον αλγόριθμο Needleman-Wunsch, ένα αλγόριθμο ταιριάσματος βιολογικών ακολουθιών. Προτείνουμε μία καινοτόμο μέθοδο η οποία βασίζεται στα “stopword n-grams” τα οποία φαίνεται ότι μπορούν να βρούν συντακτικές ομοιότητες μεταξύ κειμένων ακόμα και αν τα κείμενα έχουν τροποποιηθεί πολύ, αντικάθιστώντας λέξεις με συνώνυμες ή άλλες φράσεις.

masterThesis

Λογοκλοπή (EL)
Needleman (EL)
Plagiarism (EL)
Αποτύπωμα (EL)
Συλλογή (EL)
Βιοπληροφορική (EL)
External (EL)
Pairwise alignment (EL)
Βιολογία (EL)
N grams (EL)
Stopword (EL)
Ανίχνευση (EL)


2012


2015-11-19T11:02:07Z

Σάμος




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.