Ανάπτυξη γλωσσικών μοντέλων για τη μυκηναϊκή γραμμική Β γραφή και η εφαρμογή τους στην αποκατάσταση των μυκηναϊκών πινακίδων

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Development of language models for the mycenaean linear B script and their application in the restoration of tablets
Ανάπτυξη γλωσσικών μοντέλων για τη μυκηναϊκή γραμμική Β γραφή και η εφαρμογή τους στην αποκατάσταση των μυκηναϊκών πινακίδων

Papavasileiou, Aikaterini
Παπαβασιλείου, Αικατερίνη

PhD Thesis

2023


Η Μυκηναϊκή Γραμμική Β είναι μια αρχαία γραφή που χρησιμοποιήθηκε για τη συγγραφή του αρχαιότερου σταδίου της ελληνικής γλώσσας, τη Μυκηναϊκή ελληνική. Χρησιμοποιήθηκε κυρίως κατά την Ύστερη Εποχή του Χαλκού, συγκεκριμένα από τον 15ο έως τον 13ο αιώνα π.Χ. Η παρούσα διατριβή διερευνά το πρόβλημα της αποκατάστασης των μυκηναϊκών πινακίδων της Γραμμικής Β με τη χρήση μεθόδων συμπλήρωσης κειμένου που βασίζονται σε μοντέλα μηχανικής μάθησης. Για να συλλάβουμε τη στατιστική δομή των Μυκηναϊκών εγγράφων παρουσιάζουμε ένα σύνολο δεδομένων από Μυκηναϊκές ακολουθίες εστιάζοντας στις Μυκηναϊκές κατηγορίες D και ΑΒ . Προτείνουμε τη μεγέθυνση του συνόλου δεδομένων με μεθόδους επαύξησης δεδομένων που λαμβάνουν υπόψη τη δομή των Μυκηναϊκών πινακίδων. Ερευνούμε διάφορες αρχιτεκτονικές επαναλαμβανόμενων νευρωνικών δικτύων και συγκρίνουμε τα αποτελέσματά τους τόσο σε τεχνητά όσο και σε πραγματικά κενά.Για να αντιμετωπίσουμε περαιτέρω το πρόβλημα της έλλειψης δεδομένων, διερευνούμε την περίπτωση μεταφοράς γνώσης μεταξύ μοντέλων που έχουν εκπαιδευτεί σε διαφορετικές κατηγορίες, εφαρμόζοντας διαφορετικές παραμετροποιήσεις μεταφοράς μάθησης. Παρέχουμε ποσοτικά αποτελέσματα τόσο σε συνθετικές όσο και σε πραγματικές περιπτώσεις κατεστραμμένων ακολουθιών και συγκρίνουμε με τις απόψεις των ειδικών με πολλά υποσχόμενα αποτελέσματα. Τα αποτελέσματα μπορούν να επεκταθούν για να χειριστούν παρόμοια προβλήματα στη Γραμμική Β, ή άλλες αρχαίες γραφές, όπως η αποκρυπτογράφηση, η αναγνώριση θέσης ή η αναγνώριση γραφέων. Αυτή είναι η πρώτη εργασία αυτού του είδους για τη Μυκηναϊκή Γραμμική Β, η οποία ελπίζουμε να φέρει πιο κοντά τις κοινότητες των ειδικών της μηχανικής μάθησης, των αρχαιολόγων και των γλωσσολόγων.
Mycenaean Linear B is an ancient script that was used for writing the earliest known form of the Greek language, referred to as Mycenaean Greek. It was primarily used during the Late Bronze Age, specifically from the 15th to the 13th century BCE. This thesis investigates the problem of restoring Mycenaean linear B tablets by using text infilling methods based on machine learning models. To capture the statistical structure of the Mycenaean documents we present a dataset of sequences focusing on the series D and series A\&B. We propose to enlarge the dataset by data augmentation methods that consider the structure and semantics of the domain described by the script. We investigate various Recurrent Neural Network architectures and compare their results on both synthetically generated and real gaps. To further tackle the problem of data scarcity we investigate the case of transferring knowledge between models trained on different series, by applying different transfer learning configurations. We provide quantitative results on both synthetic and real cases of damaged sequences and compare to the experts' opinions with promising results. The results can be extended to handle similar problems in Linear B or other ancient scripts such as decipherment, location identification or scribe identification. This is the first work of this kind on Mycenaean Linear B, which we hope to bring closer the communities of machine learning experts, archaeologists and linguists.

Ανθρωπιστικές Επιστήμες και Τέχνες ➨ Ιστορία και Αρχαιολογία ➨ Αρχαιολογία
Φυσικές Επιστήμες ➨ Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη

Recurrent neural networks
Επαναλαμβανόμενο νευρωνικό δίκτυο
Artificial Intelligence
Humanities and the Arts
Γλωσσικό μοντέλο
Ιστορία και Αρχαιολογία
Επεξεργασία φυσικής γλώσσας
Computer and Information Sciences
Φυσικές Επιστήμες
Archaeology
Μυκηναϊκή γραμμική Β γραφή
Language model
Αρχαιολογία
Τεχνητή νοημοσύνη
History and Archaeology
Μηχανική μάθηση
Machine learning
Natural language processing
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Natural Sciences
Mycenaean linear B script
Ανθρωπιστικές Επιστήμες και Τέχνες

Αγγλική γλώσσα

Πανεπιστήμιο Πατρών
University of Patras

Πανεπιστήμιο Πατρών. Σχολή Ανθρωπιστικών και Κοινωνικών Επιστημών. Τμήμα Ιστορίας - Αρχαιολογίας




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.