Συγκέντρωση και καταγραφή ελληνικών γλωσσικών πόρων του ΠΑΔΑ

Συγκέντρωση και καταγραφή ελληνικών γλωσσικών πόρων του ΠΑΔΑ

Μπαμνιώτη, Αγγελική

Triantafyllou, Ioannis
Σχολή Διοικητικών, Οικονομικών & Κοινωνικών Επιστημών
Kapidakis, Sarantos
Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης
Giannakopoulos, Georgios A.
Διαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσεία

Μεταπτυχιακή διπλωματική εργασία

2023-01-09

2023-02-16T12:43:45Z


Ως γλωσσικός πόρος νοείται οποιοδήποτε σύνολο δεδομένων σε κάθε μορφή, σχετιζόμενο με τη γλώσσα, σε δομημένη ή αδόμητη μορφή. Το περιεχόμενο τους μπορεί να είναι πρωτογενές, επεξεργασμένο, πόροι οργανωμένης γνώσης ή ακόμα να εμπίπτει στην κατηγορία των γλωσσικών τεχνολογιών. Η συλλογή και καταγραφή γλωσσικών πόρων, εκτός από τη διάχυση της γνώσης και την προβολή του έργου των δημιουργών τους, συμβάλει σημαντικά στην εξέλιξη των γλωσσικών τεχνολογιών, οι οποίες αναπτύσσουν διάφορα εργαλεία και εφαρμογές γλωσσικής ανάλυσης και επεξεργασίας. Στη συγκεκριμένη εργασία συγκεντρώθηκαν και καταγράφηκαν ελληνικοί γλωσσικοί πόροι οι οποίοι έχουν παραχθεί στα πλαίσια του διδακτικού και ερευνητικού έργου του Πανεπιστημίου Δυτικής Αττικής, από τους διδάσκοντες, ερευνητές ή φοιτητές του. Στη συνέχεια, οι συγκεκριμένοι γλωσσικοί πόροι οργανώθηκαν, περιεγραφήκαν και τεκμηριώθηκαν στην ελληνική εκδοχή της ευρωπαϊκής διαδικτυακής υποδομής του Clarin. Το Clarin συσσωρεύει γλωσσικούς πόρους, τεχνολογίες και υπηρεσίες, σε διάφορες γλώσσες, με στόχο τη διάθεση τους προς την ερευνητική κοινότητα και τον απλό ιδιώτη. Το υλικό μπορεί να καταστεί επεξεργάσιμο μέσω διαφόρων γλωσσικών τεχνολογιών. Σημαντικός αριθμός πανεπιστήμιων και ερευνητικών κέντρων της Ελλάδας διαθέτουν ήδη ψηφιακό αποθετήριο στο Clarin, το οποίο φιλοξενεί τους παραγόμενους γλωσσικούς τους πόρους. Μέσω της εκπόνησης της συγκεκριμένης μεταπτυχιακής εργασίας, επιχειρήθηκε η δημιουργία ανάλογου ψηφιακού αποθετηρίου, μέσα στην υποδομή του Clarin, για το Πανεπιστήμιο Δυτικής Αττικής. Το υλικό συλλέχθηκε, επεξεργάστηκε, περιγράφηκε, τεκμηριώθηκε και έγινε προσβάσιμο προς την επιστημονική κοινότητα. Η συλλογή των πόρων πραγματοποιήθηκε έπειτα από επικοινωνία με τους δημιουργούς τους, οι οποίοι είναι και κάτοχοι των δικαιωμάτων διάθεσης τους. Επίσης συμπεριλήφθηκε υλικό που διατίθεται ήδη με ελεύθερες μορφές πνευματικών δικαιωμάτων και έχει παραχθεί στα πλαίσια του εκπαιδευτικού έργου του πανεπιστημίου. Η διάθεση του υλικού στο Clarin γίνεται με άδειες ανοιχτής πρόσβασης Creative Commons, σεβόμενοι την επιθυμία των δημιουργών του. Έπειτα από μια χρονοβόρα και επίπονη διαδικασία συλλέχθηκε υλικό από μεγάλο αριθμό δημιουργών, οι οποίοι εκπροσωπούν την πλειοψηφία των σχολών και τμημάτων των δύο ΤΕΙ, Αθηνών και Πειραιά, με τη συγχώνευση των οποίων δημιουργήθηκε το Πανεπιστήμιο Δυτικής Αττικής, καθώς και από το ίδιο το ΠαΔΑ. Συνολικά συλλέχθηκαν 193 γλωσσικοί πόροι. Αναφορικά με το ΤΕΙ Αθηνών, ενσωματώθηκε στην υποδομή του Clarin:el υλικό από 5 σχολές και 19 τμήματα, ενώ από το ΤΕΙ Πειραιά, υλικό από 2 σχολές και 8 τμήματα. Το υλικό από το ΠαΔΑ καλύπτει 4 σχολές και 5 τμήματα. Το 6 συγκεκριμένο υλικό, που βρίσκεται εξολοκλήρου σε μορφή κειμένου (text), αποτελείται από 188 σώματα κειμένου και 5 λεξικό /εννοιολογικούς πόρους. Οι 189 γλωσσικοί πόροι είναι μονόγλωσσοι και οι 4 δίγλωσσοι, ενώ οι εκπροσωπούμενες γλώσσες είναι τα ελληνικά, τα αγγλικά και η τοπική διάλεκτο της Μεσσηνίας


Ψηφιακές ανθρωπιστικές επιστήμες
Τεκμηρίωση
Γλωσσική επεξεργασία
Πανεπιστήμιο Δυτικής Αττικής
Γλωσσικές τεχνολογίες
Clarin
Γλωσσικοί πόροι
Μεταδεδομένα

Greek

Πανεπιστήμιο Δυτικής Αττικής

ΣΧΟΛΗ ΔΙΟΙΚΗΤΙΚΩΝ, ΟΙΚΟΝΟΜΙΚΩΝ & ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ - Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης - Μεταπτυχιακές διπλωματικές εργασίες - Διαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσεία

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
http://creativecommons.org/licenses/by-nc-nd/4.0/
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)