Το τεκμήριο παρέχεται από τον φορέα :
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών   

Αποθετήριο :
Πέργαμος   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Maschinelle Übersetzung in politischen Texten

Τσομπάνου Δέσποινα (EL)
Tsompanou Despina (EN)

born_digital_postgraduate_thesis
Διπλωματική Εργασία (EL)
Postgraduate Thesis (EN)

2023


Ένας από τους σημαντικότερους τομείς της υπολογιστικής γλωσσολογίας είναι η αυτόματη μετάφραση. Πρόκειται για μια αυτοματοποιημένη διαδικασία μηχανικής μετάφρασης. Η παρούσα διπλωματική εργασία προσπαθεί να εξετάσει την ποιότητα της αυτοματοποιημένης μετάφρασης με βάση τρία κείμενα και να κατηγοριοποιήσει τις μεταφραστικές δυσκολίες. Η μετάφραση πραγματοποιήθηκε με τη βοήθεια ενός συστήματος αυτόματης μετάφρασης, του Google Translate, το οποίο αποτελεί την πλέον διαδεδομένη εφαρμογή κοινής χρήσης, καθώς το πλήθος σωμάτων κειμένων και τα εργαλεία μετάφρασης που διαθέτει εξυπηρετούν ημερησίως περισσότερους από 200 εκατομμύρια χρήστες. Για τον σκοπό αυτόν επιλέχθηκαν τρία γερμανικά επιστημονικά κείμενα που απευθύνονταν στο ευρύ κοινό από διαδικτυακές πηγές (ιστοσελίδα ομοσπονδιακής κυβέρνησης της Γερμανίας) και μεταφράστηκαν στα ελληνικά με τη χρήση του Google Translate. Σε πολλές περιπτώσεις, δεν έχει γίνει ισοδύναμη μετάφραση. Αυτό έχει ως αποτέλεσμα πολλά λάθη που έχουν αλλάξει ή/και χάσει το νόημα του κειμένου. Ένας άλλος παράγοντας είναι η ισοδυναμία μεταξύ της γλώσσας-πηγής και της γλώσσας-στόχου. Το γλωσσικό σύστημα κάθε γλώσσας περιέχει συγκεκριμένους κανόνες που την καθιστούν μοναδική. Ένα μεγάλο ποσοστό λαθών μεταξύ γερμανικών και ελληνικών οφείλεται σε λεξιλογικούς περιορισμούς και μορφοσυντακτικές διαφορές. Επιπλέον, οι γλωσσικές μονάδες που σχετίζονται με γραμματικές κατηγορίες (σημασιολογικά και γραμματικά λάθη) του εξεταζόμενου ζεύγους γλωσσών δεν αναγνωρίζονται και δεν επεξεργάζονται πάντα με τον ίδιο τρόπο. Επομένως, η μηχανική μετάφραση δεν μπορεί να αποδώσει εκατό τοις εκατό σωστά τα μακροσκελή και περίπλοκα συστήματα και συνιστάται η ταυτόχρονη χρήση πολλών μεταφραστικών συστημάτων για αυτού του είδους τα κείμενα. Μπορεί να συναχθεί το συμπέρασμα ότι η δυσκολία των κειμένων έγκειται στο ότι τα αντικείμενα αυτής της μελέτης έχουν συγκεκριμένα υφολογικά και γλωσσικά χαρακτηριστικά, καθώς αποτελούν ειδική κατηγορία κειμενικών τύπων. Οι πολιτικές ομιλίες δεν πρέπει να θεωρούνται μόνο ως κείμενα πληροφόρησης, διότι ανήκουν και στον ακαδημαϊκό τομέα. Κάθε κείμενο περιέχει μεγάλο αριθμό ξένων λέξεων, τεχνικών όρων και ορολογίας. Επιπλέον, το ακροατήριο πρέπει να διαθέτει ειδικές κοινωνιογλωσσικές γνώσεις. Τα στατιστικά αποτελέσματα δείχνουν ότι πρόκειται για μια χρήσιμη μηχανή μετάφρασης που θα μπορούσε να βελτιωθεί. Σε γενικές γραμμές, το σύστημα αυτοματοποιημένης μετάφρασης της Google ήταν ικανοποιητικό παρά τα σφάλματα. Για την επίτευξη καλύτερων αποτελεσμάτων μηχανικής μετάφρασης, θα πρέπει να δωθεί μεγαλύτερη προσοχή στο νόημα του κειμένου και στην εξειδικευμένη γλώσσα- ορολογία, έργο δύσκολο, καθώς οι βάσεις δεδομένων συλλέγουν αυτόματα στατιστικά δεδομένα με βάση τη χρήση του εν λόγω μεταφραστικού συστήματος. (EL)
One of the most important areas of computational linguistics is machine translation. It is an automated process of machine translation. This thesis tries to examine the quality of automated translation based on three texts and categorize the translation difficulties. The translation was carried out with the help of an automatic translation system, Google Translate, which is the most widely used shared application, as its multitude of text corpora and translation tools serve more than 200 million users daily. For this purpose, three German scientific texts addressed to the general public from online sources (website of the German federal government) were selected and translated into Greek using Google Translate. In many cases, no equivalent translation has been done. This has resulted in many errors that have changed and/or lost the meaning of the text. Another factor is the equivalence between the source language and the target language. The language system of each language contains specific rules that make it unique. A large percentage of errors between German and Greek are due to lexical constraints and morphosyntactic differences. Furthermore, language units related to grammatical categories (semantic and grammatical errors) of the language pair under examination are not always recognised and processed in the same way. Therefore, machine translation cannot render long and complex systems one hundred per cent correctly and it is recommended to use several translation systems simultaneously for this type of texts. It can be concluded that the difficulty of the texts lies in the fact that the objects of this study have specific stylistic and linguistic characteristics, as they are a special category of text types. Political speeches should not be considered only as information texts, because they belong to the academic field as well. Each text contains a large number of foreign words, technical terms and terminology. In addition, the audience must have specific sociolinguistic knowledge. The statistical results show that this is a useful translation engine that could be improved. In general, Google's automated translation system was satisfactory despite the bugs. To achieve better machine translation results, more attention should be paid to the meaning of the text and the specialized language terminology, a difficult task as the databases automatically collect statistical data based on the use of this translation system. (EN)

Τεχνολογία – Πληροφορική

Τεχνολογία – Πληροφορική (EL)
Technology - Computer science (EN)

Γερμανική γλώσσα
Αγγλική γλώσσα

Σχολή Φιλοσοφική » Τμήμα Γερμανικής Γλώσσας και Φιλολογίας » ΠΜΣ Γερμανική Φιλολογία: Θεωρία - Εφαρμογές » Κατεύθυνση Διεπαφές Γλωσσολογίας και Διδακτικής
Βιβλιοθήκη και Κέντρο Πληροφόρησης » Βιβλιοθήκη Φιλοσοφικής Σχολής

https://creativecommons.org/licenses/by-nc/4.0/




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.