Ανάλυση αντιστοιχιών σε κατηγορικά δεδομένα

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Ιδρυματικό Αποθετήριο Ελλάνικος (Hellanicus)
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο





Ανάλυση αντιστοιχιών σε κατηγορικά δεδομένα (EL)

Καλλιγέρης, Εμμανουήλ - Νεκτάριος

aegean

Τhis dissertation is conducted at the Department of Mathematics, Division: Statistics and Actuarial - Financial Mathematics of the Aegean University. Its purpose is to analyze the correspondence analysis method using appropriate theoretical background and examples. This analysis method requires the theoretical background of linear algebra and more particularly the orthonormalization and analysis of categorical data in order to understand the appropriate techniques. The structure of the thesis consists of three chapters. In chapter one, 4 basic methods of matrix factorization (Gauss, LU, QR, SVD) accompanied by analytical applications and examples are presented. In addition, it examines some basic concepts like eigenvalues, eigenvectors and the Gram-Schmidt orthonormalization. The second chapter, constitutes an introduction to categorical data analysis. Poisson, Binomial and Multinomial distributions are presented along with their properties and are incorporated in relevant examples. The key features of this chapter are the contingency table, its properties and Pearson’s test of independence. The latter two concepts, are among the main pillars for the application of correspondence analysis. In addition, the maximum likelihood and the G2 likelihood ratio concepts are analyzed in order to deepen into the goodness of fit tests of data. The third chapter thoroughly analyzes the categorical data processing method using the correspondence analysis method. Masses, Distances and Biplot are some of the basic tools used in understanding and processing the data. Lastly, similar correspondence analysis methods which are based on simple correspondence analysis like the Multiple and Canonical one are presented in an extended fashion. In conclusion, we introduce the program '' SCORAN '' which is based solely on MatLab coding and is designed to implement and process data using the correspondence method.
Η παρούσα πτυχιακή εργασία εκπονήθηκε στο Τμήμα Μαθηματικών, Εισαγωγική Κατεύθυνση: Στατιστικής και Αναλογιστικών-Χρηματοοικονομικών Μαθηματικών του Πανεπιστημίου Αιγαίου. Σκοπός της είναι η ανάλυση και κατανόηση της μεθόδου των αντιστοιχιών κάνοντας χρήση κατάλληλου θεωρητικού υπόβαθρου και χρήση παραδειγμάτων. Η συγκεκριμένη μέθοδος ανάλυσης προϋποθέτει θεωρητικό υπόβαθρο γραμμικής άλγεβρας και ιδιαίτερα μεθόδων ορθοκανονικοποίησης και ανάλυσης κατηγορικών δεδομένων προκειμένου να κατανοηθούν οι αντίστοιχες τεχνικές. Η δομή της εργασίας αποτελείται από 3 κεφάλαια. Στο 1ο κεφάλαιο, παρουσιάζονται 4 βασικές μέθοδοι παραγοντοποίησης πινάκων (Gauss, Lower Upper, QR, Singular Value Decomposition) συνοδευόμενες από αναλυτικές εφαρμογές και παραδείγματα. Επιπλέον, μελετώνται βασικές έννοιες της γραμμικής άλγεβρας όπως αυτή των ιδιοτιμών, των ιδιοδιανυσμάτων αλλά και της ορθοκανονικοποίησης Gram-Schmidt. Στο 2ο κεφάλαιο, γίνεται εισαγωγή στα κατηγορικά δεδομένα. Οι διακριτές κατανομές Poisson, Διωνυμική και Πολυωνυμική παρουσιάζονται μαζί με τις ιδιότητές τους και χρησιμοποιούνται σε σχετικά παραδείγματα. Τα βασικά στοιχεία του κεφαλαίου αυτού είναι ο πίνακας συνάφειας και τα χαρακτηριστικά του καθώς και ο έλεγχος ανεξαρτησίας κατά Pearson. Επίσης οι έννοιες της πιθανοφάνειας και του G2 ελέγχου λόγου πιθανοφανειών αναλύονται με σκοπό την εμβάθυνση στις μεθόδους καλής προσαρμογής των δεδομένων. Στο 3ο κεφάλαιο αναλύεται διεξοδικά η μεθοδολογία επεξεργασίας κατηγορικών δεδομένων με χρήση της μεθόδου των αντιστοιχιών. Μάζες, Αποστάσεις και Biplot είναι μερικά από τα βασικά εργαλεία που χρησιμοποιούνται στην κατανόηση και επεξεργασία των δεδομένων. Στο τέλος της πτυχιακής παρουσιάζονται διευρυμένα παραπλήσιες μέθοδοι ανάλυσης αντιστοιχιών όπως η Πολλαπλή και η Κανονιστική, οι οποίες έχουν ως βάση την απλή ανάλυση αντιστοιχιών. Στο τέλος του κεφαλαίου αυτού, παρουσιάζεται το νέο πρόγραμμα με τον κωδικό ‘’SCORAN’’ το οποίο δημιουργήθηκε αποκλειστικά σε γλώσσα MatLab και σχεδιάστηκε με σκοπό την επεξεργασία δεδομένων με τη μέθοδο αντιστοιχιών.

bachelorThesis

κατηγορικά δεδομένα (EL)
ανάλυση αντιστοιχιών (EL)
correspondence analysis (EL)
categorical data (EL)
γραμμικά συστήματα (EL)
πολυμεταβλητή ανάλυση (EL)
ανάλυση κύριων συνιστωσών (EL)
multivariate analysis (EL)
Principal component analysis (EL)


2016-06-29


2017-03-29T08:50:20Z

Σάμος




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.