Μπεϋζιανή επιλογή μεταβλητών με την χρήση μη τοπικών εκ-των-προτέρων κατανομών

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Πέργαμος
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2015 (EL)
Μπεϋζιανή επιλογή μεταβλητών με την χρήση μη τοπικών εκ-των-προτέρων κατανομών

Πολυμερόπουλος Αλέξιος (EL)

Ο σημαντικότερος σκοπός της συμπερασματολογίας στην στατιστική είναι η επιλογή μοντέλου. Ο ίδιος ο σκοπός προκύπτει και απο την Μπεϋζιανή πλευρά ο οποίος θα αναλυθεί, σε αυτήν την διπλωματική. Παρόλου που η Μπεϋζιανη συμπερασματολογία έκανε τα πρώτα της βήματα στις αρχές του 18ου αιώνα, δεν υπήρξε σημαντική ανάπτυξη καθώς οι υπολογισμοί των πολλαπλών ολοκληρωμάτων δεν ήτανε εφικτοί και οι υπολογισμοί περιορίζονταν αποκλειστικά σε μονοδιάστατα ολοκληρώματα. Καθώς τα χρόνια πέρασαν, η πρόοδος της τεχνολογίας και των ηλεκτρονικών υπολογιστών κατάφερε να κάνει εφικτό τον υπολογισμό πολλαπλών ολοκληρωμάτων σε πολλά πεδία επιστημών, όπως της φυσικής, των μαθηματικών κ.τ.λ.π. Η χρήση των μεθόδων MCMC κατάφερε να απλοποιήσει όλους αυτούς τους πολύπλοκους υπολογισμούς και η συμπερασματολογία έγινε απλούστερη και έτσι αναπτύχθηκαν πολυάριθμες εφαρμογές των Μπεϋζιανών μεθόδων σε διάφορα επιστημονικά πεδία. Σε αυτήν την διπλωματική θα ασχοληθούμε αποκλειστικά και μόνο με Μπεϋζιανή συμπερασματολογία για τα απλά γραμμικά μοντέλα και θα αντιμετωπίσουμε προβλήματα όταν υπάρχει πλήρης αβεβαιότητα για το ποιες μεταβλητές πρέπει να συμπεριληφθούν στο μοντέλο και αβεβαιότητα που πηγάζει απο τις άγνωστες παραμέτρους του μοντέλου. Θα γίνει περιγραφή της Μπεϋζιανής επιλογής μοντέλων και θα γίνει αναφορά για τις εναλλακτικές επιλογές των εκ-των-προτέρων κατανομών που θα χρησιμοποιηθούν σε τέτοια προβλήματα. Η χρήση προχωρημένων μεθόδων MCMC σε τέτοια προβλήματα εκτίμησης των εκ-των-υστέρων παραμέτρων καλείται επιλογή μεταβλητών. Οι παραδοσιακές εκ-των-προτέρων κατανομές που χρησιμοποιούνται στην Μπεϋζιανή επιλογή μεταβλητών είναι ευαίσθητες στον καθορισμό των εκ-των-προτέρων υπερπαραμέτρων και στην αύξηση του μέγεθος του δείγματος n, και επίσης δίνουν μεγαλύτερο βάρος σε περιοχές που σχετίζονται με την μηδενική υπόθεση, γιαυτό προτείνονται οι μη τοπικές εκ-των-προτέρων κατανομές που αποτελούν ενα καινοτόμο προσέγγισης στην επιλογή μεταβλητών και είναι το κύριο κομμάτι αυτής της διπλωματικής. Επιπλέον, οι μη τοπικές εκ-των-προτέρων κατανομές δίνουν μεγαλύτερη μάζα πιθανότητα σε περιοχές που είναι πιο πιθανές για την εναλλακτική υπόθεση, έτσι λαμβάνουν υπόψην μεγάλο μέρος της αβεβαιότητας του μοντέλου καθώς συρρικνώνουν στο μηδέν τις μη σημαντικές μεταβλητές. Τα βασικά χαρακτηριστικά είναι ότι υποστηρίζουν απλούστερα μοντέλα και παρέχουν καλύτερες προβλέψεις. Στο πλαίσιο αυτής της διπλωματικής, εφαρμογές των προγραμμάτων R και WinBUGS παρουσιάζονται για την επιλογή μεταβλητών και την Μπεϋζιανη στάθμιση μοντέλων. Οι εκάστοτε μεθοδολογίες θα εφαρμοστούν σε ιατρικά δεδομένα και προσομοιωμένα δεδομένα. (EL)
The most important purpose of statistics inference is the model selection. The same goal turns out to be from the Bayesian perspective which we will be further analyzed in this thesis. Although, the Bayesian statistics made the first steps in the early of 18th century, there was no succesful development because of the calculation of the multiple integrals was inefficient, thus the only exact calculation was regarding the univariate integrals. As year passed, the important improvement of the technology and the use of computers made this calculation reality, such as in handsome domains of science like physics, maths etc. The use of MCMC made more efficient and fast calculations and the inference turns out to be simplier, thus there was a significant increase in the applications of Bayesian method regarding the different fields of science.In this thesis, we will focus on Bayesian statistics for linear models and we deal with problems where much uncertainty lies from the selection of variables and from the unknown parameters of the model. We make a description of Bayesian model selection and we will further discuss about the different choices of prior distributions. The use of advanced MCMC in problems regarding the model selection such as the estimation of aposteriori quantities of interest is called variable selection. Furthermore, the traditional priors that are used in the Bayesian model selection, are sensitive to larger values of the sample and larger values of the prior variance, also these densities assign larger weight to parameter spaces consistent with the null hypothesis, so we make an introduction and further analysis on an alternative Bayeasian approach based on non local priors regarding the variable selection and it is this most striking feature of this thesis. In addition, these non local priors densities give more mass probability to regions that are more probable under the alternative hypothesis than the null and take more in consideration the model uncertainty in such way that increase the shrinkage of the non important covariates towards zero provided by the data. The most important properties of these densities is that they introduce more sparsity models and provide more accurate predictions. Moreover, in this thesis we analyze further apllications of medical data and simulated in the enviroment of R and WinBUGS regarding the Bayesian variable selection and the model averaging. (EN)

born_digital_postgraduate_thesis
Διπλωματική Εργασία (EL)
Postgraduate Thesis (EN)

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών (EL)
University of Athens (EN)

Ελληνική γλώσσα

2015




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.