Ο σημαντικότερος σκοπός της συμπερασματολογίας στην στατιστική είναι η επιλογή
μοντέλου. Ο ίδιος ο σκοπός προκύπτει και απο την Μπεϋζιανή πλευρά ο οποίος θα
αναλυθεί, σε αυτήν την διπλωματική. Παρόλου που η Μπεϋζιανη συμπερασματολογία
έκανε τα πρώτα της βήματα στις αρχές του 18ου αιώνα, δεν υπήρξε σημαντική
ανάπτυξη καθώς οι υπολογισμοί των πολλαπλών ολοκληρωμάτων δεν ήτανε εφικτοί και
οι υπολογισμοί περιορίζονταν αποκλειστικά σε μονοδιάστατα ολοκληρώματα. Καθώς
τα χρόνια πέρασαν, η πρόοδος της τεχνολογίας και των ηλεκτρονικών υπολογιστών
κατάφερε να κάνει εφικτό τον υπολογισμό πολλαπλών ολοκληρωμάτων σε πολλά πεδία
επιστημών, όπως της φυσικής, των μαθηματικών κ.τ.λ.π. Η χρήση των μεθόδων MCMC
κατάφερε να απλοποιήσει όλους αυτούς τους πολύπλοκους υπολογισμούς και η
συμπερασματολογία έγινε απλούστερη και έτσι αναπτύχθηκαν πολυάριθμες εφαρμογές
των Μπεϋζιανών μεθόδων σε διάφορα επιστημονικά πεδία. Σε αυτήν την διπλωματική
θα ασχοληθούμε αποκλειστικά και μόνο με Μπεϋζιανή συμπερασματολογία για τα απλά
γραμμικά μοντέλα και θα αντιμετωπίσουμε προβλήματα όταν υπάρχει πλήρης
αβεβαιότητα για το ποιες μεταβλητές πρέπει να συμπεριληφθούν στο μοντέλο και
αβεβαιότητα που πηγάζει απο τις άγνωστες παραμέτρους του μοντέλου. Θα γίνει
περιγραφή της Μπεϋζιανής επιλογής μοντέλων και θα γίνει αναφορά για τις
εναλλακτικές επιλογές των εκ-των-προτέρων κατανομών που θα χρησιμοποιηθούν σε
τέτοια προβλήματα. Η χρήση προχωρημένων μεθόδων MCMC σε τέτοια προβλήματα
εκτίμησης των εκ-των-υστέρων παραμέτρων καλείται επιλογή μεταβλητών. Οι
παραδοσιακές εκ-των-προτέρων κατανομές που χρησιμοποιούνται στην Μπεϋζιανή
επιλογή μεταβλητών είναι ευαίσθητες στον καθορισμό των εκ-των-προτέρων
υπερπαραμέτρων και στην αύξηση του μέγεθος του δείγματος n, και επίσης δίνουν
μεγαλύτερο βάρος σε περιοχές που σχετίζονται με την μηδενική υπόθεση, γιαυτό
προτείνονται οι μη τοπικές εκ-των-προτέρων κατανομές που αποτελούν ενα
καινοτόμο προσέγγισης στην επιλογή μεταβλητών και είναι το κύριο κομμάτι αυτής
της διπλωματικής. Επιπλέον, οι μη τοπικές εκ-των-προτέρων κατανομές δίνουν
μεγαλύτερη μάζα πιθανότητα σε περιοχές που είναι πιο πιθανές για την
εναλλακτική υπόθεση, έτσι λαμβάνουν υπόψην μεγάλο μέρος της αβεβαιότητας του
μοντέλου καθώς συρρικνώνουν στο μηδέν τις μη σημαντικές μεταβλητές. Τα βασικά
χαρακτηριστικά είναι ότι υποστηρίζουν απλούστερα μοντέλα και παρέχουν καλύτερες
προβλέψεις. Στο πλαίσιο αυτής της διπλωματικής, εφαρμογές των προγραμμάτων R
και WinBUGS παρουσιάζονται για την επιλογή μεταβλητών και την Μπεϋζιανη
στάθμιση μοντέλων. Οι εκάστοτε μεθοδολογίες θα εφαρμοστούν σε ιατρικά δεδομένα
και προσομοιωμένα δεδομένα.
(EL)
The most important purpose of statistics inference is the model selection. The
same goal turns out to be from the Bayesian perspective which we will be
further analyzed in this thesis. Although, the Bayesian statistics made the
first steps in the early of 18th century, there was no succesful development
because of the calculation of the multiple integrals was inefficient, thus the
only exact calculation was regarding the univariate integrals. As year passed,
the important improvement of the technology and the use of computers made this
calculation reality, such as in handsome domains of science like physics, maths
etc. The use of MCMC made more efficient and fast calculations and the
inference turns out to be simplier, thus there was a significant increase in
the applications of Bayesian method regarding the different fields of
science.In this thesis, we will focus on Bayesian statistics for linear models
and we deal with problems where much uncertainty lies from the selection of
variables and from the unknown parameters of the model. We make a description
of Bayesian model selection and we will further discuss about the different
choices of prior distributions. The use of advanced MCMC in problems regarding
the model selection such as the estimation of aposteriori quantities of
interest is called variable selection. Furthermore, the traditional priors that
are used in the Bayesian model selection, are sensitive to larger values of the
sample and larger values of the prior variance, also these densities assign
larger weight to parameter spaces consistent with the null hypothesis, so we
make an introduction and further analysis on an alternative Bayeasian approach
based on non local priors regarding the variable selection and it is this most
striking feature of this thesis. In addition, these non local priors densities
give more mass probability to regions that are more probable under the
alternative hypothesis than the null and take more in consideration the model
uncertainty in such way that increase the shrinkage of the non important
covariates towards zero provided by the data. The most important properties of
these densities is that they introduce more sparsity models and provide more
accurate predictions. Moreover, in this thesis we analyze further apllications
of medical data and simulated in the enviroment of R and WinBUGS regarding the
Bayesian variable selection and the model averaging.
(EN)