Ανασκόπηση και συγκριτική αξιολόγηση στατιστικών μεθόδων ανάλυσης πληθυσμιακών ερευνών με διαφορετικό δειγματοληπτικό κλάσμα ανά στρώμα παρουσία μη ανταπόκρισης

This item is provided by the institution :

Repository :
Pergamos Digital Library
see the original item page
in the repository's web site and access all digital files if the item*

2015 (EN)

Ανασκόπηση και συγκριτική αξιολόγηση στατιστικών μεθόδων ανάλυσης πληθυσμιακών ερευνών με διαφορετικό δειγματοληπτικό κλάσμα ανά στρώμα παρουσία μη ανταπόκρισης

Μαργετάκη Αικατερίνη (EL)

Όταν ο δειγματοληπτικός σχεδιασμός είναι σύνθετος η ανάλυση των δεδομένων πρέπει να γίνεται με ειδικές τεχνικές οι οποίες συμπεριλαμβάνουν τόσο τα δειγματοληπτικά βάρη όσο και τα στάδια της δειγματοληψίας. Παρουσία μη ανταπόκρισης ατόμου τα βάρη πρέπει να τροποποιούνται καταλλήλως ούτως ώστε το σταθμισμένο δείγμα να είναι αντιπροσωπευτικό του πληθυσμού. Για να γίνει τέτοιου είδους διόρθωση ο ερευνητής πρέπει να συλλέξει δεδομένα για τα άτομα που δεν ανταποκρίθηκαν. Με βάση τα διαθέσιμα δεδομένα δημιουργούνται κατηγορίες μέσα στις οποίες υπολογίζονται τα ποσοστά ανταπόκρισης. Με πολλαπλασιασμό των δειγματοληπτικών βαρών με το αντίστροφο του ποσοστού ανταπόκρισης επιτυγχάνεται η διόρθωση. Επειδή τα δεδομένα αυτά συνήθως είναι περιορισμένα, η διόρθωση μπορεί να γίνει με χρήση δεδομένων για τον πληθυσμό αναφοράς. Έτσι προσαρμόζεται η σταθμισμένη κατανομή του δείγματος με τρόπο τέτοιο ώστε να συμφωνεί με γνωστές τιμές για τον πληθυσμό. Ακόμα και μετά από τις διορθώσεις για μη ανταπόκριση ατόμου, παραμένει το πρόβλημα της μη ανταπόκρισης ερώτησης (ελλείπουσες τιμές). Εφαρμόστηκαν δύο κατηγορίες μεθόδων για την αντιμετώπιση του προβλήματος, πολλαπλές αντικαταστάσεις και στάθμιση με αντίστροφη πιθανότητα. Για τις πολλαπλές αντικαταστάσεις μας ενδιέφερε να συμπεριλάβουμε τον δειγματοληπτικό σχεδιασμό. Αυτό έγινε με δύο τρόπους: με στάθμιση του μοντέλου αντικατάστασης και με χρήση των βαρών ως γραμμικό όρο σε αυτό. Η μέθοδος στάθμισης με αντίστροφη πιθανότητα και η διπλά ανθεκτική εκτιμήτρια που χρησιμοποιήθηκαν, αν και εύκολα υλοποιήσιμες, δεν έδωσαν ακριβή αποτελέσματα, εφόσον τα διαστήματα εμπιστοσύνης υπολογίστηκαν με επαναληπτικές διαδικασίες. Προτείνεται λοιπόν να γίνεται χρήση πολλαπλών αντικαταστάσεων με τα βάρη ως γραμμικό όρο, καθώς η μέθοδος αυτή δίνει ακριβή αποτελέσματα και είναι εύκολα εφαρμόσιμη, αφού τα στατιστικά πακέτα διαθέτουν έτοιμες ρουτίνες. (EL)
When the sample design of a survey is complex, design-based analysis should be performed. This kind of analysis takes into account the stages of the complex design and the survey weights. In order to deal with unit nonresponse, the survey weights are properly adjusted so that the respondent weighted sample is representative of the population. To perform such a correction the researcher must collect data for non responders. Then, using the available information, weighting classes are created. Within these classes response probabilities are considered constant. The corresponding adjusted weight is the product of the inverse of the estimated response probability and the survey weight. Subsequent adjustments can be performed in order to conform the respondent sample distribution to distributions from an external source, such as population census. The second type of non response we dealt with, is item non response. Two broad categories of methods are usually employed to address this issue. Inverse probability weighting and multiple imputation. Standard multiple imputation methods can be modified to incorporate design features. We used the fully adjusted weights to incorporate design features into the imputation model first by weighting the imputation model, and second by including them as a predictor in the imputation model. Alternative approaches that we did not implement are stratified imputations and multilevel imputation models. Inverse probability weighting method and doubly robust estimator are easily implemented using statistical software, and yielded similar estimates as multiple imputation. The main drawback, is that variance estimates and confidence intervals were computed using bootstrap methods, thus they were not as precise as the ones obtained using multiple imputation. Moreover, the structure of the missing data in a survey setting, do not allow the use of these methods. To conclude, when handling item non response in a survey setting, a good practice is to perform multiple imputation using the fully adjusted weights as a covariate. This practice is both theoretically sound and easily implemented using statistical software such as Stata. (EN)

Διπλωματική Εργασία (EL)
Postgraduate Thesis (EN)



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)