Μοντελοποίηση παλινδρόμησης μιας ταξινομημένης εξαρτημένης μεταβλητής

Αντασκαλίτσας, Μπογδάν Β.

2020

Εφαρμογή και σύγκριση διωνυμικής, ταξινομημένης, continuation-ratio, adjacent-categories και πολυωνυμικής λογαριθμικής παλινδρόμησης στα δεδομένα από μεγάλο πολυεθνικό δειγματοληπτικό ερωτηματολόγιο για παιδιά. H λογιστική παλινδρόμηση χρησιμοποιείται για την ανάλυση της σχέσης μιας διωνυμικής εξαρτώμενης μεταβλητής με ορισμένες επεξηγηματικές μεταβλητές. Όταν η εξαρτημένη μεταβλητή έχει τρεις ή περισσότερες κατηγορίες, υπάρχουν διαφορετικές μέθοδοι ανάλυσης και μοντέλα, όπως ταξινομημένη, continuation-ratio, adjacent-categories και πολυωνυμικής λογαριθμικής παλινδρόμησης. Ο σκοπός αυτής της εργασίας είναι να τις παρουσιάσει και να τις συγκρίνει σε ένα σύνολο δεδομένων από δειγματοληπτικές έρευνες. Η ανάλυση έγινε με R στο RStudio. Ξεκινάμε εξετάζοντας τη βιβλιογραφία για τα logit μοντέλα μας και μετά εξετάζουμε και συγκρίνουμε τα αποτελέσματα. Αποτελέσματα: Αρχικά παρατηρούμε ότι η τέταρτη και σπανιότερη κατηγορία στο δείγμα μας μπορεί να συγχωνευθεί με την τρίτη για να παράγει λιγότερες ακραίες τιμές. Ορισμένες ανεξάρτητες μεταβλητές όπως, οι χώρες της Γερμανίας και της Ισλανδίας, καθώς και οι ηλικίες, το φύλο και οι μεταβλητές επιπέδου εκπαίδευσης των γονέων ήταν στατιστικά ασήμαντες σε ορισμένες περιπτώσεις. Η καλύτερη ικανότητα πρόβλεψης εμφανίζεται από το μοντέλο continuation-ratio, το καλύτερο μοντέλο AIC είναι το Multinomial, με ακόλουθο το continuation-ratio και το καλύτερο μοντέλο log-likelihood είναι το continuation-ratio.

Download PDF

View in repository

Browse all collections