Library SitePandemos Repository
Pandemos Record
 

Προβολή στοιχείων εγγραφής

Τμήμα Οικονομικής και Περιφερειακής Ανάπτυξης  

Μεταπτυχιακές εργασίες  

 
Τίτλος:Μοντελοποίηση παλινδρόμησης μιας ταξινομημένης εξαρτημένης μεταβλητής
Τίτλος:Regression modelling of an ordinal dependent variable
Κύρια Υπευθυνότητα:Αντασκαλίτσας, Μπογδάν Β.
Επιβλέπων:Richardson, Clive
Θέματα:
Keywords:Μοντελοποίηση παλινδρόμηση ταξινομημένη εξαρτημένη μεταβλητή στατιστικη κατηγορικά δεδομένα
Regression modelling of an ordinal dependent variable statistics categorical data
Ημερομηνία Έκδοσης:2020
Εκδότης:Πάντειο Πανεπιστήμιο Κοινωνικών και Πολιτικών Επιστημών
Περίληψη:Εφαρμογή και σύγκριση διωνυμικής, ταξινομημένης, continuation-ratio, adjacent-categories και πολυωνυμικής λογαριθμικής παλινδρόμησης στα δεδομένα από μεγάλο πολυεθνικό δειγματοληπτικό ερωτηματολόγιο για παιδιά. H λογιστική παλινδρόμηση χρησιμοποιείται για την ανάλυση της σχέσης μιας διωνυμικής εξαρτώμενης μεταβλητής με ορισμένες επεξηγηματικές μεταβλητές. Όταν η εξαρτημένη μεταβλητή έχει τρεις ή περισσότερες κατηγορίες, υπάρχουν διαφορετικές μέθοδοι ανάλυσης και μοντέλα, όπως ταξινομημένη, continuation-ratio, adjacent-categories και πολυωνυμικής λογαριθμικής παλινδρόμησης. Ο σκοπός αυτής της εργασίας είναι να τις παρουσιάσει και να τις συγκρίνει σε ένα σύνολο δεδομένων από δειγματοληπτικές έρευνες. Η ανάλυση έγινε με R στο RStudio. Ξεκινάμε εξετάζοντας τη βιβλιογραφία για τα logit μοντέλα μας και μετά εξετάζουμε και συγκρίνουμε τα αποτελέσματα. Αποτελέσματα: Αρχικά παρατηρούμε ότι η τέταρτη και σπανιότερη κατηγορία στο δείγμα μας μπορεί να συγχωνευθεί με την τρίτη για να παράγει λιγότερες ακραίες τιμές. Ορισμένες ανεξάρτητες μεταβλητές όπως, οι χώρες της Γερμανίας και της Ισλανδίας, καθώς και οι ηλικίες, το φύλο και οι μεταβλητές επιπέδου εκπαίδευσης των γονέων ήταν στατιστικά ασήμαντες σε ορισμένες περιπτώσεις. Η καλύτερη ικανότητα πρόβλεψης εμφανίζεται από το μοντέλο continuation-ratio, το καλύτερο μοντέλο AIC είναι το Multinomial, με ακόλουθο το continuation-ratio και το καλύτερο μοντέλο log-likelihood είναι το continuation-ratio.
Abstract:Logistic regression is the basic method used to analyze the relationship of a binomial dependent variable to some explanatory variables. When the dependent variable has three or more categories, there are different analysis methods and models, including ordered logistic, continuation ratio, adjacent categories and multinomial logistic regression. The purpose of the present thesis is to review and present these models, and compare the results obtained by applying them to a dataset drawn from a large multinational sample survey among schoolchildren. The analysis was done in R Studio. The dependent variable had four categories originally. First we notice that the fourth and rarest category in our sample can be merged with the third to produce fewer outliers. Some of the independent variables such as, the countries Germany and Iceland, as well as age, gender and parent's education variables were statistically insignificant in some cases. The best predictive capability was displayed by the continuation ratio model, the best AIC model was the Multinomial, with a close second the Continuation Ratio and the best loglikelihood model was the Continuation Ratio.
Περιγραφή:Διπλωματική εργασία - Πάντειο Πανεπιστήμιο. Τμήμα Οικονομικής και Περιφερειακής Ανάπτυξης, ΠΜΣ, κατεύθυνση Εφηρμοσμένων Οικονομικών και Διοίκησης, 2020
Περιγραφή:Βιβλιογραφία: σ. 31
 
 
Αρχεία σε Αυτό το Τεκμήριο:
Αρχείο Τύπος
8PMS_AntaskalitsasBo_0819M001.pdf application/pdf
 
FedoraCommons OAI Βιβλιοθήκη - Υπηρεσία Πληροφόρησης, Πάντειον Πανεπιστήμιο