Προβολή στοιχείων εγγραφής Τμήμα Επικοινωνίας, Μέσων και Πολιτισμού
Μεταπτυχιακές εργασίες
| Τίτλος: | | Ανάλυση Λόγου του twitter προφίλ @atsipras και όσων έκαναν αναφορά σε αυτόν | Τίτλος: | | Discourse analysis of twitter profile @atsipras and of those who mentioned him | Κύρια Υπευθυνότητα: | | Τσέτσος, Ιάσων-Δημήτριος Γ. | Επιβλέπων: | | Σκαρπέλος, Ιωάννης Π. | Θέματα: | | | Keywords: | | Εξόρυξη Δεδομένων, Ανάλυση Συναισθημάτων, Συσταδοποίηση Κειμένου, Σημασιολογική Ανάλυση, Θεματική Μοντελοποίηση Data Mining, Sentiment Analysis, Text Clustering, Semantic Analysis, Topic Modeling
| Ημερομηνία Έκδοσης: | | 2023
| Εκδότης: | | Πάντειο Πανεπιστήμιο Κοινωνικών και Πολιτικών Επιστημών | Περίληψη: | | Η παρούσα έρευνα, αποσκοπεί στη διερεύνηση του Λόγου που εκφράζεται στα Μέσα Κοινωνικής Δικτύωσης, μεταξύ πολιτικών και χρηστών. Ως δείγματα για την έρευνά μας, χρησιμοποιήθηκαν όλες οι δημοσιεύσεις του Αλέξη Τσίπρα στην πλατφόρμα του Twitter, από τις 13 Ιουλίου του 2011 έως τις 31 Δεκεμβρίου του 2022 και όλες οι αναφορές που έγιναν προς το λογαριασμό αυτό από τις 2 Μαΐου του 2012 έως τις 31 Δεκεμβρίου του 2022. Αφού αποκτήσαμε αυτά τα δεδομένα με τη χρήση εντολών στη γλώσσα προγραμματισμού Python, στη συνέχεια αφαιρέσαμε εκείνα τα στοιχεία που δεν μας ήταν χρήσιμα και επεξεργαστήκαμε κατάλληλα τα δεδομένα, ώστε να μπορέσουμε να τα χρησιμοποιήσουμε με το λογισμικό του Orange. Ακολούθως, εφαρμόσαμε σε αυτά, ειδικές μεθόδους Εξόρυξης Δεδομένων, όπως την Ανάλυση Συναισθημάτων, τη Συσταδοποίηση Κειμένου, τη Σημασιολογική Ανάλυση και τη Θεματική Μοντελοποίηση. Με τη χρήση αυτών των μεθόδων, ο στόχος μας ήταν να αποκτήσουμε ακριβή, μετρήσιμα στοιχεία σχετικά με το περιεχόμενο των δύο συνόλων δεδομένων που συλλέξαμε, να ανακαλύψουμε τυχόν υπάρχοντα μοτίβα και να οδηγηθούμε σε χρήσιμα συμπεράσματα. Συγκεκριμένα, με την Ανάλυση Συναισθημάτων, εντοπίσαμε εκείνα τα συναισθήματα που εκφράζει το κάθε αρχείο κειμένου, χρησιμοποιώντας το μοντέλο κατάταξης 8 συναισθημάτων που επινόησε ο Ekman. Με την εφαρμογή της Ιεραρχικής Συσταδοποίησης, δώσαμε αριθμητικά χαρακτηριστικά γνωρίσματα στα κείμενα, υπολογίσαμε τις αποστάσεις μεταξύ τους και τα χωρίσαμε σε μικρές ομοιογενείς ομάδες, τις συστάδες, έχοντας ως σκοπό τον εντοπισμό τυχόν ενδιαφερόντων ευρημάτων, όπως για παράδειγμα, πανομοιότυπων κειμένων μεταξύ των χρηστών. Χρησιμοποιώντας τεχνικές που εντάσσονται στη Σημασιολογική Ανάλυση, ανακαλύψαμε ομάδες γειτνίασης κειμένων, ανάλογα με την κατανομή τους στο δισδιάστατο χάρτη t-SNE και εξάγαμε λέξεις - κλειδιά από αυτές, έχοντας ως σκοπό να ανακαλύψουμε το κατά πόσο τείνουν να χαρακτηρίσουν τα κείμενα στα οποία ανήκουν. Τέλος, με τη Θεματική Μοντελοποίηση και τη χρήση του αλγορίθμου της Λανθάνουσας Κατανομής Dirichlet, βρήκαμε τις κρυμμένες θεματικές για τα κείμενα των δύο συνόλων δεδομένων που αποκτήσαμε, καθώς και τις λέξεις που χαρακτηρίζουν την κάθε θεματική, ώστε να κατανοήσουμε καλύτερα το περιεχόμενο των tweets του Αλέξη Τσίπρα, όσο και των χρηστών που αναφέρονται σε αυτόν. Η παρούσα Διπλωματική εργασία, εκτός του ότι αποτελεί μια μελέτη περίπτωσης στο πλαίσιο ενός μεταπτυχιακού προγράμματος σπουδών, φιλοδοξεί να εξοικειώσει το ελληνικό κοινό με απλές μεθόδους εύρεσης πληροφοριών μέσα από μεγάλο όγκο κειμενικών δεδομένων, καθώς και να αποτελέσει πηγή έμπνευσης για μελλοντικές έρευνες Ανάλυσης Δεδομένων που αφορούν δημόσια πρόσωπα στην Ελλάδα. | Abstract: | | The present study, aims to explore the Speech expressed in Social Media Networks, between politicians and citizens. As samples for our study, we used all of Alexis Tsipras’ posts on Twitter, from 13 of July 2011 until 31 December 2022 and all of the mentions to him from 2 May 2012 until 31 December 2022. After we obtained these datasets using Python language, then we removed those components which were useless and processed the data, in order to use them with Orange. Next, we applied to them, special methods of Data Mining, such as Sentiment Analysis, Text Clustering, Semantic Analysis and Topic Modeling. Using these methods, our aim was to obtain precise, countable information about the content of the two datasets we collected, to discover patterns and to be led into convenient conclusions. Specifically, with Sentiment Analysis, we detected those emotions expressed in each document, using the emotion classification model invented by Ekman. With the implementation of Text Clustering, we gave numeric characteristics to texts, we calculated the distances between them and divided them in small homogenous groups, called clusters, in order to discover interesting findings, such as, identical texts between the users. Using Semantic Analysis techniques, we discovered neighboring groups of texts, based on their distribution on the 2D t-SNE map and we extracted their keywords, in order to examine how much they tend to characterize the texts they belong to. Finally, with Topic Modelling and the use of Latent Dirichlet Allocation algorithm, we found the latent topics of the two datasets which we obtained, as well as the words that tend to characterize each 10 topic, in order to understand better the content of Alexis Tsipras’ tweets and the user’s mentions referred to him. The current Thesis, despite the fact that it is a study created in the context of a postgraduate programme of studies, aspires to familiarize the greek public with simple methods of information retrieval from big text data, as well as to become a source of inspiration for future Data Analysis surveys about public figures in Greece. | Περιγραφή: | | Διπλωματική εργασία - Πάντειο Πανεπιστήμιο. Τμήμα Επικοινωνίας, Μέσων και Πολιτισμού, ΠΜΣ, κατεύθυνση Κοινωνία της Πληροφορίας, Μέσα και Τεχνολογία, 2023 | Περιγραφή: | | Βιβλιογραφία: σ. 66-77 | | | |