Παρακάτω ακολουθεί μια σύντομη περιγραφή του προγνωστικού μοντέλου του kassiope.org.

Ακολουθώντας το διεθνές παράδειγμα το δημοσκοπικό και το προγνωστικό μοντέλο του kassiope.org είναι μια προσπάθεια για να γίνει μια αξιόπιστη καταγραφή των δημοσκοπικών ποσοστών και κατ’επέκταση της πολιτικής κατάστασης στην Ελλάδα.

  • Σε τι όμως διαφέρουν το δημοσκοπικό με το προγνωστικό μοντέλο;

  • Το δημοσκοπικό μοντέλο εμπεριέχει μόνο δημοσκοπήσεις. Χρησιμοποιούμε τα ιστορικά δεδομένα για διάφορες δημοσκοπικές εταιρείες, το μέγεθος του δείγματος κάθε δημοσκόπησης, καθώς και την ιστορική μεροληψία κάθε δημοσκόπου προκειμένου να δώσουμε διαφορετικό βάρος σε κάθε δημοσκόπηση και να κάνουμε καλύτερες προβλέψεις.

  • Το προγνωστικό μοντέλο συνδυάζει τα αποτελέσματα του δημοσκοπικού μοντέλου μαζί με ένα μοντέλο μηχανικής εκμάθησης το οποίο προσπαθεί να προβλέψει το εκλογικό αποτέλεσμα με βάση κάποιους οικονομικούς δείκτες.

Ο λόγος για τον οποίο θα πρέπει να είναι καλύτερη η πρόβλεψη των εκλογικών ποσοστών με βάση τον συνδυασμό των παραπάνω είναι ο εξής. Οι άνθρωποι που συμμετέχουν στις δημοσκοπήσεις μπορεί είτε να απαντούν σε αυτές με χαλαρότητα μιας και η επιλογή τους δεν έχει κάποιο αποτέλεσμα, είτε να αποφεύγουν ή να παραπλανούν τους δημοσκόπους συνειδητά για πολιτικούς λόγους, είτε τέλος απλά να μήν έχουν πάρει κάποια απόφαση την στιγμή της δημοσκόπησης. Όλα τα παραπάνω εισάγουν θόρυβο στις δημοσκοπικές μετρήσεις.

Ένας τρόπος για να αντιμετωπιστεί αυτός ο θόρυβος είναι να γίνει μια προσπάθεια να προβλεφθεί η συμπεριφορά των ψηφοφόρων στις κάλπες, με βάση άλλα διαθέσιμα στοιχεία για αυτούς. Για παράδειγμα αν γνωρίζαμε πόσοι Έλληνες διάλεξαν να πάνε στην εκκλησία και πόσοι σε μια διαδήλωση κατά την διάρκεια του lockdown για τον Covid-19 θα είχαμε μια ανεξάρτητη (αν και αρκετά θορυβώδη) εκτίμηση της εκλογικής επιρροής της δεξιάς και της αριστεράς στην Ελλάδα. Τέτοιου είδους δεδομένα όμως δεν είναι συνήθως διαθέσιμα, και όταν είναι διαθέσιμα αυτό δεν συμβαίνει για μεγάλους χρονικούς ορίζοντες προκειμένου να γίνει μια στατιστική ανάλυση πάνω σε αυτά.

Αντιθέτως, οικονομικοί δείκτες είναι διαθέσιμοι για μεγάλα χρονικά διαστήματα (αν και οι περισσότεροι για μικρότερα χρονικά διαστήματα απ’ότι θα περίμενε κανείς). Επίσης η κάθε κυβέρνηση έχει ευθύνη για διάφορα κοινωνικά θέματα, αλλα λίγοι θα αμφισβητούσαν πως από τα πιο σημαντικά είναι η εθνική ασφάλεια και η οικονομία. Η παρακάτω ανάλυση εμπεριέχει μια υπόθεση, πως η οικονομία είναι σημαντική σε κάθε εκλογικό αποτέλεσμα, τα στοιχεία που παραθέτουμε υποστηρίζουν ή διαφωνούν με αυτήν την υπόθεση. Συνοπτικά:

  • Οι οικονομικοί δείκτες που χρησιμοποιούμε εξηγούν μερικώς τα εκλογικά αποτελέσματα από το 1981 μέχρι το 2019.

  • Οι οικονομικοί δείκτες που χρησιμοποιούμε εξηγούν καλύτερα τα ποσοστά του κυβερνώντος κόμματος σε σχέση με αυτά της αντιπολίτευσης. Μπορούμε να προβλέψουμε τα ποσοστά του κυβερνώντος κόμματος στις επόμενες εκλογές με σφάλμα κατά μέσο όρο ±4 μονάδες, ενώ για την αντιπολίτευση το σφάλμα είναι αρκετά μεγαλύτερο στις ±5.9 μονάδες.

  • Γενικά μιλώντας αν η οικονομία παρουσιάσει προβλήματα τα ποσοστά του κυβερνώντος κόμματος πέφτουν, αλλά αυτό δεν σημαίνει πως θα ανέβουν τα ποσοστά της αντιπολίτευσης.

  • Υπάρχουν άλλοι παράγοντες που εξηγούν τις υπόλοιπες μεταβολές στα δεδομένα μας. Αυτοί μπορεί να είναι είτε άλλοι οικονομικοί παράγοντες που δεν αντικατοπτρίζονται στους υπάρχοντες, είτε άλλα κοινωνικά θέματα. Κάποια παραδείγματα θα μπορούσαν να είναι περιστατικά διαφθοράς, μια υπερβολικά συντηρητική ή μια υπερβολικά προοδευτική κοινωνική πολιτική κτλ.

Βασικοί οικονομικοί δείκτες.

Σε αυτό το σημείο θα κάνουμε μια σύντομη περιγραφή των οικονομικών δεικτών που φάνηκαν σημαντικοί στα πειράματα μας. Καταρχάς πρέπει να τονίσουμε την σημαντική έλλειψη δημόσιων δεδομένων για τα δημόσια οικονομικά της Ελλάδας. Για παράδειγμα δεδομένα για την ανεργία στην Ελλάδα πρέπει να αναζητηθούν σε διαφορετικές πέρα από τις επίσημες κρατικές, και το ίδιο συμβαίνει με τους περισσότερους άλλους δείκτες. Επίσης από το 1946 μέχρι το 1949 η Ελλάδα βρισκόταν σε εμφύλιο πόλεμο, ενώ από το 1967 μέχρι το 1974 βρισκόταν υπό στρατιωτική δικτατορία. Και στις δύο περιόδους δεν διενεργούνταν εκλογές, περιορίζοντας περαιτέρω το δείγμα μας. Κατ’επέκταση περιορίζουμε την ανάλυση μας στην περίοδο 1981-2021, για την οποία υπάρχουν οικονομικά δεδομένα και μπορεί να θεωρηθεί πως διεξάγονταν ομαλές εκλογικές διαδικασίες.

Ερευνούμε τους εξής έξη οικονομικούς δείκτες:

  • Δείκτης Ανεργίας: Το ποσοστό ανεργίας είναι ο αριθμός των ανέργων διαιρούμενος με το σύνολο του εργατικού δυναμικού, δηλαδή από όσους έχουν εργασία (απασχολούμενοι) και εκείνους που δεν απασχολούνται (άνεργοι) αλλά έχουν δηλώσει ότι επιθυμούν και είναι διαθέσιμοι να εργασθούν. Εμείς χρησιμοποιούμε την ποσοστιαία ετήσια μεταβολή αυτού του δείκτη.

  • Δείκτης Πληθωρισμού: Πληθωρισμός είναι η συνεχής αύξηση του γενικού επιπέδου τιμών μιας οικονομίας σε μια συγκεκριμένη χρονική περίοδο.

  • Ακαθάριστο Εθνικό Προϊόν: Το ΑΕΠ ορίζεται ως η συνολική αγοραία αξία όλων των τελικών προϊόντων και υπηρεσιών που παράγονται σε μια χώρα στη διάρκεια μιας ορισμένης χρονικής περιόδου. Εμείς χρησιμοποιούμε την ποσοστιαία ετήσια μεταβολή αυτού του δείκτη.

  • Δείκτης Εμπιστοσύνης Καταναλωτών: Ο δείκτης εμπιστοσύνης καταναλωτών καταγράφει την μελλοντική τάση των νοικοκυριών να καταναλώσουν ή να αποταμιεύσουν. Βασίζεται στην εκτίμηση των νοικοκυριών για το μέλλον, το υφιστάμενο οικονομικό κλίμα όπως τα νοικοκυριά το αντιλαμβάνονται, καθώς και στην εκτίμηση τους για το αν κινδυνεύουν με ανεργία και/ή αν θα μπορέσουν να αποταμιεύσουν. Εμείς χρησιμοποιούμε την ποσοστιαία ετήσια μεταβολή αυτού του δείκτη.

  • Δείκτης Εμπιστοσύνης Επιχειρήσεων: Ο δείκτης εμπιστοσύνης επιχειρήσεων παρέχει μια εκτίμηση για το μέλλον της οικονομίας. Δημιουργείται με βάση έρευνες γνώμης των επιχειρήσεων σχετικά με το μέγεθος της παραγωγής, το ύψος των παραγγελιών και την διαθεσιμότητα από έτοιμα προϊόντα στον εκάστοτε κλάδο. Εμείς χρησιμοποιούμε την ποσοστιαία ετήσια μεταβολή αυτού του δείκτη.

  • Γενικός Δείκτης του Χρηματιστηρίου Αθηνών: Ο Γενικός Δείκτης Χ.A. καταγράφει τις τάσεις των μετοχών των εταιρειών που διαπραγματεύονται στην Κατηγορία Μεγάλης Κεφαλαιοποίησης του Χρηματιστηρίου Αθηνών. Εμείς χρησιμοποιούμε την ποσοστιαία ετήσια μεταβολή αυτού του δείκτη.

Σε αυτό το σημείο πρέπει να αναφέρουμε ένα άλλο πρόβλημα για την ανάλυση μας, το πολιτικό σύστημα που προσπαθούμε να μοντελοποιήσουμε είναι πολυκομματικό. Κατ’επέκταση οι παραπάνω οικονομικοί δείκτες θα πρέπει να επιδρούν με μη γραμμικούς και περίπλοκους τρόπους στα ποσοστά των διάφορων κομμάτων. Ταυτόχρονα η επίδραση τους θα πρέπει να αλλάζει ανάλογα με το ποίο κόμμα βρίσκεται στην εξουσία. Ένα αριστερό κόμμα της αντιπολίτευσης μάλλον θα αυξήσει τα ποσοστά του, αν ένα άλλο αριστερό κόμμα βρίσκεται στην εξουσία και φθαρεί πολιτικά. Για αυτόν τον λόγο περιοριζόμαστε αρχικά στα δύο πρώτα κόμματα, για τα οποία οι οικονομικοί δείκτες θα έχουν μάλλον μια πιο ξεκάθαρη και γραμμική επίδραση.

Για αυτές τις μεταβλητές ψάχνουμε για γραμμικές σχέσεις ανάμεσα σε αυτές και την μεταβολή στα ποσοστά του κυβερνώντος κάθε φορά κόμματος. Παρακάτω βλέπουμε μια τέτοια ανάλυση για την επίδραση της ποσοστιαίας μεταβολής του Γενικού Δείκτη του Χρηματιστηρίου Αθηνών στα ποσοστά του κυβερνώντος κόμματος. Τα δεδομένα είναι κανονικοποιημένα ώστε να έχουν μηδενική μέση τιμή και τυπική απόκλιση ένα. Εμφανίζουμε τόσο τα δεδομένα όσο και μια γραμμική συνάρτηση που έχει βελτιστοποιηθεί ώστε να “ταιριάζει” πάνω στα δεδομένα.

image info

Παρατηρούμε πως όντως υπάρχει μια γραμμική σχέση ανάμεσα στις δύο ποσότητες. Συγκεκριμένα όσο αυξάνεται ο γενικός δείκτης του χρηματιστηρίου, τόσο αυξάνονται και τα ποσοστά του κυβερνώντος κόμματος στις επόμενες εκλογές. Αυτό είναι λογικό και εκφράζει το ότι η καλή πορεία της οικονομίας πιστώνεται στην εκάστοτε κυβέρνηση.

Παρολαυτά η σχέση που εντοπίζουμε είναι αρκετά θορυβώδης, όπως φαίνεται και από το γράφημα. Επαναλαμβάνουμε την παραπάνω διαδικασία για όλες τις μεταβλητές, και για το κυβερνών κόμμα και για την αξιωματική αντιπολίτευση. Παρακάτω βλέπουμε έναν πίνακα με το ποσοστό της διακύμανσης της μεταβολής των εκλογικών ποσοστών του κυβερνώντος κόμματος ανά μεταβλητή.

image info

Με αυτόν τον τρόπο βρίσκουμε τις εξής μεταβλητές οι οποίες μπορεί να είναι σημαντικές για την μοντελοποίηση μας.

  • Για το εκάστοτε κυβερνών κόμμα φαίνεται πως είναι σημαντικοί ο δείκτης εμπιστοσύνης καταναλωτών, ο δείκτης εμπιστοσύνης επιχειρήσεων, η ποσοστιαία μεταβολή του γενικού δείκτη, και η ποσοστιαία μεταβολή του ΑΕΠ.

Παρακάτω βλέπουμε έναν πίνακα με το ποσοστό της διακύμανσης της μεταβολής των εκλογικών ποσοστών της αξιωματικής αντιπολίτευσης ανά μεταβλητή.

image info

Με αυτόν τον τρόπο βρίσκουμε τις εξής μεταβλητές οι οποίες μπορεί να είναι σημαντικές για την μοντελοποίηση μας.

  • Για την εκάστοτε αξιωματική αντιπολίτευση φαίνεται πως είναι σημαντικοί είναι επίσης ο δείκτης εμπιστοσύνης καταναλωτών, ο δείκτης εμπιστοσύνης επιχειρήσεων, η ποσοστιαία μεταβολή του γενικού δείκτη, και η ποσοστιαία μεταβολή του ΑΕΠ.

Ταυτόχρονα παρατηρούμε πως οι μεταβλητές μας δεν μπορούν να εξηγήσουν το ίδιο καλά τα ποσοστά της αντιπολίτευσης σε σχέση με αυτά του κυβερνώντος κόμματος.

Παρολαυτά η γραμμικές σχέσεις που βρήκαμε παραπάνω δεν αρκούν για να επιβεβαιώσουμε την αξία των δεικτών. Υπάρχει ακόμα η πιθανότητα να έχουμε απλά απομνημονεύσει τα δεδομένα μας, ή και να έχουμε βρει μια σχέση η οποία είναι απλά αποτέλεσμα θορύβου. Η σωστή τεκμηρίωση των υποθέσεων μας μπορεί να γίνει μόνο αν χωρίσουμε τα δεδομένα μας σε ένα κομμάτι στο οποίο θα εκπαιδεύσουμε ένα μοντέλο μηχανικής εκμάθησης και σε ένα άλλο στο οποίο θα ελέγξουμε την απόδοση του μοντέλου που μάθαμε. Μιας και ο αριθμός των δεδομένων μας είναι πάρα πολύ μικρός, διαχωρίζουμε τα υπάρχοντα δεδομένα πολλές τυχαίες φορές σε ένα κομμάτι εκπαίδευσης και ένα κομμάτι ελέγχου. Αυτή η τεχνική στα πλαίσια της μηχανικής εκμάθησης ονομάζεται cross-validation.

Με βάση αυτήν την τεχνική βρίσκουμε την σωστή μεταβολή των εκλογικών ποσοστών με μια απόκλιση κατά μέσο όρο ±4 μονάδες για τα ποσοστά του κυβερνώντος κόμματος, ενώ για την αντιπολίτευση το σφάλμα είναι αρκετά μεγαλύτερο στις ±5.9 μονάδες.

Στην συνέχεια συνδυάζουμε την εκτίμηση από το μοντέλο της μηχανικής εκμάθησης με την εκτίμηση από το δημοσκοπικό μοντέλο. Οι τεχνικές που χρησιμοποιούμε για το δημοσκοπικό μοντέλο αλλά και για το μοντέλο μηχανικής εκμάθησης είναι και οι δύο βασισμένες στην Μπαγεσιανή προσέγγιση στην μηχανική εκμάθηση. Κατ’επέκταση μαζί με την πρόβλεψη μας για τα εκλογικά ποσοστά υπολογίζουμε και ένα περιθώριο σφάλματος στην εκτίμηση μας. Συνδυάζοντας το μοντέλο μηχανικής εκμάθησης με το δημοσκοπικό μοντέλο υπολογίζουμε τόσο μια καλύτερη εκτίμηση των δημοσκοπικών ποσοστών όσο και μια καλύτερη εκτίμηση του περιθωρίου σφάλματος.