Wahlprognosen mit Social Media Research

m-result Vortrag zu Prognoseverfahren auf der Research & Results 2018

m-result erforscht die Möglichkeiten, zukünftige Entscheidungen von Menschen auf Basis von User Generated Content vorherzusagen. Die Daten hierzu liegen meist in großer Menge in den sozialen Medien vor – aufwendige Befragungen sind also nicht notwendig. Wie werden z.B. die Kunden eines Energieunternehmens auf einen Umweltskandal reagieren, wie werden die Konsumenten eines Brotaufstrichs mit einer Änderung der Rezeptur umgehen oder wie werden sich Bürger in direkt-demokratischen Abstimmungen verhalten? 

Im Oktober 2018 hat Geschäftsführer Dr. Oliver Kohl ausgewählte Studienergebnisse zu Prognoseverfahren auf Basis von User Generated Content auf der Research & Results in München vorgestellt. Das große Interesse an diesem Thema verdeutlicht die Chancen von Social Media Research.  

Hintergrund zum Fallbeispiel: Die Stadt Mainz plante für 2018 den Bau des sognenannten “Bibelturms”, einen Anbau an das historische Gutenbergmuseum. Ein Projekt, das die Meinungen der Bürger spaltete. Die Politik beschloss, die Entscheidung über den geplanten Bau per Bürgerentscheid herbeizuführen. 

Im Auftrag der Verlagsgruppe VRM untersuchte m-result über 6.000 Meinungen in den Sozialen Medien. Um sichere Aussagen treffen zu können, wurden sämtliche User-Kommentare zusätzlich manuell validiert.

Die Prognose von direkt-demokratischen Abstimmungen

Für die Vorhersage des Ausgangs des Bürgerentscheids wurden drei Prognosemodelle zur Analyse des User Generated Content getestet:

Das erste Modell zu einer möglichen Wahlprognose basierte auf einer Extrapolierung von Bewertungsphrasen, so wie es m-result auch in seinem Social Media Research Tool sentiment lab einsetzt. Da hier Mehrfachzählungen (je User) möglich sind, wichen die Schätzwerte von den amtlichen Endergebnissen jedoch erwartungsgemäß stark ab. 

Das zweite Modell basierte auf einer Verteilung der Pro- und Contra-Kommentare im Netz. Der starke Einfluss von Viel-Kommentierern bzw. Meinungsmachern sorgte dafür, dass die Prognosewerte noch recht deutlich vom realen Endergebnis abwichen (+/- 9,4%). 

Das dritte Modell (Unique User) schließlich basierte wiederum auf Pro- und Contra-Kommentaren allerdings mit dem Unterschied, dass diesmal Mehrfachkommentare der gleichen User nicht in die Betrachtung gelangten. Das Ergebnis war erstaunlich. Obwohl die Hochrechnung nicht repräsentativ war, wichen die Ergebnisse der Wahlprognose nur um 2,8% vom amtlichen Endergebnis des Bürgerentscheids ab. Das ist Indiz dafür, dass sich die reale Welt der digitalen immer weiter annähert. 

In ähnlichen, aktuell von m-result durchgeführten, Studien soll der Nachweis erbracht werden, dass solche Prognosen nicht nur zufällig gute Ergebnisse liefern sondern wiederholbar sind.