Wahlprognosen mit Social Media Research

m-result Vortrag zu Prognoseverfahren auf der Research & Results 2018

m-result erforscht die Möglichkeiten, zukünftige Entscheidungen von Menschen auf Basis von User Generated Content vorherzusagen. Die Daten hierzu liegen meist in großer Menge in den sozialen Medien vor – aufwendige Befragungen sind also nicht notwendig. Wie werden z.B. die Kunden eines Energieunternehmens auf einen Umweltskandal reagieren, wie werden die Konsumenten eines Brotaufstrichs mit einer Änderung der Rezeptur umgehen oder wie werden sich Bürger in direkt-demokratischen Abstimmungen verhalten?

Im Oktober 2018 hat Geschäftsführer Dr. Oliver Kohl ausgewählte Studienergebnisse zu Prognoseverfahren auf Basis von User Generated Content auf der Research & Results in München vorgestellt. Das große Interesse an diesem Thema verdeutlicht die Chancen von Social Media Research.

Hintergrund zum Fallbeispiel: Die Stadt Mainz plante für 2018 den Bau des sognenannten “Bibelturms”, einen Anbau an das historische Gutenbergmuseum. Ein Projekt, das die Meinungen der Bürger spaltete. Die Politik beschloss, die Entscheidung über den geplanten Bau per Bürgerentscheid herbeizuführen.

Im Auftrag der Verlagsgruppe VRM untersuchte m-result über 6.000 Meinungen in den Sozialen Medien. Um sichere Aussagen treffen zu können, wurden sämtliche User-Kommentare zusätzlich manuell validiert.

Wahlprognosen für demokratische Abstimmungen

Die Prognose von direkt-demokratischen Abstimmungen

Für die Vorhersage des Ausgangs des Bürgerentscheids wurden drei Prognosemodelle zur Analyse des User Generated Content getestet:

Das erste Modell zu einer möglichen Wahlprognose basierte auf einer Extrapolierung von Bewertungsphrasen, so wie es m-result auch in seinem Social Media Research Tool sentiment lab einsetzt. Da hier Mehrfachzählungen (je User) möglich sind, wichen die Schätzwerte von den amtlichen Endergebnissen jedoch erwartungsgemäß stark ab.

Das zweite Modell basierte auf einer Verteilung der Pro- und Contra-Kommentare im Netz. Der starke Einfluss von Viel-Kommentierern bzw. Meinungsmachern sorgte dafür, dass die Prognosewerte noch recht deutlich vom realen Endergebnis abwichen (+/- 9,4%).

Das dritte Modell (Unique User) schließlich basierte wiederum auf Pro- und Contra-Kommentaren allerdings mit dem Unterschied, dass diesmal Mehrfachkommentare der gleichen User nicht in die Betrachtung gelangten. Das Ergebnis war erstaunlich. Obwohl die Hochrechnung nicht repräsentativ war, wichen die Ergebnisse der Wahlprognose nur um 2,8% vom amtlichen Endergebnis des Bürgerentscheids ab. Das ist Indiz dafür, dass sich die reale Welt der digitalen immer weiter annähert.

In ähnlichen, aktuell von m-result durchgeführten, Studien soll der Nachweis erbracht werden, dass solche Prognosen nicht nur zufällig gute Ergebnisse liefern sondern wiederholbar sind.

Name	Zweck	Ablauf	Typ	Anbieter
CookieConsent	Speichert Ihre Einwilligung zur Verwendung von Cookies.	1 Jahr	HTML	Website
fe_typo_user	Ordnet Ihren Browser einer Session auf dem Server zu. Dies beeinflusst nur die Inhalte, die Sie sehen und wird von uns nicht ausgewertet oder weiterverarbeitet.	Session	HTTP	Website

Name	Zweck	Ablauf	Typ	Anbieter
_gcl_au	Wird von Google AdSense zum Experimentieren mit Werbungseffizienz auf Webseiten verwendet.	3 Monate	HTML	Google
AMP_TOKEN	Enthält einen Token, der verwendet werden kann, um eine Client-ID vom AMP-Client-ID-Dienst abzurufen.	1 Jahr	HTML	Google
_dc_gtm_--property-id--	Wird von DoubleClick (Google Tag Manager) verwendet, um die Besucher nach Alter, Geschlecht oder Interessen zu identifizieren.	2 Jahre	HTML	Google
_fbp	Speichert die eindeutige Besucher-ID.	28 Tage	HTML	facebook
facebookPixel	Wenn JavaScript nicht aktiviert ist, wird durch dieses Pixel eine Verbindung zu Facebook initiiert.	keine	Pixel	facebook