Big Data smart nutzen: Relevante Social Media Daten erzeugen

Big Data als Basis für Stichproben

Big Data Phänomenen, die m-result im Internet untersucht, liegen tausende, hunderttausende oder Millionen von Datensätzen zugrunde. Sie dienen – in der Sprache der Marktforschung – als “Grundgesamtheit”, wobei niemand exakt wissen kann, wie groß diese Grundgesamtheiten in einem bestimmten Zeitpunkt wirklich sind.

Ähnlich wie in der Marktforschung so ist auch bei Social Media Analysen der Aufwand einer Vollerhebung im Regelfall zu groß. Im Internet wäre allein der Aufwand für eine vollständige Datenbeschaffung zu groß. Einer der theoretischen Grundpfeiler von sentiment lab, um zu bestmöglichen Insights zu gelangen, ist deshalb eine freiwillige Selbstbeschränkung auf relevante Daten und die Analyse auf Basis von Stichproben. Anders gesagt: die Reduzierung von Big Data auf für die jeweilige Fragestellung relevanten Daten.

Beschränkung auf relevante Quellen

Saubere Daten für Zwecke von Social Media Analysen beziehen sich ausschließlich auf User Generated Content, sind frei von Double Content, Homonymen und sind relevant im Sinne des Untersuchungsobjekts. Ist also z.B. die Domain “Energie” von Interesse, so dürfen nur solche Quellen (Blogs, Foren, Plattformen) in die Betrachtung gelangen, die inhaltlich auch Energiethemen nahe stehen. Bewertungsplattformen, auf denen Kunden ihre Meinung über Energieunternehmen schreiben können sind in diesem Sinne relevant, Automobilforen dagegen nicht.

Beschränkung auf relevanten Content

Nachdem die richtigen Quellen ausgewählt wurden, gilt es die für die Bewertung relevanten Kommentare zu identifizieren. Dies gelingt in sentiment lab mit dynamischen Suchwortdatenbanken. Diese Dictionaries enthalten zehntausende Suchbegriffe, die hierarchisch aufgebaut sind, so dass Social Media Analysen für die Anwender auf unterschiedlichen Aggregationsstufen möglich werden. Die Suchbegriffe werden kontinuierlich an die aktuelle Themenlage angepasst, so dass auch brandneue Trends systematisch mit in die Betrachtung gelangen.

Beschränkung auf Bewertungsphrasen

“Erfolgreiche” Phrasen (Kommentare) enthalten bei sentiment lab einen Bezug zu Marke / Produkt, einem Thema und einer Bewertung. Nur solche Bewertungsphrasen werden strukturiert im Tool abgelegt und sind in online Dashboards einsehbar. So entsteht ein umfassender Wissenspool über die Meinungen der Menschen über eine gesamte Branche.

Big Data smart auswerten

Wir sind uns sicher, in unseren Fokusbranchen die saubersten und sichersten Daten unter sämtlichen Research, Monitoring und Listening Tools zu haben.

Name	Zweck	Ablauf	Typ	Anbieter
CookieConsent	Speichert Ihre Einwilligung zur Verwendung von Cookies.	1 Jahr	HTML	Website
fe_typo_user	Ordnet Ihren Browser einer Session auf dem Server zu. Dies beeinflusst nur die Inhalte, die Sie sehen und wird von uns nicht ausgewertet oder weiterverarbeitet.	Session	HTTP	Website

Name	Zweck	Ablauf	Typ	Anbieter
_gcl_au	Wird von Google AdSense zum Experimentieren mit Werbungseffizienz auf Webseiten verwendet.	3 Monate	HTML	Google
AMP_TOKEN	Enthält einen Token, der verwendet werden kann, um eine Client-ID vom AMP-Client-ID-Dienst abzurufen.	1 Jahr	HTML	Google
_dc_gtm_--property-id--	Wird von DoubleClick (Google Tag Manager) verwendet, um die Besucher nach Alter, Geschlecht oder Interessen zu identifizieren.	2 Jahre	HTML	Google
_fbp	Speichert die eindeutige Besucher-ID.	28 Tage	HTML	facebook
facebookPixel	Wenn JavaScript nicht aktiviert ist, wird durch dieses Pixel eine Verbindung zu Facebook initiiert.	keine	Pixel	facebook