Big Data smart nutzen: Relevante Social Media Daten erzeugen

Big Data als Basis für Stichproben

Big Data Phänomenen, die m-result im Internet untersucht, liegen tausende, hunderttausende oder Millionen von Datensätzen zugrunde. Sie dienen – in der Sprache der Marktforschung – als “Grundgesamtheit”, wobei niemand exakt wissen kann, wie groß diese Grundgesamtheiten in einem bestimmten Zeitpunkt wirklich sind.

Ähnlich wie in der Marktforschung so ist auch bei Social Media Analysen der Aufwand einer Vollerhebung im Regelfall zu groß. Im Internet wäre allein der Aufwand für eine vollständige Datenbeschaffung zu groß. Einer der theoretischen Grundpfeiler von sentiment lab, um zu bestmöglichen Insights zu gelangen, ist deshalb eine freiwillige Selbstbeschränkung auf relevante Daten und die Analyse auf Basis von Stichproben. Anders gesagt: die Reduzierung von Big Data auf für die jeweilige Fragestellung relevanten Daten.

Beschränkung auf relevante Quellen

Saubere Daten für Zwecke von Social Media Analysen beziehen sich ausschließlich auf User Generated Content, sind frei von Double Content, Homonymen und sind relevant im Sinne des Untersuchungsobjekts. Ist also z.B. die Domain “Energie” von Interesse, so dürfen nur solche Quellen (Blogs, Foren, Plattformen) in die Betrachtung gelangen, die inhaltlich auch Energiethemen nahe stehen. Bewertungsplattformen, auf denen Kunden ihre Meinung über Energieunternehmen schreiben können sind in diesem Sinne relevant, Automobilforen dagegen nicht.

Beschränkung auf relevanten Content

Nachdem die richtigen Quellen ausgewählt wurden, gilt es die für die Bewertung relevanten Kommentare zu identifizieren. Dies gelingt in sentiment lab mit dynamischen Suchwortdatenbanken. Diese Dictionaries enthalten zehntausende Suchbegriffe, die hierarchisch aufgebaut sind, so dass Social Media Analysen für die Anwender auf unterschiedlichen Aggregationsstufen möglich werden. Die Suchbegriffe werden kontinuierlich an die aktuelle Themenlage angepasst, so dass auch brandneue Trends systematisch mit in die Betrachtung gelangen. 

Beschränkung auf Bewertungsphrasen

“Erfolgreiche” Phrasen (Kommentare) enthalten bei sentiment lab einen Bezug zu Marke / Produkt, einem Thema und einer Bewertung. Nur solche Bewertungsphrasen werden strukturiert im Tool abgelegt und sind in online Dashboards einsehbar. So entsteht ein umfassender Wissenspool über die Meinungen der Menschen über eine gesamte Branche. 

Big Data smart auswerten

Wir sind uns sicher, in unseren Fokusbranchen die saubersten und sichersten Daten unter sämtlichen Research, Monitoring und Listening Tools zu haben.