Sentimentanalyse: Wie steht es um die Laune Eurer Kunden?
Mit Showcase
Viele von uns kennen die Situation: Wir wollen eine Kaffeemaschine oder gar ein Auto kaufen, aber sind uns noch nicht ganz sicher. In solchen Momenten wenden wir uns häufig an die Sozialen Medien – und suchen dort nach Bewertungen, Rezensionen oder Vergleichen mit ähnlichen Produkten anderer Marken. Dabei hoffen wir, dass uns die Erfahrungen anderer Leute bei unserer Kaufentscheidung hilft.
Für Einzelpersonen ist dieser Prozess nicht besonders aufwendig. Schließlich machen wir das auch nicht allzu oft. Unternehmen dagegen sollten die Diskussionen über ihre Produkte und Dienstleistungen in den Sozialen Medien umfassend verfolgen. Denn deren Macht und der Einfluss der Communities ist für den Erfolg eines Produkts oder der gesamten Marke nicht unterschätzen.
Darüber hinaus kann es wettbewerbsentscheidend zu sein, die Auswirkungen von Markenaktivitäten zu beobachten – und sowohl die Erfahrungen als auch die Emotionen von Menschen in Bezug auf die Marke und ihre Angebote zu verstehen.
In den letzten Jahren haben die Fortschritte im Bereich der Künstlichen Intelligenz verschiedene Methoden hervorgebracht, die solche Untersuchungen massiv erleichtern. Eines dieser Instrumente ist die Sentimentanalyse.
Was ist Sentimentanalyse (Sentiment Analysis)?
Die Sentimentanalyse – auch bekannt als Sentiment Analysis oder Opinion Mining – ist eine Technik zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP). Sie zielt darauf ab, die Emotionen hinter einem Text zu ermitteln. Dabei nutzt sie Methoden wie Data Mining, maschinelles Lernen und Computerlinguistik, um subjektive Informationen zu identifizieren, zu extrahieren – und zu untersuchen, ob sie beispielsweise positive, neutrale oder negative Stimmungen widerspiegeln.
Dieses Analyseverfahren wird häufig eingesetzt, um Erkenntnisse aus großen Mengen unstrukturierter Daten zu gewinnen, z. B. aus Kundenrezensionen, Beiträgen in sozialen Medien oder Umfrageantworten.
In Bereichen wie Marketing, Kundenbeziehungsmanagement aber auch der Politik wird sie eingesetzt, um ein tieferes Verständnis für die Einstellungen der Menschen etwa zu einem Produkt, zu einer Dienstleistung, zu einer Marke oder zu bestimmten politischen Themen in Echtzeit zu gewinnen.
Aktuell wird erwartet, dass sich die Anwendungsmöglichkeiten der Sentimentanalyse noch weiter entwickeln werden – um künftig noch präzisere und aussagekräftigere Einblicke in das menschliche Verhalten und die Einstellungen der Konsument:innen zu bieten.
Showcase: Sentimentanalyse zu einem aktuellen Elektrofahrzeug
Wie die Sentimentanalyse funktioniert und welche Erkenntnisse sie liefert, möchten wir Euch hier anhand eines Beispielprojekts zeigen. Als Produkt haben wir ein aktuelles Elektromodell einer großen Automobilmarke gewählt. Als exemplarische Kanäle zur Analyse der Kommentare zu diesem Modell entschieden wir uns für zwei der beliebtesten Plattformen für Produktdiskussionen: Reddit und YouTube.
Für die Durchführung des Projekts verwendeten wir Python und dessen gängige Bibliotheken zur Sentimentanalyse wie z. B. NLTK (Natural Language Toolkit) und Transformers.
Schritt 1: Datenextraktion
Zur Extraktion der relevanten Daten nutzten wir PRAW für Reddit und – für YouTube – den Google API Client (besonders die „Build“-Methode), um dort Kommentare unter den entsprechenden Videos zu sammeln.
Bei der Extraktion von Kommentaren aus öffentlichen Social Media sind jedoch einige Aspekte zum Datenschutz sowie zu rechtlichen und ethischen Fragen zu berücksichtigen. Dazu gehören die Einhaltung der Nutzungsbedingungen der jeweiligen Plattform, von Datenschutzgesetzen wie der DSGVO sowie Maßnahmen zum Schutz der Privatsphäre der User – z. B. die Anonymisierung sensibler Daten.
Grundsätzlich gilt dabei: Der Schlüssel zur Wahrung ethischer Standards sind Transparenz und ein verantwortungsvoller Umgang mit den aus solchen Daten gewonnenen Erkenntnissen.
Um die rechtliche und technische Zuverlässigkeit zu gewährleisten, ist es generell ratsam, offizielle APIs zu nutzen. Zugleich müssen Herausforderungen wie etwa Aufruf-Limits, Datenvolumen und das Herausfiltern von Spam gemeistert werden. Darüber hinaus ist es wichtig, mögliche Verzerrungseffekte wie etwa plattformspezifische demografische Daten oder Sarkasmus zu berücksichtigen.
Weitere Einschränkungen ergeben sich insbesondere bei kostenlosen API-Zugängen – z. B. hinsichtlich des verfügbaren Datenvolumens. Denn um zu soliden Schlussfolgerungen zu gelangen, wären größere Datensätze mit Tausenden von Kommentaren nötig. Für umfassendere Analysen empfiehlt es sich daher, in höhere API-Zugangs-Levels zu investieren.
Schritt 2: Datenbereinigung
In dieser Phase liegt der Schwerpunkt auf der Bereinigung und der Vorverarbeitung der Kommentare, um sie für die Analyse vorzubereiten. Dazu gehört das Entfernen von Satzzeichen, die Umwandlung von Text in Kleinbuchstaben, die Übersetzung von nicht-englischen Kommentaren und der Umgang mit Negationen (z. B. das Ersetzen von „nicht gut“ durch „NEG_good“).
Um die Genauigkeit der Sentimentanalyse zu verbessern, werden zudem positive Phrasen markiert und „Stop Words“ entfernt (also häufig vorkommende Begriffe ohne relevante Bedeutung wie z. B. „der“, „die“, „das“, „man“ etc.).
Schritt 3: Sentimentanalyse
Für diesen Schritt setzten wir ein vortrainiertes mehrsprachiges BERT-Modell aus nlptown/bert-base-multilingual-uncased-sentiment ein (BERT = Bidirectional Encoder Representations from Transformers). Auf dieser Basis lässt sich die Stimmung der Kommentare in fünf Kategorien klassifizieren: Sehr Negativ, Negativ, Neutral, Positiv und Sehr Positiv.
Das Modell wurde nicht zuletzt aufgrund seiner Fähigkeit ausgewählt, mehrsprachige Daten zu verarbeiten. Außerdem eignet es sich gut für kurze Texte. Das macht es ideal für Inhalte in den Sozialen Medien.
Schritt 4: Analyse der Ergebnisse
Im ersten Teil der Analyse können wir nun zeigen, wie sich die Kommentare je nach Plattform auf die verschiedenen Stimmungskategorien verteilen:
Wie wir sehen, war die häufigste Kategorie bei YouTube-Kommentaren „Positiv“, bei Reddit war es dagegen „Sehr positiv“.
Interessant ist hier, dass die zweithäufigste Kategorie bei YouTube „Sehr negativ“ ist. Bei Reddit dagegen erscheint „Sehr negativ“ nach „Sehr positiv“ und „Positiv“ mit deutlichem Abstand an dritter Stelle. Dies deutet auf gewisse Unterschiede in den Nutzerreaktionen auf den beiden Plattformen hin.
Eine mögliche Erklärung: Das YouTube-Publikum könnte aufgrund der unmittelbaren emotionalen Reaktionen, die Videoinhalte hervorrufen, stärker polarisierte Meinungen äußern – insbesondere, wenn das Video Mängel oder Kritik hinsichtlich des Fahrzeugmodells hervorhebt.
Im Gegensatz dazu führen die User auf Reddit ausführliche Diskussionen. Da sie dabei persönliche Erfahrungen und reflektierte Kommentare austauschen, führt dies möglicherweise zu grundlegend positiveren Stimmungen.
Diese plattformspezifische Dynamiken deuten auf unterschiedliche Verbrauchererwartungen und Interaktionsstile hin. YouTube-Kommentare spiegeln dabei schnellere, emotionalere Reaktionen wider, während Reddit-Diskussionen eher unterstützendes und detailliertes Feedback fördern.
Das Verständnis dieser unterschiedlichen Stimmungslagen kann Unternehmen wertvolle Insights bieten. So können sie mögliche Kritikpunkte auf YouTube gezielt entschärfen (oder diesen künftig vorbeugen), während sie vom positiven Engagement auf Reddit profitieren.
Exemplarischer Charakter des Projekts
Wichtig ist jedoch zu beachten, dass die Stichprobengröße in diesem Projekt mit nur einigen hundert Kommentaren relativ klein ist. Unsere Beobachtungen lassen sich also nicht unbedingt verallgemeinern. Um etwa mit Sicherheit behaupten zu können, dass die Rezeption auf YouTube stärker polarisiert, bräuchte man eine viel größere Datenbasis – möglicherweise einige Tausend Kommentare. Außerdem müsste man Variablen wie das Thema des Videos, die demografische Zusammensetzung des Publikums und andere Faktoren berücksichtigen.
Diese Analyse bietet zwar erste Einblicke, sollte aber eher als Proof of Concept (PoC) und nicht als endgültige Schlussfolgerung betrachtet werden. Um eine verallgemeinerbare Studie durchzuführen, sind weitere Untersuchungen mit größeren Datensätzen und einer umfassenderen Normalisierung der Variablen erforderlich.
Nichtsdestotrotz lässt sich die Methodik der Sentimentanalyse anhand dieses Projekts beispielhaft demonstrieren. Betrachten wir nun also genauer, welche Begriffe in den jeweiligen Stimmungskategorien am häufigsten verwendet werden – und welche Erkenntnisse wir daraus ziehen können.
Analyse der YouTube-Kommentare
Wir beschränken uns hier auf die Analyse der Stimmungskategorien auf den Plätze eins und zwei. Aus Gründen der Neutralität haben wir Markennamen, Namen von Fahrzeugmodellen und andere Begriffe, die auf die Marke schließen lassen, anonymisiert.
Zum Verständnis: Die Schlussfolgerungen ergeben sich dabei nicht aus den Top-Ten-Begriffen allein, sondern aus ihrer Bedeutung im jeweiligen Kategoriezusammenhang (z. B. „Sehr positiv“ „Positiv“ etc.) und durch begriffliche Kontexte (z. B. „great“ und „performance“, „great“ und „features“ etc.).
Die Analyse der am häufigsten verwendeten Begriffe in der Kategorie „Positiv“ (bei YouTube an erster Stelle), erlaubt uns beispielsweise folgende Aussagen.
Markenwahrnehmung
Die Prominenz des Markennamens und der Modellnamen dieser Marke zeigt eine starke Markentreue und die Bekanntheit bei den Usern, die über dieses spezielle Modell diskutieren.
Positive Stimmung
Begriffe wie „great“ oder „good“ vermitteln Zustimmung und Zufriedenheit mit der Performance und den Features des Fahrzeugs.
Äußerung von Vorlieben („like“)
Das Wort „like“ signalisiert oft eine positive Wahrnehmung, eine persönliche Vorliebe oder die Begeisterung für das Fahrzeug und seine Eigenschaften. Es spiegelt emotionales Engagement wider und zeigt die Zustimmung zum Inhalt des Videos oder die Wertschätzung für bestimmte Aspekte des Modells.
Beschäftigung mit dem Inhalt
Die häufige Erwähnung von „review“ zeigt, dass die User die in den Beiträgen vermittelten Erkenntnisse zu schätzen wissen. Dies trägt zu einer positiven Einstellung bei.
Fahrzeugbegeisterung
Begriffe wie „car“, „cars“ und „nice“ spiegeln eine allgemeine Leidenschaft für Automobile wider. Dies deutet darauf hin, dass Auto-Fans eher positive Meinungen äußern.
Potenzielles Interesse
Die Verwendung von „would“ impliziert Überlegungen oder Wünsche, die auf ein mögliches Kaufinteresse oder eine Empfehlungsbereitschaft hinweisen können.
Insgesamt signalisieren diese Begriffe eine große Zufriedenheit der User und eine Begeisterung für das Fahrzeugmodell. Sie unterstreichen also die positive Rezeption sowohl des Autos als auch des Beitragsinhalts.
Sehen wir uns nun die häufigsten Begriffe der Stimmungskategorie „Sehr negativ“ an (bei YouTube an zweiter Stelle):
Markenwahrnehmung
Die Erwähnung des Markennamens deutet in diesem Kontext darauf hin, dass die User die Marke gezielt kritisieren. Dies könnte auf Unzufriedenheit mit ihren Produkten oder Praktiken hindeuten.
Spezifische Themen
Begriffe wie „interior“, „black“, „battery“ oder „charging“ deuten auf Beschwerden über Design, Funktionalität und Zuverlässigkeit hin, insbesondere im Zusammenhang mit spezifischen Funktionen eines Elektrofahrzeugs.
Einstellung zu Elektrofahrzeugen
Die Abkürzung „EV“ unterstreicht hier eine generell negative Einstellung gegenüber Elektrofahrzeugen – möglicherweise in Bezug auf Themen wie Performance, Ladeinfrastruktur oder Batterielebensdauer.
Performance-Bedenken
Begriffe wie „range“ und „get“ deuten auf Bedenken hinsichtlich der Reichweite des Fahrzeugs hin. Die User könnten das Gefühl haben, dass es ihre Erwartungen nicht erfüllt.
Allgemeine Unzufriedenheit
Die wiederholte Verwendung von „cars“ weist in dieser Kategorie auf eine allgemeine Unzufriedenheit hin. Modellbezogene Themen könnten hier mit generell negativen Einstellungen in Bezug auf Elektrofahrzeuge korrelieren.
Insgesamt signalisieren diese Wörter erhebliche Bedenken der User in Bezug auf das Elektromodell – insbesondere in Bezug auf das Design, die Performance und die Eigenschaften des Fahrzeugs. Dies trägt zu einer negativen Wahrnehmung der Marke und des Modells bei.
Dennoch – oder gerade deshalb – ist die Kategorie „Sehr negativ“ für Unternehmen besonders wertvoll. Denn sie wirft ein Licht auf die Frustrationen der Kunden. Werden diese Probleme nicht angegangen, kann das die Markenwahrnehmung empfindlich beeinträchtigen.
Fokussiert sich eine Marke jedoch auf diese Pain Points, kann sie die Customer Experience verbessern und bestimmte Probleme gezielt beheben. Eine tiefer gehende Analyse könnte dabei helfen, diese Erkenntnisse ggf. zu untermauern und noch besser zu nutzen. So ließen sich z. B. andere Online-Quellen dahingehend untersuchen, ob es auch dort konkrete Hinweise auf wiederkehrende Probleme oder Bedenken gibt.
Analyse der Reddit-Beiträge
Auch bei den Beiträgen auf Reddit liegt unser Fokus auf den ersten beiden Kategorien („Sehr positiv“ und „Positiv“). Dabei gilt es hier ebenfalls zu beachten, dass die Schlussfolgerungen nicht aus den Begriffen allein, sondern aus den kontextuellen Zusammenhängen gezogen werden.
Die Analyse dieser Top-Ten-Begriffe lässt folgende Rückschlüsse zu:
Begeisterung für das Modell
Die Erwähnung bestimmter Modellnamen dieser Marke gibt hier Hinweise auf die Begeisterung der User für diese Modelle und zeigt eine positive Einstellung zu deren Merkmalen und Leistung.
Performance und Features
Begriffe wie „elektrisch“ zeigen in diesen Kontexten die Wertschätzung für fortschrittliche Technologie, insbesondere für bestimmte Markentechnologien und die Performance der Elektrofahrzeuge.
Positive Vergleiche
Das Wort „examples“ deutet darauf hin, dass die User positive Vergleiche oder Erfahrungen teilen. Dies verstärkt die positive Stimmung in Bezug auf diese Modelle.
SUV
Der häufig genutzte Begriff „SUV“ deutet hier auf eine Vorliebe für diese Fahrzeugklasse hin. Sie kommt bei Usern, die Funktionalität mit Performance verbinden wollen besonders gut an.
Allgemeine Begeisterung
Die Verwendung von „first“ impliziert ein Gefühl des Stolzes darauf, Teil eines richtungweisenden Automobiltrends zu sein – und spiegelt die Begeisterung für die Innovationen der Marke wider.
Besonders auffällig in der Kategorie „Positiv“ ist die häufige Verwendung von Markennamen des Wettbewerbs. Hier die Analyse:
Wahrnehmung der Modelle
Die häufige Wiederholung des Markennamens im Zusammenhang mit „model“ unterstreicht die Bekanntheit bestimmter Fahrzeuge und deutet im Kontext auf die positive Bewertung von Design und Performance hin.
Vergleich mit anderen Marken
Die Erwähnung anderer Marken zeigt, dass die User das Modell im Vergleich mit anderen in einem positiven Kontext diskutieren. In diesem Zusammenhang steigert das den wahrgenommenen Wert der vorgestellten Marke.
Allgemeine Begeisterung für Autos
Begriffe wie „car“, „cars“ und „like“ verweisen auf eine allgemeine Begeisterung für Automobile – und verweisen mit Blick auf den Kontext auf die Bedeutung, die etwa Qualität und Performance für die Community haben.
High Performance
Die Erwähnung eines High Performance Modells der Marke und Begriffe wie „another model of this brand“ deuten im Zusammenhang auf Fahrzeugbegeisterte hin, die Wert auf Speed und Agilität legen.
Vielfältige Vorlieben
Die Nennung mehrerer Marken legt ein breites Interesse am Automobilmarkt nahe. Dieses ermöglicht es den Usern, verschiedene Merkmale der einzelnen Modelle zu vergleichen und zu bewerten.
Fazit: Wertvolle Einblicke in Kundenwelten
Die Sentimentanalyse kann Unternehmen wertvolle Einblicke in die Emotionen und die Markenwahrnehmung von Verbraucher:innen liefern. Der Schlüssel dazu liegt in modernen Technologien zur Verarbeitung natürlicher Sprache. Auf diese Weise lassen sich große Mengen unstrukturierter Daten z. B. aus Diskussionen in den Sozialen Medien, aus Rezensionen oder Umfragen effektiv analysieren.
Mit unserem Beispielprojekt wollten wir zeigen, wie diese Methode prinzipiell funktioniert und wie sie sich einsetzen lässt. Doch (wie oben bereits erwähnt) sollte es eher als ein Proof of Concept, nicht als umfassende Studie betrachtet werden. Denn um die Ergebnisse verallgemeinern zu können, wären wesentlich mehr Daten und eine Normalisierung der Variablen erforderlich. Ein noch genaueres Bild würde die Ausweitung dieser Analyse auf weitere Online-Plattformen ergeben.
Der Umgang mit Daten aus den Sozialen Medien hat zudem sehr ernst zu nehmende rechtliche und ethische Dimensionen. Deshalb ist es uns wichtig, darauf hinzuweisen, dass Transparenz, die Einhaltung der Regularien und die Achtung der Privatsphäre hier strikt einzuhalten sind.
Die Konsument:innen von heute sind kritischer denn je. Viele von ihnen tauschen sich im Lauf Ihrer Kaufentscheidung in ihrem sozialen Umfeld und im Netz ausführlich aus. Dabei tragen besonders die Sozialen Medien dazu bei, deren Stimmen massiv zu verstärken.
Die datenbasierte Sentimentanalyse kann Unternehmen hier erkenntnisreiche Einblicke liefern, um sich ein realistisches Bild von den Einstellungen und dem Verhalten der Verbraucher:innen zu machen. Damit verfügen sie über ein wertvolles Instrumentarium, um positive Echos zu nutzen und im Fall von negativen Stimmungslagen gezielt gegenzusteuern.
Ergänzend zu kostenintensiven Marktforschungen kann Sentimentanalyse einen sehr effizienten Beitrag leisten, um in einem wettbewerbsintensiven Umfeld die Zufriedenheit bestehender Kund:innen zu erhöhen, ihre Loyalität zu stärken, neue Kund:innen zu gewinnen und insgesamt das Marken-Image zu verbessern.
Mona Shiri
M +4915110831304
Weitere Posts
Die Sentimentanalyse – auch bekannt als Sentiment Analysis, Sentimentanalyse oder Opinion Mining – ist eine Technik zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP). Sie zielt darauf ab, die Emotionen hinter einem Text zu ermitteln. Dieses Analyseverfahren wird häufig eingesetzt, um Erkenntnisse aus großen Mengen unstrukturierter Daten zu gewinnen, z. B. aus Kundenrezensionen, Beiträgen in sozialen Medien oder Umfrageantworten.