Research Blog

MAXQDA Webseite

Stimmungsbilder zu COVID-19 Impfstoffen – mit MAXQDA’s Sentiment Analyse Twitterdaten evaluieren

Mit MAXQDA’s neuem Sentiment Analyse Feature können nun die Emotionen von Twitter-Usern in Bezug auf bestimmte Themen untersucht werden. Hierfür nutzt unsere Sentiment Analyse ein speziell angepasstes Polaritätslexikon in Kombination mit einem eigens kreierten Regelwerk, um die Stimmung eines Tweets zu identifizieren. Diese neue Funktion ist besonders geeignet für Forschungsarbeiten mit großen Datensätzen, da diese nun automatisch in Stimmungskategorien aufgeteilt und somit übersichtlicher werden. Die Sentiment Analyse für Twitterdaten ist seit dem MAXQDA 2020.4 Update für die englische Sprache verfügbar.

Im Folgenden erläutern wir anhand eines kurzen Beispiels zu den unterschiedlichen Meinungen im Hinblick auf die verschiedenen COVID-19 Impfstoffe, wie eine Sentiment Analyse in ein Forschungsprojekt integriert werden könnte. Die nachfolgenden Punkte geben einen Überblick über die möglichen Arbeitsschritte:

  1. Erstellen des Twitter Datensatzes
  2. Durchführung Sentiment Analyse
  3. Prüfen der Statistiken
  4. Autocodierung der Sentiment Label
  5. Korrektur der Sentiment Label
  6. Auswertung der Ergebnisse

Erstellung des Twitter Datensatzes

Zunächst erstellen wir mithilfe von MAXQDA’s Twitter-Import Funktion einen Datensatz für unser Projekt. Hierzu müssen erst einmal Hashtags und wichtige Begriffe identifiziert werden, die in den Tweets, die wir näher untersuchen möchten, vorkommen sollten.

Für unser Beispielprojekt zu den Impfstoffen haben wir Datensätze mit Tweets für einige der COVID-19 Impfstoffe erstellt. Um sicherzugehen, dass die Tweets den jeweiligen Impfstoff repräsentieren, haben wir festgelegt, dass bestimmte Begriffe wie beispielsweise der Name des Impfstoffes und Wörter wie „vaccine“ enthalten sein sollten.

Twitterdaten importieren im MAXQDA Manual

Durchführung der Sentiment Analyse

Die Sentiment Analyse kann unter Analyse -> Tweets Analysieren durchgeführt werden. Hierfür wählen wir den zuvor erstellten Datensatz aus und es öffnet sich ein neues Fenster für die Twitter Analyse. In diesem Fenster wählen wir nun über Button Sentiment-Analyse die Einstellungen aus, die für unser Projekt relevant sind. Abhängig vom Untersuchungsgegenstand kann es notwendig sein, Hashtags oder bestimmte Begriffe zu ignorieren, da diese sonst die Ergebnisse der Sentiment Analyse beeinträchtigen könnten.

In unserem Beispiel gehen wir davon aus, dass Wörter wie „vaccine“, „vaccinated“ und „shot“ selbst bereits negativ oder positiv konnotiert sein könnten und damit unsere Stimmungsanalyse in die eine oder andere Richtung verfälschen könnten. Aus diesem Grund wenden wir innerhalb der Sentiment Analyse eine Stopp-Liste an, die ebendiese Begriffe enthält. Diese werden dann bei der Analyse nicht berücksichtigt und ihr Einfluss auf unsere Ergebnisse ist somit begrenzt.

Die Anwendung von Stopp-Listen für die Sentiment Analyse.Die Anwendung von Stopp-Listen für die Sentiment Analyse.

Die Ergebnisse der Sentiment Analyse erscheinen auf der rechten Seite der Tabelle in Form von vier neuen Spalten. Zusätzlich wird auf der linken Seite des Fensters ein neuer Filtertyp erzeugt. Somit können die angezeigten Tweets nach Sentiment gefiltert, oder aber durch Klicken auf die jeweilige Spalte sortiert werden.

Das Twitter-Analyse Fenster mit den neuen Sentiment Funktionen.Das Twitter-Analyse Fenster mit den neuen Sentiment Funktionen.

Prüfen der Sentiment Statistiken

Bevor wir die Sentiment Label autocodieren, können wir durch Klicken auf Statistiken die Sentiment Statistiken zu unserem Datensatz abrufen. Diese können wir durch Auswählen der Variable Sentiment einsehen und individuell anpassen. Die Ergebnisse können hier nun auch direkt exportiert oder in die Zwischenablage kopiert werden.

In unserem Beispiel konnten wir einige Sentiment Label ausfindig machen, die eine inkorrekte Vorhersage vermuten lassen. Wie wir diese Codierungen abändern, zeigen wir in den kommenden Schritten.

Sentiment Label autocodieren

Nachdem wir die Sentiment Analyse durchgeführt haben, können wir durch Klicken auf Tweets mit Sentiment autocodieren die Sentiment Label als Code zum Codesystem unseres Projektes hinzufügen. Die automatisch erzeugten Sentiment Codes erscheinen nun im Hauptfenster von MAXQDA in der Liste der Codes unter dem neuen Obercode Tweet Sentiment.

Hinweis: Wenn Sie vorhaben, eine Sentiment Analyse innerhalb einer Projektdatei an mehreren Datensätzen durchzuführen, ist es hilfreich, den Obercode Tweet Sentiment umzubenennen. Andernfalls werden neue Sentiment Autocodierungen automatisch in den bisher bestehenden Autocode integriert.

Optional: Sentiment Label korrigieren

Da die Sentiment Analyse in ihren Möglichkeiten der Analyse von Sarkasmus oder Schreibfehlern beschränkt ist, werden wir nun ein paar der Sentiment Codes, die nicht mit unserem persönlichen Eindruck übereinstimmen, abändern. Dies kann beispielsweise mithilfe des Smart-Coding-Tools im Hauptfenster von MAXQDA erfolgen. Innerhalb des Smart-Coding-Tools können Tweets per drag-and-drop dem gewünschten Code zugeordnet und per Rechtsklick vom aktuellen Code entfernt werden.

Die Überarbeitung bestehender Codes mit dem Smart-Coding-Tool.Die Überarbeitung bestehender Codes mit dem Smart-Coding-Tool.

Auswertung der Ergebnisse

Für die Auswertung der Sentiment Analyse können die Statistiken des Datensatzes durch Öffnen der Statistik für Subcodes und Auswählen der Codierten Segmente als Einheit der Analyse zu Rate gezogen werden. Eine weitere Option zur Ausgabe der Sentiment Statistiken findet man direkt innerhalb des Tweets analysieren Fensters unter Statistiken -> Sentiment.

Unser Beispielprojekt zeigt, dass die Stimmung im Hinblick auf die verschiedenen Impfstoffe merklich variiert. Das Moderna Vakzin beispielsweise scheint im Vergleich zu anderen Impfstoffen vorrangig positive Stimmungen zu erzeugen: Die Statistik zeigt uns ca. 52% positiv getaggte Tweets und nur 11% negativ codierte Segmente. In Kontrast dazu stehen die Ergebnisse des AstraZeneca Datensatzes. Hier können wir ca. 30% positive Meinungsäußerungen und 22% negativ getaggte Tweets erkennen.  

Verteilung der Sentiment Label für den AstraZeneca Datensatz.Verteilung der Sentiment Label für den AstraZeneca Datensatz.

Verteilung der Sentiment Label für den Moderna DatensatzVerteilung der Sentiment Label für den Moderna Datensatz

Da wir nun anhand eines Beispiels gezeigt haben wie ein eigener Twitter Datensatz erstellt und mit Hinblick auf die Stimmung analysiert werden kann, möchten wir Sie herzlich dazu einladen, Ihren eigenen Datensatz über die Twitter-Import Funktion zu erstellen und MAXQDA’s neue Sentiment Analyse Features auszuprobieren.

Für weitere Informationen und den theoretischen Hintergrund von MAXQDA’s Sentiment Analyse, können finden Sie hier die zugehörige Seite in unserem Manual:

Sentiments von Tweets analysieren im MAXQDA Manual

Sentiment Analysis in MAXQDA (English):

MAXQDA Newsletter

Unsere Forschungs- und Analysetipps, direkt in Ihren Posteingang.