Worthäufigkeiten analysieren

Die einfachste Funktion von MAXDictio ermittelt den Wortschatz aller Texte des aktuellen Projektes.

Diese Funktion wird im Tab MAXDictio durch Klick auf das Symbol Worthäufigkeiten aufgerufen.

Funktion „Worthäufigkeiten“ im Tab „MAXDictio“ starten

Daraufhin erscheint folgendes Dialogfenster, in dem sich wesentliche Einstellungen vornehmen lassen.

Das Dialogfenster der Funktion „Worthäufigkeiten“
Auswahl der zu analysierenden Texte

Nur für aktivierte Dokumente: Diese Option beschränkt die Bestimmung der Worthäufigkeiten auf die derzeit aktivierten Dokumente.

Nur in ‚Liste der Codings‘: Die Analyse beschränkt sich auf die Textsegmente, die derzeit in der „Liste der Codings“ angezeigt werden.

Ist keine der beiden Optionen gewählt, werden alle Text-, PDF- und Tabellen-Dokumente im MAXQDA-Projekt analysiert.

Hinweis: Bitte beachten Sie, dass eine Silbentrennung in PDF-Dokumenten nicht erkannt bzw. berücksichtigt werden kann.
Aufgliederung der Ergebnisse

Keine: Die Ergebnistabelle enthält keine Differenzierung der Ergebnisse, sondern nur die Summen über alle analysierten Texte hinweg.

Nach Dokumenten, Dokumentgruppen, Dokumentsets: Die Ergebnistabelle enthält zusätzliche Spalten, mit denen die Worthäufigkeiten der einzelnen Dokumente, Dokumentgruppen oder Dokumentsets verglichen werden können (siehe Aufgliederung nach Dokumenten, Dokumentgruppen und Dokumentsets). Bei gewählter Option Nur aktivierte Dokumente werden innerhalb der Dokumentgruppen oder Dokumentsets nur die aktivierten Dokumente berücksichtigt und es werden auch nur die Gruppen und Sets ausgegeben, in denen überhaupt aktivierte Dokumente vorhanden sind.

Nach Codes: Diese Option ist nur wählbar, wenn zugleich die Analyse auf die Segmente in der „Liste der Codings“ beschränkt ist und eine „Einfache Coding-Suche“ durchgeführt wurde. Die Ergebnistabelle enthält zusätzliche Spalten mit Worthäufigkeiten für jeden Code, der in der „Liste der Codes“ vorkommt. Diese Option ist besonders dann hilfreich, wenn man Texte mithilfe von Codes für die Analyse in MAXDictio in Texteinheiten unterteilt hat, denn sie ermöglicht es, die Worthäufigkeiten innerhalb verschiedener Codes zu vergleichen.

Weitere Optionen

Abzutrennende Zeichen: Ein Klick auf den Button mit den drei Punkten öffnet ein kleines Dialogfenster, in dem Sie Zeichen eingeben können, die von den Wörtern abgetrennt und bei der Auszählung ignoriert werden sollen. Die gewählten Zeichen gelten für alle wortbasierten Funktionen in MAXQDA und MAXDictio.

Was ist ein Wort im Sinne von MAXDictio? Ein Wort ist jede Abfolge von Zeichen, die sich zwischen zwei Begrenzerzeichen befindet. Begrenzerzeichen können z.B. Leerzeichen oder Satzzeichen sein. So wird beispielsweise das letzte Wort des letzten Satzes „sein.“ an der linken Seite durch ein Leerzeichen und rechts durch einen Punkt begrenzt.

In das Dialogfeld „Abzutrennende Zeichen“ sind all die Zeichen einzutragen, die als Begrenzer fungieren sollen. Das sind üblicherweise Satzzeichen, Anführungszeichen etc. Die Auswahl der Zeichen gilt für alle MAXDictio-Funktionen und wird im jeweiligen Projekt gespeichert, sodass Sie die gleichen Ergebnisse erhalten, auch wenn Sie die Datei auf einem anderen Rechner öffnen. Standardmäßig werden die folgenden Zeichen in neuen Projekten automatisch eingetragen:

@ ! § $ % & / ( ) = ? ^ ° ‘ ´ ` ” „ “ ” “ { } [ ] # + * _ . : , ; < > ~ —

Gewisse Probleme macht unter Umständen der Bindestrich. Wenn man zusammengesetzte Wörter als solche beibehalten will und nicht in die einzelnen Bestandteile aufsplitten will, darf der Bindestrich nicht als abzutrennendes Zeichen vereinbart werden. Am besten ist es, wenn man mit den Möglichkeiten ein wenig herumexperimentiert. Da sich die Auszählung der Worthäufigkeiten problemlos in kurzer Zeit erneut durchführen lässt, sollte man die Ergebnistabelle durchblättern und auf Auffälligkeiten hin untersuchen und die Einstellung ggf. verändern.

Minimale Anzahl der Zeichen eines Wortes: Worte, die weniger Zeichen aufweisen, werden nicht in die Ergebnistabelle übernommen.

Stopp-Liste anwenden: Wenn eine Stopp-Liste benutzt werden soll, ist in dieser Checkbox ein Häkchen zu setzen. Ein Klick auf den Button mit den drei Punkten öffnet das Fenster mit den Stopp-Listen, um diese zu bearbeiten und auszuwählen.

Groß-/Kleinschreibung unterscheiden: Ist diese Einstellung aktiv, werden beispielsweise „Geben“ und „geben“ als unterschiedliche Wörter gezählt. Ist die Einstellung inaktiv, werden alle Wörter in Kleinschreibung in der Ergebnisliste ausgegeben.

Wörter lemmatisieren: Ist diese Einstellung gewählt, werden die gezählten Wörter mithilfe eines Lemma-Lexikons der gewählten Sprache auf ihre Grundformen zurückgeführt. So wird beispielsweise für die Wörter „gibt“, „gab“, „gäbe“ nur das Wort „geben“ gezählt und für die Genitiv-Formen „Glückes“ und „Glücks“ wird lediglich „Glück“ ausgegeben.

Sobald man auf OK klickt, wird das Auszählen der Wörter gestartet. Je nach Umfang der Texte kann dieser Vorgang kürzer oder länger dauern. Eine Anzeige informiert Sie über den aktuellen Fortschritt.