Webseiten

Es gibt verschiedene Möglichkeiten, wie Sie eine Webseite in MAXQDA importieren können:

  1. Mit der Browser-Erweiterung MAXQDA Web Collector lassen sich einzelne Webseiten im Browser Google Chrome für den Import in MAXQDA abspeichern.
  2. Um mehrere Webseiten auf einmal zu importieren, können Sie direkt in MAXQDA eine Excel-Liste mit Links auf Webseiten einlesen. Diese Variante ist auch für Hundert Webseiten und mehr geeignet.
  3. HTML-Seiten lassen sich wie Textdokumente direkt in das MAXQDA-Projekt mit der Maus hineinziehen.
  4. Einzelne Webseiten können via URL importiert werden.

Variante 1) Webseiten per Web Collector importieren

Mit dem MAXQDA Web Collector können Sie Webseiten in Ihrem Browser abspeichern und dann in MAXQDA als PDF, Bild oder Text importieren. Darüber hinaus können Sie auch direkt Webseiten, die im HTML-Format vorliegen, in MAXQDA als Text-Dokumente importieren.

Webseite mit dem MAXQDA Web Collector abspeichern

Der MAXQDA Web Collector ist eine Erweiterung für den Internetbrowser „Google Chrome“, mit dem Sie ganze Webseiten, Teile von Webseiten oder PDF-Dateien abspeichern können. Die gespeicherten Dateien lassen sich dann als PDF-, Bild- oder Text-Dokumente in MAXQDA importieren. Mit dem Web Collector können Sie Webseiten für die Analyse in MAXQDA sammeln und analysieren, etwa um die Internetauftritte verschiedener Organisationen zu vergleichen oder wichtige Ausschnitte aus Zeitungsartikeln zusammenstellen.

MAXQDA Web Collector installieren

Um mit dem MAXQDA Web Collector zu arbeiten, benötigen Sie den Internetbrowser „Google Chrome“. Sobald dieser auf Ihrem Computer installiert ist, können Sie den „MAXQDA Web Collector“ installieren:

  1. Öffnen Sie „Google Chrome“.
  2. Suchen Sie im Chrome Web Store nach „MAXQDA“ oder klicken Sie auf diesen Link: https://chrome.google.com/webstore/detail/web-collector-for-maxqda/jhnochbooihpgjbgcjlpihaefoehlakd
  3. Klicken Sie auf die Schaltfläche „+ Hinzufügen“, um die Erweiterung zu installieren.
  4. Klicken Sie auf das „Puzzleteil-Symbol“ in Google Chrome und klicken Sie auf das Symbol „Anpinnen“, um den installierten Web Collector in der Adressleiste von Chrome anzuzeigen.
Web Collector in Google Chrome anpinnen

Nach erfolgreicher Installation sehen Sie oben rechts im Browserfenster ein kleines rundes MAXQDA-Symbol (ggf. müssen Sie erst noch auf das „Puzzle-Symbol“ klicken und auswählen, dass das Symbol für den Web Collector angezeigt wird):

MAXQDA-Symbol zum Öffnen des MAXQDA Web Collectors in Google Chrome

Ein Klick auf das MAXQDA-Symbol öffnet den Web Collector:

MAXQDA Web Collector

Der Web Collector bietet vier Modi an:

  • Komplette Webseite: speichert die Webseite als Ganzes, wobei das Layout der Webseite bestmöglich erhalten bleibt.
  • Vereinfachte Webseite: speichert eine reduzierte Form der Webseite mit dem zentralen Text und mit zentralen Bildern (wie bei einem Lesemodus).
  • Selektierte Bereiche auf einer Webseite: speichert nur den selektierten Ausschnitt.
  • PDF-Dokumente: speichert die derzeit in Chrome geöffnete PDF-Datei für den Direktimport in MAXQDA.

Komplette Webseite abspeichern

Sofern für Ihre Analyse alle sichtbaren Webseitenelemente von Bedeutung sind, empfiehlt es sich die Webseite als Ganzes abzuspeichern, um sie möglichst originalgetreu in ein MAXQDA-Projekt zu importieren. Hierfür gehen Sie wie folgt vor:

  1. Rufen Sie in Google Chrome die gewünschte Webseite auf.
  2. Nachdem die Webseite vollständig geladen ist, öffnen Sie den Web Collector mit einem Klick auf das kleine MAXQDA-Symbol.
  3. Stellen Sie sicher, dass der Tab „Web Page“ geöffnet ist.
  4. Bei Bedarf können Sie den vorgeschlagenen Dokumentnamen ändern. Dieser wird später im MAXQDA-Projekt übernommen.
  5. Bei Bedarf können Sie im Feld „Document Memo“ einen Text eintippen, der später im MAXQDA-Projekt als Dokumentmemo an das importierte Dokument angeheftet wird.
  6. Klicken Sie auf Collect.

Der MAXQDA Web Collector speichert die Webseite im eingestellten Download-Ordner des Browsers. Die Webseite wird im MWEB-Format gespeichert, das speziell für die spätere Weiterverarbeitung mit MAXQDA entwickelt wurde.

Webseiten, die auf diese Weise gespeichert wurden, lassen sich später in MAXQDA als PDF- oder Bild-Dokumente importieren.

Vereinfachte Webseite abspeichern

Steht bei Ihrer Analyse der Text einer Webseite im Vordergrund, können Sie diese als „simplified“ Webseite abspeichern. Vergleichbar mit dem Lesemodus auf einem Handy wird die Webseite auf den Text und zentrale Bilder reduziert, was besonders häufig von Webauftritten großer Zeitungen und Zeitschriften unterstützt wird. Gehen Sie für den Import einer „simplified“ Webseite wie folgt vor:

  1. Rufen Sie in Google Chrome die gewünschte Webseite auf.
  2. Nachdem die Webseite vollständig geladen ist, öffnen Sie den Web Collector mit einem Klick auf das kleine MAXQDA-Symbol.
  3. Klicken Sie auf den Tab „Simplified Web Page“. Die Webseite wird daraufhin reduziert angezeigt.
  4. Passen Sie bei Bedarf weitere Optionen wie Schriftart, Schriftgröße und Ausschluss von Bildern an.
  5. Bei Bedarf können Sie den vorgeschlagenen Dokumentnamen ändern. Dieser wird später im MAXQDA-Projekt übernommen.
  6. Bei Bedarf können Sie im Feld „Document Memo“ einen Text eintippen, der später im MAXQDA-Projekt als Dokumentmemo an das importierte Dokument angeheftet wird.
  7. Klicken Sie auf Collect.

Der MAXQDA Web Collector speichert die Webseite im eingestellten Download-Ordner des Browsers. Die Webseite wird im MWEB-Format gespeichert, das speziell für die spätere Weiterverarbeitung mit MAXQDA entwickelt wurde.

Webseiten, die auf diese Weise gespeichert wurden, lassen sich später in MAXQDA als PDF- oder Text-Dokumente importieren.

Hinweis: Einige Webseiten lassen sich aus technischen Gründen nicht vereinfachen. In diesem Fall wird im Web Collector ein entsprechender Hinweis angezeigt.

Selektion auf einer Webseite abspeichern

Wenn Sie nur an einem kleinen Ausschnitt einer Webseite interessiert sind, lässt sich dieser ebenfalls abspeichern:

  1. Markieren Sie den gewünschten Bereich mit der Maus.
  2. Klicken Sie mit der rechten Maustaste auf den markierten Bereich und wählen Sie den Eintrag Collect Selection for MAXQDA.

Der MAXQDA Web Collector speichert den markierten Inhalt im eingestellten Download-Ordner des Browsers. Die Selektion wird im MWEB-Format gespeichert, das speziell für die spätere Weiterverarbeitung mit MAXQDA entwickelt wurde.

Selektionen, die auf diese Weise gespeichert wurden, lassen sich später in MAXQDA als Text- oder PDF-Dokumente importieren.

PDF-Dokumente abspeichern

Für den Import eines PDF-Dokuments, das in Chrome angezeigt wird, gehen Sie folgendermaßen vor:

  1. Öffnen Sie den Web Collector mit einem Klick auf das kleine MAXQDA-Symbol.
  2. Bei Bedarf können Sie den vorgeschlagenen Dokumentnamen ändern. Dieser wird später im MAXQDA-Projekt übernommen.
  3. Bei Bedarf können Sie im Feld „Document Memo“ einen Text eintippen, der später im MAXQDA-Projekt als Dokumentmemo an das importierte Dokument angeheftet wird.
  4. Klicken Sie auf Collect.

Der MAXQDA Web Collector speichert das PDF-Dokument im eingestellten Download-Ordner des Browsers. Die PDF-Datei wird im MWEB-Format gespeichert, das speziell für die spätere Weiterverarbeitung mit MAXQDA entwickelt wurde.

Mit dem Web Collector gespeicherte Webseiten in MAXQDA importieren

Nachdem Sie Webseiten mit dem Web Collector gespeichert haben, können Sie diese in ein geöffnetes MAXQDA-Projekt importieren:

  1. Fokussieren Sie in der „Liste der Dokumente“ eine Dokumentgruppe, um die Webseite in eine ausgewählte Dokumentgruppe zu importieren. Wenn keine Dokumentgruppe fokussiert ist, wird eine neue erstellt.
  2. Rufen Sie die Funktion Import > Web-Collector-Daten auf.
Import von Web-Collector-Daten auf dem Tab ‚Import‘ starten

Daraufhin erscheint der folgende Dialog:

Dialog für den Import von Dokumenten, die mit dem Web Collector gespeichert wurden
  1. Beim ersten Öffnen des Dialogs wählt MAXQDA automatisch das Standardverzeichnis für Downloads auf Ihrem Computer aus und zeigt dieses oben im Dialog. Alle in diesem Ordner befindlichen Webseiten werden im mittleren Teil des Dialogs gelistet. Durch Klick auf die drei Punkte … können Sie ein beliebiges anderes Verzeichnis auswählen, aus dem Sie mit dem MAXQDA Web Collector gespeicherte Webseiten importieren möchten.
  2. Wählen Sie aus der Liste durch Klicken mit der Maus alle zu importierenden Webseiten aus, so dass diese grün markiert sind (beim Öffnen des Dialogs werden automatisch alle gelisteten Webseiten markiert).
Tipp: Ein Doppelklick auf eine Zeile öffnet die heruntergeladene Datei in Google Chrome, sodass Sie einzelne Webseiten auf ihre Inhalte überprüfen können.
  1. Im unteren Teil des Dialogs stehen Ihnen verschiedenen Importoptionen zur Auswahl:
  • Für Webseiten können Sie auswählen, ob diese als PDF– oder als Bild-Dokumente importiert werden sollen.
  • Für vereinfachte Webseiten und Selektionen können Sie auswählen, ob diese als PDF-Dokumente oder Text-Dokumente in das Projekt aufgenommen werden sollen.
  • Die Option Nur neue Daten importieren sorgt dafür, dass nur Daten importiert werden, die noch nicht im geöffneten MAXQDA-Projekt existieren. MAXQDA vergleicht hierzu das Collect-Datum, den Dokumentnamen und den Dokumenttyp (Text, Bild, PDF).

Ein Klick auf Ausgewählte Dateien importieren startet den Importvorgang. Dieser kann je nach Komplexität und gewähltem Dokumentformat unterschiedlich lange dauern – ein Fortschrittsbalken informiert über den Stand des Imports.

Haben Sie als Format PDF- oder Bild-Dokumente gewählt, wird MAXQDA bei großen Dateien nachfragen, ob Sie diese als externe Dateien oder im Projekt speichern möchten (siehe Extern gespeicherte Dateien).

Hinweis: Beim Import als PDF- oder Bild-Dokument wird das Layout soweit wie möglich übernommen. Vereinzelt kann es bei komplexen Seiten zu Abweichungen von der Originalwebseite kommen.

Variante 2) „Bulk-Import“ von mehreren Webseiten per Excel-Datei mit Links

Wenn Sie eine Sammlung von Links haben, können Sie diese in einer Excel-Tabelle zusammenstellen. MAXQDA liest die Links aus der Excel-Tabelle ein und importiert die Webseiten als vereinfachte Webseiten, PDF-Dokumente oder Bilder. Auf diese Weise können Sie auch Hundert Webseiten und mehr auf einmal importieren.

Aufbau der Excel-Tabelle

Die Excel-Tabelle muss in einer Spalte die Links zu den Webseiten enthalten. Die weiteren Spalten können Informationen zu jeder Webseite enthalten, die MAXQDA als Dokumentvariablen und in das Dokument-Memo übernimmt. Die Reihenfolge der Spalten bestimmt darüber, in welcher Reihenfolge die Daten importiert werden, spielt aber ansonsten keine Rolle.

Eine Tabelle für den Import sieht beispielsweise wie folgt aus:

URLSpracheNotiz
https://www.maxqda.deDEInfos über die Software
https://www.maxqda.com/maxdaysENInfos über die jährliche Konferenz
https://www.maxqda.comENEnglischsprachige Infos

Import der Excel-Tabelle

Um den Import zu starten, wählen Sie Import > Webseiten > Webseiten aus Links einer Excel-Tabelle. Nach Auswahl der gewünschten Excel-Datei erscheint folgender Dialog:

Dialog für den Import von mehreren Webseiten per Excel-Liste

Nehmen Sie folgende Einstellungen im Dialog vor:

  • Ganz oben wählen Sie aus, welche Spalte die Links auf die Webseiten beinhaltet. Wenn Sie die Spalte URL genannt haben, erkennt MAXQDA diese automatisch.
  • In der Mitte wählen Sie aus, welche Informationen in das Dokument-Memo und welche als Dokumentvariable übernommen werden sollen. Sie können auch beide Optionen ankreuzen, um die Information sowohl als Dokumentvariable als auch in das Dokument-Memo zu übernehmen.
  • Unten wählen Sie aus, wie die Webseiten importiert werden sollen. Die Optionen entsprechend denen des Imports per Web Collector:
    Text (vereinfachte Webseite) – Bei dieser Einstellung wird von der Webseite nur der zentrale Text übernommen (ohne Bilder). Die Einstellung funktioniert wie ein Lesemodus, den man für Webseiten auf dem Handy einschalten kann und ist aus verschiedenen Gründen zu empfehlen: Sie können sich auf den wesentlichen Inhalt einer Webseite konzentrieren und die meisten PopUp-Banner wie Cookie-Nachfragen werden ignoriert. Die Einstellung eignet sich besonders für Nachrichtenseiten.
    PDF – Die Webseite wird in ein PDF konvertiert, wobei das Layout weitgehend erhalten bleibt. Wenn Sie diese Option auswählen, können Sie unten angeben, dass die PDFs nicht im Projekt, sondern im Ordner für externe Dateien gespeichert werden sollen. Sie können den Import testweise mit eingeschalteter Option JavaScript deaktivieren versuchen, um störende PopUp-Banner zu ignorieren. Dies führt jedoch bei manchen Webseiten dazu, dass diese gar nicht oder nicht korrekt angezeigt wird.
    Bild – Die Webseite wird in ein Bild konvertiert, wobei das Layout weitgehend erhalten bleibt. Auch bei diesem Import ist es möglich, JavaScript zu deaktivieren.

Nach Klick auf OK, erscheint ein weiterer Dialog, in dem Sie die Variablentypen bestimmen können.

MAXQDA legt für die importierten Webseiten eine neue Dokumentgruppe an und übernimmt den Titel der Webseite als Dokumentname.

Im Memo der Dokumentgruppe wird ein Report gespeichert, der auch alle Webseiten auflistet, die nicht importiert werden konnten, weil z.B. die Webseite nicht erreichbar war.

Variante 3) Direkt-Import von Webseiten im HTML-Format

Sie können auch eine HTML-Datei direkt in MAXQDA importieren. Wechseln Sie hierzu auf den Tab Import und wählen Sie Texte, PDFs, Tabellen. Im erscheinenden Dateidialog wählen Sie dann die HTML-Datei aus. Alternativ können Sie die HTML-Datei auch mit der Maus in das Fenster „Liste der Dokumente“ hineinziehen.

MAXQDA importiert die Datei als Text-Dokument und übernimmt dabei auch die Bilder, sofern diese in der HTML-Datei eingebettet sind.

Hinweis: Wenn Sie den Direkt-Import von Webseiten nutzen, werden die Webseiten als Text-Dokument in MAXDQA übernommen. Das Layout kann sich beim Import stark verändern, weshalb die Variante des Imports mit dem Web Collector von MAXQDA vorzuziehen ist. Der direkte HTML-Import eignet sich nur für einfach strukturierte Daten mit schlichtem Layout.

Variante 4) Webseite aus Link importieren

Sie können Webseiten via Import – Webseiten – Webseite aus Link importieren, indem Sie die URL in das Fenster einfügen. Im Importdialog können Sie auch auswählen, ob die Webseite als Text, PDF oder Bild importiert werden soll.

Dialog für den Import einer Webseite per Link