PDF-Dokumente

PDF-Dokumente importieren

Der Import von PDF-Dokumenten in ein MAXQDA-Projekt kann auf verschiedene Weise erfolgen, z.B.

  • durch Klicken-und-Ziehen von PDF-Dateien aus dem Windows Explorer oder macOS Finder direkt in das Fenster „Liste der Dokumente“,
  • durch Klick auf das Symbol Dokumente importieren in der „Liste der Dokumente“ oder
  • durch Klick auf das Symbol Texte, PDFs, Tabellen auf dem Tab Import.
Datenimport starten über den Tab „Import“

Im Abschnitt Daten importieren und gruppieren finden Sie generelle Hinweise zum Import von Daten und deren Strukturierung in MAXQDA.

Farbhervorhebungen und Kommentare

Bereits im PDF-Dokument existierende Farbhervorhebungen werden beim Import in MAXQDA als reguläre Codierungen übernommen. Im Codesystem wird ein Code mit dem Namen “Word-/PDF-Hervorhebung” auf oberster Ebene angelegt. Für jede Farbe wird ein Subcode mit einem englischen Farbnamen ergänzt und den entsprechenden Textstellen zugeordnet.

Hinweis: Beim Import der Farbhervorhebung sind leichte Farbabweichungen zum Original möglich, da MAXQDA aus einer Liste von hinterlegten Farben diejenige auswählt, die am besten passt.

Kommentare, die Sie am PDF-Dokument angefertigt haben, werden an der gleichen Stelle im Text als In-Dokument-Memos übernommen. Mehrere aufeinander bezogene Kommentare oder Diskussionsverläufe werden in einem Memo zusammengefasst.

Die Übernahme von Farbhervorhebungen und Kommentaren lassen sich in den Einstellungen des Fensters „Liste der Dokumente“ ein- und ausschalten. Um die Einstellungen zu öffnen, klicken Sie auf das Zahnrad in der Titelleiste des Fensters.

Navigieren im „Dokument-Browser“

Sobald ein PDF-Dokument im „Dokument-Browser“ angezeigt wird, erscheinen in dessen Symbolleiste mehrere Icons für die Dokument-Navigation, die jederzeit klickbar sind: Sie können direkt auf eine bestimmte Seite des PDFs springen, seitenweise vor- und zurückblättern, den Zoom einstellen und die Lesezeichen aufrufen (manche PDF-Dateien besitzen eigene Lesezeichen, etwa an jedem Kapitel). Sie finden auf der Leiste auch ein Symbol, um einzelne PDF-Seiten zu drehen.

Navigationsleiste im „Dokument-Browser“
Hinweis: Die Darstellung von PDF-Inhalten in MAXQDA unterstützt keine Formularinhalte. Damit Inhalte aus PDF-Formularen angezeigt werden, empfiehlt es sich, das PDF vor dem Import über einen PDF-Drucker in eine neue PDF-Datei abzuspeichern, welche die Formulareinträge als reinen Text enthält.

Besonderheiten von PDF-Dokumenten

Bei der Arbeit mit PDF-Dokumenten gibt es einige Besonderheiten zu beachten, da das PDF-Format von seiner Technologie her nicht für die Textbearbeitung ausgelegt ist, sondern ursprünglich als Layout-Format für den Druck konzipiert wurde und da die Dokumente deutlich größer sein können als einfache Text-Dokumente.

PDF-Dateien außerhalb der MAXQDA-Projektdatei speichern

Standardmäßig werden alle PDF-Dateien, die kleiner als 5 MB groß sind, beim Einfügen in das MAXQDA-Projekt auch in diesem gespeichert. PDF-Dateien, die größer als 5 MB sind, werden beim Import in ein MAXQDA-Projekt nicht physisch im Projekt selbst gespeichert, sondern im Ordner für externe Dateien abgelegt, und es wird nur eine Referenz auf die extern gespeicherte Datei erzeugt.

Sie können sowohl den Schwellenwert von 5 MB als auch den Speicherort für extern gespeicherte Dokumente in den Einstellungen von MAXQDA anpassen. Die Einstellungen rufen Sie über das Zahnrad am oberen rechten Fensterrand auf.

Weitere Informationen finden Sie im Abschnitt zu extern gespeicherten Dateien.

Tipp: Wenn Sie mit sehr vielen großen PDF-Dateien arbeiten (z.B. mit einer Gesamtgröße von mehr als 50 MB), ist es sinnvoll diese extern zu speichern, damit die MAXQDA-Datei klein bleibt und leicht gesichert werden kann. Für die Performance ist es wichtig, dass der Ort für extern gespeicherte Dateien auf der lokalen Festplatte liegt und möglichst nicht in einem Netzwerk, wenngleich dies bei zunehmend schneller werdenden Netzwerken immer weniger ein Problem darstellt.

Text- und Bildsegmente codieren

In PDF-Dokumenten kann mit der Maus sowohl Text selektiert und codiert werden als auch ein Bildrahmen aufgezogen werden, der codiert werden kann. Bei der Anzahl der Codehäufigkeiten nimmt MAXQDA keine Unterscheidungen zwischen Bild- und Textcodierungen vor, wohl aber bei der Segmentsuche: Diese werden getrennt ausgewertet und Überschneidungen von Bildsegmenten mit Textsegmenten werden ignoriert. Die Funktion „Nähe“ von Bildsegmenten liefert immer 0 Treffer, z.B. bei der Komplexen Segmentsuche und im Code-Relations-Browser.

Wenn Texte als eingescannte PDF-Dateien vorliegen, muss vor dem Import in MAXQDA mit einem geeigneten Programm eine Texterkennung (eine sogenannte OCR-Erkennung) durchgeführt werden, damit man später in MAXQDA Text markieren und codieren kann – sonst lassen sich nur Bildsegmente markieren.

Absätze in PDF-Dateien

PDF-Dokumente weisen – anders als Textdokumente – von sich aus keine Absatzstruktur auf. MAXQDA versucht daher, anhand von verschiedenen Kriterien Absätze in PDF-Dokumenten zu erkennen, sodass beispielsweise die Funktionen zum Suchen von Wörtern innerhalb eines Absatzes oder das Autocodieren von Absätzen verwendbar sind.

Die Absatzerkennung funktioniert in den meisten PDF-Dokumenten sehr gut, aber bitte berücksichtigen Sie folgende Einschränkungen:

  • In PDF-Dokumenten gibt es keine Absätze über Seitengrenzen hinweg. Das heißt, auch wenn inhaltlich ein Absatz auf der nächsten Seite fortgesetzt wird, endet der Absatz für MAXQDA am Seitenende.
  • Fußnotenzeichen im Text werden ggf. als Absatzende erkannt.
  • Die Qualität der Absatzerkennung hängt sehr davon ab, wie das PDF erstellt wurde und welche Struktur es aufweist. In PDF-Dokumenten, die aus gescannten Texten mit Hilfe von Texterkennung (OCR) erzeugt wurden, wird die Qualität der Absatzerkennung schlechter ausfallen als in PDF-Dokumenten, die direkt aus Word erstellt wurden.

Text aus einem PDF-Dokument als eigenes Text-Dokument einfügen

Nachdem ein PDF-Dokument in ein MAXQDA-Projekt importiert wurde, können Sie den Text aus dem PDF-Dokument extrahieren. Bilder und Formatierungen werden dabei ignoriert, es wird nur der reine Text als neues Text-Dokument in der „Liste der Dokumente“ eingefügt.

Klicken Sie hierzu auf ein oder mehrere PDF-Dokument in der „Liste der Dokumente“ und wählen Sie die Funktion PDF-Text als neues Dokument einfügen aus. Direkt unterhalb des angeklickten Dokuments erscheint der neue Text.

Funktion aus dem Kontextmenü eines PDF-Dokuments aufrufen
Tipp: Bei vielen PDF-Texten wird es durch die Umwandlung möglich, bei der lexikalischen Suche innerhalb von Absätzen zu suchen.

War diese Seite hilfreich?