Download Dieses Kapitel

PDF-Dokumente

PDF-Dokumente importieren

Der Import von PDF-Dokumenten in MAXQDA erfolgt wie hier beschrieben, z.B.

  • durch Klick auf das Symbol Dokumente importieren in der „Liste der Dokumente“ oder
  • durch Klick auf das Symbol Texte, PDFs, Tabellen auf dem Tab Import.
Datenimport starten über den Tab „Import“

Text aus einem PDF-Dokument als eigenes Text-Dokument

Nachdem ein PDF-Dokument in ein MAXQDA-Projekt importiert wurde, können Sie den Text aus dem PDF-Dokument extrahieren. Bilder und Formatierungen werden dabei ignoriert, es wird nur der reine Text als neues Text-Dokument in der „Liste der Dokumente“ eingefügt.

Klicken Sie hierzu auf ein PDF-Dokument in der „Liste der Dokumente“ und wählen Sie die Funktion PDF-Text als neues Dokument einfügen aus. Direkt unterhalb des angeklickten Dokuments erscheint der neue Text.

Funktion aus dem Kontextmenü eines PDF-Dokuments aufrufen
Tipp: Bei vielen PDF-Texten wird es durch die Umwandlung möglich, bei der lexikalischen Suche innerhalb von Absätzen zu suchen.

Besonderheiten von PDF-Dokumenten

Bei der Arbeit mit PDF-Dokumenten gibt es einige Besonderheiten zu beachten, da das PDF-Format von seiner Technologie her nicht für die Textbearbeitung ausgelegt ist, sondern ursprünglich als Layout-Format für den Druck konzipiert wurde und da die Dokumente deutlich größer sein können als einfache Text-Dokumente.

Tipp: Manche PDF-Dateien enthalten Seiten sowohl im Hoch- als auch im Querformat oder Seiten in verschiedenen Größen. MAXQDA orientiert sich bei der Anzeige der Seiten an der ersten Seite der PDF-Datei. Sollte Ihre PDF-Datei Seiten mit unterschiedlichen Ausrichtungen beinhalten, ist es ratsam, diese vor dem Import in MAXQDA in einem PDF-Bearbeitungsprogramm alle in die gleiche Ausrichtung zu drehen. Sollte die Titelseite kleiner sein, als die restlichen Seiten, ist es ratsam, diese Seite vor dem Import in MAXQDA zu löschen.

PDF-Dateien außerhalb der MAXQDA-Projektdatei speichern

Standardmäßig werden alle PDF-Dateien, die kleiner als 5 MB groß sind, beim Einfügen in das MAXQDA-Projekt auch in diesem gespeichert. PDF-Dateien, die größer als 5 MB sind, werden beim Import in ein MAXQDA-Projekt nicht physisch im Projekt selbst gespeichert, sondern im Ordner für externe Dateien abgelegt, und es wird nur eine Referenz auf die extern gespeicherte Datei erzeugt.

Sie können sowohl den Schwellenwert von 5 MB als auch den Speicherort für extern gespeicherte Dokumente in den Einstellungen von MAXQDA anpassen. Die Einstellungen rufen Sie über das Zahnrad am oberen rechen Fensterrand auf.

Tipp: Wenn Sie mit sehr vielen großen PDF-Dateien arbeiten (z.B. mit einer Gesamtgröße von mehr als 1 GB), ist es sinnvoll diese extern zu speichern, damit die MAXQDA-Datei klein bleibt und leicht gesichert werden kann. Für die Performance ist wichtig, dass der Ort für extern gespeicherte Dateien auf der lokalen Festplatte liegt und möglichst nicht in einem Netzwerk, wenngleich dies bei schneller werdenden Netzwerken immer weniger ein Problem darstellen mag.

Text- und Bildsegmente codieren

In PDF-Dokumenten kann mit der Maus sowohl Text selektiert und codiert werden als auch ein Bildrahmen aufgezogen werden, der codiert werden kann. Bei der Anzahl der Codehäufigkeiten nimmt MAXQDA keine Unterscheidungen zwischen Bild- und Textcodierungen vor, wohl aber bei der Segment-Suche: Wenn nach Überschneidungen gesucht wird, dann wird jeweils getrennt nach Überschneidungen, einerseits von Bildsegmenten andererseits von Textsegmenten, gesucht. Überschneidungen von Bildsegmenten mit Textsegmenten werden ignoriert. Die Funktion „Nähe“ von Bildsegmenten liefert immer 0 Treffer, sowohl bei der Komplexen Segment-Suche als auch beim Code-Relations-Browser.

Wenn Texte als eingescannte PDF-Dateien vorliegen, muss vor dem Import in MAXQDA mit einem geeigneten Programm eine Texterkennung (eine sogenannte OCR-Erkennung) durchgeführt werden, damit man später in MAXQDA Text markieren und codieren kann – sonst lassen sich nur Bildsegmente markieren.

Keine Absätze in PDF-Dateien

PDF-Dokumente weisen – anders als Textdokumente – per se keine Absatzstruktur auf. Funktionalitäten von MAXQDA, die auf Absätzen basieren, können daher bei PDF-Dokumenten nicht verwendet werden. Hierzu gehören die automatische Codierung mit dem Kontext „Absatz“ sowie die Funktion „Nähe“ von Segmenten bei der Komplexen Segment-Suche oder dem Code-Relations-Browser.

Navigieren im „Dokument-Browser“

Sobald ein PDF-Dokument im Dokument-Browser angezeigt wird, erscheinen in dessen Symbolleiste mehrere Icons für die Dokument-Navigation, die jederzeit klickbar sind: Sie können seitenweise vor- und zurückblättern, den Zoom einstellen und die Lesezeichen aufrufen (manche PDF-Dateien besitzen eigene Lesezeichen, etwa an jedem Kapitel).

Hinweis: Die Darstellung von PDF-Inhalten in MAXQDA unterstützt keine Formularinhalte. Damit Inhalte aus PDF-Formularen angezeigt werden, empfiehlt es sich, das PDF vor dem Import über einen PDF-Drucker in eine neue PDF-Datei abzuspeichern, welche die Formulareinträge als reinen Text enthält.

Suchen in PDF-Dateien

Bitte beachten Sie, dass eine Silbentrennung in PDF-Dokumenten bei der Suche nicht automatisch erkannt bzw. berücksichtigt werden kann. Wenn also am Ende einer Zeile in einem PDF-Dokument der Wortanfang „Klima-“ steht, wird MAXQDA das ganze Wort „Klimawandel“ nur finden, wenn man mit Platzhaltern arbeitet, z.B. „Klima-??wandel“. Die zwei Fragezeichen stehen stellvertretend für den Zeilenumbruch und müssen an allen möglichen Trennungen des gesuchten Wortes eingefügt werden. Eine Suche nach allen möglichen Trennungen von „Klimawandel“ würde dann also folgende vier Suchbegriffe beinhalten: Klimawandel, Kli-??mawandel, Klima-??wandel, Klimawan-??del.

War diese Seite hilfreich?