MAXQDA erkennt den Text in einigen PDF-Dateien nicht vollständig/korrekt
reproduzieren
- PDF herunterladen https://www.lehrplanplus.bayern.de/fachlehrplan/realschule/6/geographie#66301 (der Downloadbutton befindet sich unten auf der Seite „PDF erstellen“)
- PDF in MAXQDA importieren
- Text in MAXQDA markieren, kopieren und in Texteditor einfügen ODER
Insert PDF Text as New Document
Hinweis: Es wurde keine Texterkennung/OCR verwendet
[Nachtrag: Der Text in dem PDF ist als Text enthalten; das PDF enthält keine gescannten Textstellen, die mit Texterkennungssoftware bearbeitet wurden.]
MAXQDA findet folgenden Text:
Kompetnzerwatunge
Die Schülerine undSchüler . • beschreibn diephysiche Grundstrukr Euopas undverbalisern
Lagebziehunge marknter opgrafischer Elemnte. • grenz Europa nch unterschiedlchen atur- nd
kultrgeoraphiscen Kriten abund bilen sinvole Tilräume
(z. B Südeuropa). Hierzu benen udveroten sieunter
Zuhilfenahme ginetr Katen dieStaen Europas owie
ausgewählte Hauptsädte undorne dies denjweilgn
Teilräumen zu.
(originaldatei, P. 0: 166)
andere Programme (Adobe, Okular, DocumentViewer, pdftotext) finden folgenden Text:
Kompetenzerwartungen
Die Schülerinnen und Schüler ...
• beschreiben die physische Grundstruktur Europas und verbalisieren
Lagebeziehungen markanter topografischer Elemente.
• grenzen Europa nach unterschiedlichen natur- und
kulturgeographischen Kriterien ab und bilden sinnvolle Teilräume
(z. B. Südeuropa). Hierzu benennen und verorten sie unter
Zuhilfenahme geeigneter Karten die Staaten Europas sowie
ausgewählte Hauptstädte und ordnen diese den jeweiligen
Teilräumen zu.
Erwartetes Verhalten
MAXQDA zeigt den gleichen Text wie andere PDF-Programme
Workaround
mit folgendem Skript konnte die Datei für MAXQDA lesbar gemacht werden
for i in originaldatei.pdf;
do gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=fixed-$i $i;
done
Zusatzinformationen zur PDF-Datei
$ qpdf -check originaldatei.pdf
checking originaldatei.pdf
PDF Version: 1.4
File is not encrypted
File is not linearized
No syntax or stream encoding errors found; the file may still contain
errors that qpdf cannot detect
$ pdfinfo originaldatei.pdf
Title: LehrplanPLUS PDF-Sammlung - 21.07.2020
Author: Staatsinstitut für Schulqualität und Bildungsforschung
Creator: RealObjects PDFreactor(R) 8.2.8867, Serial No: 3738, Licensed for: ISB Bayern
Producer: RealObjects PDFreactor(R) 8.2.8867, Serial No: 3738, Licensed for: ISB Bayern
CreationDate: Tue Jul 21 13:40:50 2020 CEST
ModDate: Tue Jul 21 13:40:50 2020 CEST
Tagged: no
UserProperties: no
Suspects: no
Form: none
JavaScript: no
Pages: 7
Encrypted: no
Page size: 595.29 x 841.89 pts (A4)
Page rot: 0
File size: 60682 bytes
Optimized: no
PDF version: 1.4
Version: MAXQDA 2020
System: Windows 10