PDF Schwärzung – Panne bei den AstraZeneca-Verträgen
Wie das Debakel mit dem Impfstoffvertrag von AstraZeneca deutlich macht, geht es beim Redigieren von PDFs nicht nur um die Seite, sondern auch um andere Objekte, die geprüft werden müssen.Was ist passiert?
Nach dem korrekten «Schwärzen» der Textpassagen auf der Seite wurde übersehen, auch die Lesezeichen, die auf geschwärzte Inhalte verweisen, inhaltlich anzupassen. Die vertraulichen Informationen wurden zwar auf der Seite entfernt – fanden sich aber unverändert in den Lesezeichen wieder.
Siehe dazu den Spiegel Online Beitrag vom 29.01.2021 «Das steht in den geschwärzten Passagen des AstraZeneca-Vertrags. Der EU-Kommission ist bei der Veröffentlichung des Impfstoff-Vertrags mit AstraZeneca offenbar eine schwere Panne unterlaufen: Teile geschwärzter Passagen sind lesbar – und enthalten einige interessante Informationen.»
Es ist immer kritisch, wenn vertrauliche Informationen in die Öffentlichkeit und/oder falsche Hände geraten. Dass in diesem Fall die Text-Seite technisch korrekt geschwärzt wurde, entbindet nicht von der Pflicht, weitere PDF-Objekte genauer zu betrachten.
Funktionen, auf die Sie bei einer PDF-Software zum Schwärzen achten sollten
Eine umfassende Schwärzung von PDF-Dokumenten deckt die folgenden Bereiche ab:
- Dokument- und Objekteigenschaften
- Titel, Thema, Autor, Stichworte
- Metadaten inkl. XMP
- Objekt-Metadaten, insbesondere in Bildern
- Navigationselemente
- Lesezeichen (wie beim AstraZeneca-Fall!)
- Links und Verweise
- Tags für Barrierefreiheit
- Inhalte
- Via Texterkennung generierte Texte überprüfen und ggf. entfernen. Das gilt auch für unsichtbare Texte mit der Schriftfarbe weiss auf weissem Grund.
- Bildebenen überprüfen, eventuell gibt es verdeckte Negativformen.
- Anlagen und eingebettete Dateien sichten.
- JavaScripts
- Private Daten
- Versteckte Inhalte in zusätzlichen Objekten, die vom PDF-Reader ignoriert und nicht zur Ansicht gebracht werden.
Erste Hilfe vor und nach dem Verteilen von geschwärzten PDF Dokumenten
Das geschwärzte PDF-Dokument ausdrucken, einscannen und die Texterkennung über das neue PDF Dokument laufen lassen.
Vorteile
- Durch einen neuen Dokumentennamen und fehlende Metdaten werden Hinweise zum Ersteller verschleiert.
- Alle «unsichtbaren» Inhalte können nicht weiterverteilt werden.
Nachteile
- Dokumentengröße – die Dateigröße kann schnell mal um den Faktor 4 ansteigen
- Das behindert einen schnellen Download und nachgelagerte Nutzung
- Alle Navigationselemente und Verweise müssen neu erzeugt werden
- Alle Tags für barrierefreie Nutzung müssen neu erstellt werden
- Digitale Bildnachweise und andere Urheberangaben fehlen
Es gibt eine Vielzahl von Lösungen für die Schwärzung von Inhalten; siehe die Kategorie Schwärzung im Produktindex der PDF Association. Neben der Anonymisierung kann auch eine Pseudonymisierung erforderlich sein. In diesem Fall wird jede Schwärzung durch Codes gekennzeichnet, die den Zweck der Schwärzung angeben.