PDF Schwärzung – Panne bei den AstraZeneca-Verträgen

Michael Karbe is CEO of Actino Software and has been a member of the PDF Association since its founding in 2006. His company supports organizations and institutions in digitizing processes using PDF. Through sales and development of a wide variety of applications from specialised partners, Actino Software is very familiar … Read more
Was ist passiert?

Nach dem korrekten «Schwärzen» der Textpassagen auf der Seite wurde übersehen, auch die Lesezeichen, die auf geschwärzte Inhalte verweisen, inhaltlich anzupassen. Die vertraulichen Informationen wurden zwar auf der Seite entfernt – fanden sich aber unverändert in den Lesezeichen wieder.
Siehe dazu den Spiegel Online Beitrag vom 29.01.2021 «Das steht in den geschwärzten Passagen des AstraZeneca-Vertrags. Der EU-Kommission ist bei der Veröffentlichung des Impfstoff-Vertrags mit AstraZeneca offenbar eine schwere Panne unterlaufen: Teile geschwärzter Passagen sind lesbar – und enthalten einige interessante Informationen.»
Es ist immer kritisch, wenn vertrauliche Informationen in die Öffentlichkeit und/oder falsche Hände geraten. Dass in diesem Fall die Text-Seite technisch korrekt geschwärzt wurde, entbindet nicht von der Pflicht, weitere PDF-Objekte genauer zu betrachten.
Funktionen, auf die Sie bei einer PDF-Software zum Schwärzen achten sollten
Eine umfassende Schwärzung von PDF-Dokumenten deckt die folgenden Bereiche ab:
- Dokument- und Objekteigenschaften
- Titel, Thema, Autor, Stichworte
- Metadaten inkl. XMP
- Objekt-Metadaten, insbesondere in Bildern
- Navigationselemente
- Lesezeichen (wie beim AstraZeneca-Fall!)
- Links und Verweise
- Tags für Barrierefreiheit
- Inhalte
- Via Texterkennung generierte Texte überprüfen und ggf. entfernen. Das gilt auch für unsichtbare Texte mit der Schriftfarbe weiss auf weissem Grund.
- Bildebenen überprüfen, eventuell gibt es verdeckte Negativformen.
- Anlagen und eingebettete Dateien sichten.
- JavaScripts
- Private Daten
- Versteckte Inhalte in zusätzlichen Objekten, die vom PDF-Reader ignoriert und nicht zur Ansicht gebracht werden.
Erste Hilfe vor und nach dem Verteilen von geschwärzten PDF Dokumenten
Das geschwärzte PDF-Dokument ausdrucken, einscannen und die Texterkennung über das neue PDF Dokument laufen lassen.
Vorteile
- Durch einen neuen Dokumentennamen und fehlende Metdaten werden Hinweise zum Ersteller verschleiert.
- Alle «unsichtbaren» Inhalte können nicht weiterverteilt werden.
Nachteile
- Dokumentengröße – die Dateigröße kann schnell mal um den Faktor 4 ansteigen
- Das behindert einen schnellen Download und nachgelagerte Nutzung
- Alle Navigationselemente und Verweise müssen neu erzeugt werden
- Alle Tags für barrierefreie Nutzung müssen neu erstellt werden
- Digitale Bildnachweise und andere Urheberangaben fehlen
Es gibt eine Vielzahl von Lösungen für die Schwärzung von Inhalten; siehe die Kategorie Schwärzung im Produktindex der PDF Association. Neben der Anonymisierung kann auch eine Pseudonymisierung erforderlich sein. In diesem Fall wird jede Schwärzung durch Codes gekennzeichnet, die den Zweck der Schwärzung angeben.