Hybride Archivierung mit PDF/A-3

The PDF Association staff delivers a vendor-neutral platform in service of PDF’s stakeholders.


Der dritte Normteil von PDF/A bietet im Vergleich zu PDF/A-2 nur ein zusätzliches Feature. Das hat es aber in sich und bietet enormes Potential zur Optimierung dokumentenbasierter Prozesse und ermöglicht die sogenannte hybride Archivierung. Mit PDF/A-3 ist es nämlich möglich, auch nicht PDF/A-konforme Dateien wie CSV-, XML- oder Office-Dateien als Attachment einzubetten.
Will man PDF/A-3 richtig nutzen, ist es erforderlich, zwischen dem Archivteil und dem Nicht-Archivteil zu unterscheiden. Beide haben unterschiedliche Ansprüche: Der Archivteil soll dauerhaft aufbewahrt werden und muss damit weiterhin den bekannten PDF/A-Konventionen entsprechen. Der Lebenszyklus ist also lang, um nicht zu sagen, unendlich. Die eingebettete Datei kann in derselben Datei aber mitarchiviert werden. Sie beinhaltet Zusatzinformationen, die aber vielleicht nur für eine gewisse Zeit relevant sind. Selbst wenn sie in wenigen Jahren nicht mehr lesbar sein sollte, ist immer noch das archivtaugliche Pendant vorhanden.
PDF/-3 ist ein kompatibler Archiv-Container für viele Quellen
PDF/A-3 lässt sich sowohl mit digital erzeugten als auch mit gescannten Dokumenten sehr gut verwenden. Bei Born Digital-Dokumenten steht die hybride Archivierung als Anwendungsfall erster Stelle, die durch die Verwendung von PDF/A-3 wesentlich verbessert wird.
PDF/A-3 fordert, dass die eingebetteten Dateien einen Typ haben müssen und anhand dieser kann man die praktischen Anwendungsfälle gut erkennen:
- SOURCE sollte das Quell-Dokument sein und einfachsten Fall z.B. eine Powerpoint-Präsentation, die in die langzeitsichere PDF/A-3 Version eingebettet wird.
- DATA können z.B. Rohdaten aus Messgeräten sein, die in den PDF-Bericht eingebettet werden.
- SUPPLEMENT ist für begleitende Daten gedacht und natürlich kann eine PDF/A-3 Datei beliebig viele Dateien einbetten.
- ALTERNATE ist eine alternative Darstellung und hier ist sehr aktuell ZUGFeRD für elektronische Rechnungen das Parade-Pferd: In diesen PDF/A-3-Dateien sind dann die visuell erfassbare Rechnung im PDF/A-Format sowie ein maschinell verarbeitbarer XML-Datensatz gemäß ZUGFeRD-Datenmodell enthalten.
Auch für die sichere E-Mail Archivierung eignet sich PDF/A-3 hervorragend. Die Attachments können eingebettet und werden zusätzlich noch in PDF/A konvertiert. Je nach Anforderungen kann die komplette Mail als .eml oder .msg eingebettet werden oder jedes Attachment einzeln.
Mit PDF/A-3 lässt sich die hybride Archivierung von unterschiedlichen Dokumenten und Typen optimal realisieren und logisch zusammenhängende Dateien bilden ein komplettes Archivobjekt. Bei digitalen Dokumenten kann die Archivierung früher im Dokumentenlebenszyklus integriert werden, ohne dabei die Möglichkeit der weiteren Bearbeitung aufzugeben. Gescannte Dokumente sind leichter verarbeitbar, denn deren Metadaten sind untrennbar mit der archivtauglichen Rendition verbunden.