PDF Association logo

Discover pdfa.org

Key resources

Get involved

How do you find the right PDF technology vendor?
Use the Solution Agent to ask the entire PDF communuity!
The PDF Association celebrates its members’ public statements
of support
for ISO-standardized PDF technology.

Member Area

XMP-Unterstützung in PDFlib-Produkten

Metadaten stellen eine Art Visitenkarte für ein digitales Dokument dar. Sie enthalten in der Regel einen Satz von Eigenschaften (Properties), wobei jede dieser Properties über eine bestimmte Bedeutung im Dokumentkontext verfügt, wie z.B. Titel und Verfasser eines PDF-Dokuments oder die GPS-Position, an der ein Bild aufgenommen wurde.

Metadaten stellen eine Art Visitenkarte für ein digitales Dokument dar. Sie enthalten in der Regel einen Satz von Eigenschaften (Properties), wobei jede dieser Properties über eine bestimmte Bedeutung im Dokumentkontext verfügt, wie z.B. Titel und Verfasser eines PDF-Dokuments oder die GPS-Position, an der ein Bild aufgenommen wurde. Metadaten spielen eine immer wichtigere Rolle im Umgang mit digitalen Dokumenten über deren gesamte Lebensdauer.

Das Standardformat für Metadaten – XMP

Das Format für Metadaten, Extensible Metadata Platform (XMP), basiert auf XML und wurde 2001 von Adobe konzipiert und als ISO 16684-1:2012 standardisiert. XMP-Metadaten wandern mit der Datei mit und lassen sich außer in PDF in viele gängige Dateiformate wie TIFF und JPEG einbetten. Bei XMP ist zudem gewährleistet, dass Metadaten auch bei Formatkonvertierungen, z.B. von gescanntem TIFF nach PDF, erhalten bleiben. XMP ist in allen Publishing-Produkten von Adobe implementiert und wird von zahlreichen unabhängigen Software-Anbietern und Anwendervereinigungen unterstützt.

Die in den Metadaten enthaltenen Properties werden zu Schemas zusammengefasst. Außer vordefinierten Schemas (z.B. Dublin Core) können auch benutzerdefinierte Schemas erstellt werden, wenn firmen- oder branchenspezifische Metadaten benötigt werden. Mehrere ISO-Standards spezifizieren PDF-Teilmengen für bestimmte Anwendungsgebiete wie Archivierung (PDF/A) oder Druck (PDF/X-4 und PDF/X-5). Mit Ausnahme der älteren Standards PDF/X-1 und PDF/X-3 berücksichtigen alle die Verwendung von XMP-Metadaten (diese sind meist obligatorisch).

XMP-Unterstützung in Produkten PDFlib GmbH

PDFlib-Produkte bieten weitreichende Unterstützung für XMP in PDF:

PDFlib-Produktfamilie: Mit PDFlib lassen sich PDF-Dokumente mit XMP-Metadaten auf Dokument-, Seiten- oder Bildebene erstellen. Sie können XMP für PDF/A erstellen, ohne sich um die Einzelheiten des XMP-Formats kümmern zu müssen. Fortgeschrittene Benutzer können alle vordefinierten XMP-Metadatenschemas an PDFlib übergeben, um sie in die generierten PDF-Dokumente einzubetten. Da PDFlib auf allen relevanten Betriebssystemen verfügbar ist und keine Produkte von Fremdanbietern voraussetzt, ist XMP-Unterstützung auf allen Plattformen gewährleistet.

Einfügen von XMP in PDF mit PLOP und PLOP DS: Mit PDFlib PLOP und PLOP DS lässt sich XMP in vorhandene PDF-Dokumente einfügen, falls PDF-Dokumente z.B. noch nicht alle erforderlichen Metadaten-Properties enthalten. Profitieren können hier insbesondere PDF/A-Workflows, da die XMP-Unterstützung von PLOP und PLOP DS die Konformität zu PDF/A erhält. So kann benutzerdefiniertes XMP mit Extension-Schemas in existierende PDF/A-Dokumente eingebracht werden, die aus Workflows stammen, die keine Extension-Schemas unterstützen.

Extrahieren von XMP mit pCOS: PDFlib bietet mit der produktübergreifenden pCOS-Schnittstelle die Möglichkeit, verschiedenste Informationen aus PDF-Dokumenten abzufragen. pCOS bietet eine einfache Programmiermethode, um XMP-Metadaten aus PDF-Dokumenten auf Dokument-, Seiten- und Bildebene zu extrahieren. XMP-Metadaten werden in Unicode normalisiert, so dass Sie sich nicht um Encoding-Fragen kümmern müssen. Die XMP-Extraktion erfolgt unabhängig von Kompression, Verschlüsselung und PDF-Objektstruktur. pCOS durchläuft in jedem Fall die PDF-Objektstruktur und findet die XMP-Metadaten zuverlässig.

Suche nach XMP-Metadaten mit TET PDF IFilter: PDFlib TET PDF IFilter implementiert die IFilter-Schnittstelle von Microsoft und kann mit verschiedenen von Microsoft und anderen Herstellern angebotenen Produkten zur computer- oder unternehmensweiten Suche eingesetzt werden, zum Beispiel mit Microsoft Search, Microsoft SharePoint oder SQL Server. Neben Seiteninhalten werden auch XMP-Metadaten sowie Standard- und benutzerdefinierte Dokument-Infofelder indexiert. Mit TET PDF IFilter lassen sich Metadaten auch in den indexierten Rohtext integrieren. Damit können auch Volltextsuchmaschinen ohne Metadaten-Unterstützung (z.B. SQL Server) nach Metadaten suchen.

PDFlib Text and Image Exctraction Toolkit (TET): bindet XMP in XML ein, das aus PDF-Dokumenten erzeugt wurde.


PDFlib GmbH is completely focused on PDF technology. Customers worldwide use PDFlib products since 1997. The company closely follows development and market trends, such as ISO standards for PDF. PDFlib GmbH products are distributed in 100 countries all over the world with major markets in North America, Europe, and Japan….

Read more
WordPress Cookie Notice by Real Cookie Banner