PDF – Ein Format, viele Möglichkeiten

Was sind eigentlich PDF bzw. PDF/A?

Langzeitarchivierung kommt ohne PDF/A-Standard nicht aus

Wir sind tagtäglich mit einer Vielzahl unterschiedlicher Inhalte konfrontiert: E-Mails, CAD-Dateien, JPGs und andere Bildformate sowie Office-Dateien in verschiedenen Varianten. Viele von ihnen müssen aus rechtlichen Gründen aufbewahrt werden – Rechnungen und Verträge zum Beispiel. Werden diese Dokumente in ihrem ursprünglichen Format aufbewahrt, so ist die Gefahr groß, dass sie nach Jahren nicht mehr lesbar sind. Und damit ist nicht unbedingt nur die physikalische Haltbarkeit der Datenträger gemeint. Denn es ist fraglich, ob heutige digitale Speichermedien aufgrund regelmäßiger Aktualisierung von Programmen in ein paar Jahren überhaupt noch geöffnet werden können. Denken Sie zum Beispiel einmal daran, dass Sie zwar Dokumente, die mit Microsoft Word Version 1997 erstellt worden sind, noch mit der Programmversionen 2013 öffnen können – andersherum dürften Sie aufgrund fehlender Abwärtskompatibilität deutliche Schwierigkeiten haben.

Die Haltbarkeit der Trägermedien und der schnelle Medien- und Systemwandel sind zwei Probleme, die der Langzeitarchivierung digitaler Inhalte im Wege stehen. Obendrein ist nicht jedes Dateiformat auch für die zukunftssichere Aufbewahrung von Inhalten gleichermaßen geeignet: Können beispielsweise verknüpfte, externe Bilder nicht gefunden werden, wird die Seite nicht wie gewünscht angezeigt. Eine revisionssichere Aufbewahrung wäre damit gescheitert. Aus diesem Grund ist für die Archivierung eine konsequente Konvertierung in ein Format notwendig, welches die langfristige Reproduzierbar- und Lesbarkeit sicherstellt. Der ISO-Standard PDF/A ist hierfür das Format erster Wahl.

Durchbruch bei der Aufbewahrung von Dateien

PDF/A-Standard 1993 entwickelte Adobe Systems das PDF – ein plattformunabhängiges Dateiformat für elektronische Schriftstücke.

Es ermöglicht bis heute ein Schriftstück unabhängig vom ursprünglichen Anwendungsprogramm, vom Betriebssystem oder von der Hardwareplattform originalgetreu wiederzugeben. Nach der Installation von Acrobat Pro stand im Druckdialog in Word die Option PDF zur Verfügung. Mit diesem Format vereinfachte Adobe das Datenmanagement und den Datenaustausch für unterschiedliche Branchen enorm, denn mit dem neuen PDF-Standard ließen sich plötzlich etliche Klippen bei der Dokumentenweitergabe oder der Aufbewahrung von Dateien elegant umschiffen.

Denn während Formate wie Papier, Mikrofilm und das Bildformat TIFF zwar grundsätzlich lange archivier- und reproduzierbar sind und insbesondere TIFF-Dateien im Gegensatz zu Papier schnell und unkompliziert versendet werden kann, ist es nur unter größtem Aufwand möglich, diese klassischen Archivierungsformate nach gezielten Informationen abzusuchen. Ein PDF hingegen ist schnell durchsuchbar und kann neben Text, Bildern und Grafik auch Hilfen enthalten, die die Navigation innerhalb des Schriftstückes erleichtern.

Zahlreiche Vorteile

  • PDF umfasst strukturierte Objekte (Text, Vektorgraphik, gerastertes Bild). Diese ermöglichen eine effiziente Suchabfrage im gesamten Datenarchiv.
  • PDF lässt sich kompakt und effizient komprimieren. Besonders für den elektronischen Datenverkehr, z.B. E-Mail-Anhänge oder via Dateitransfer (FTP), ist die geringere Dateigröße vorteilhaft.
  • Metainformationen (bspw. Verfasser, Thematik, Inhalt, Schlagwörter, Datum der Entstehung) werden direkt in einem standardisierten Format (XMP) in die PDF-Datei eingebettet. Daher lässt sie sich automatisch, systematisch und ohne manuelle Arbeit weiterverarbeiten.
  • Das PDF Format ist in der Regel so konzipiert, dass es nicht an ein bestimmtes Gerät (bzw. Rasterauflösung, Farbsystem) gebunden ist. Dadurch passen sich die PDF Dokumente an die technologische Entwicklung der Ausgabegeräte (Drucker, Bildschirm, Scanner) an und sind auch Jahre nach ihrer Erstellung aktuell.

PDF/A erstellen

Kein Wunder also, dass man begann, das PDF als Standard für Langzeitarchivierung in Betracht zu ziehen. Adobe Systems überarbeitet seit Jahren das PDF immer weiter. Um neue Funktionen zu erweitern und unnötige zu entfernen, war es deshalb unumgänglich, einen dauerhaften, beständigen und international gültigen Standard für die Langzeitarchivierung zu entwickeln. Dieser sollte aufgrund der Vorteile, die das PDF bietet, auf Adobes PDF aufbauen. Das Ergebnis: PDF/A-Standard.

Im September 2005 wurde der PDF/A-Standard für das regelkonforme Archivieren elektronischer Dokumente definiert. Er bewertet und regelt, welche PDF-Funktionen bezüglich der Archivierung sicher sind. Unter Zusammenarbeit von Unternehmen und Organisationen entstand ein plattformunabhängiges Dateiformat für elektronisch archivierte Dokumente. Dieses garantiert eine langfristige Lesbarkeit von Dokumenten – und zwar unabhängig davon, mit welcher Anwendungssoftware und auf welchem Betriebssystem sie ursprünglich erstellt wurden.

Warum PDF/A-Standard und nicht einfach PDF?

Mit seinen Container-Eigenschaften und der Fähigkeit einzelne Bestandteile plattformunabhängig layoutgetreu darzustellen, ist das PDF als Archivdokument ideal geeignet.

Jede PDF/A-Datei ist immer auch eine PDF-Datei

Damit das PDF jedoch eine exakt reproduzierbare Darstellung von Inhalten garantiert, müssen einige bestimmte Vorgaben eingehalten werden. Dazu gehört beispielsweise der vollständige Zugriff auf alle zum Dokument gehörenden Elemente. Schriften beispielsweise müssen eingebettet sein, damit ein Rechner auch in Jahren Sonderzeichen oder Symbole noch richtig darstellt, selbst, wenn die im Dokument vorgesehene Schrift nicht auf dem Rechner installiert ist. Interaktive Elemente oder PDF-Ebenen hingegen sind nicht erlaubt: Interaktive Elemente oder PDF-Ebenen hingegen sind nicht erlaubt: Sie verhindern die Eindeutigkeit, die eine PDF/A-Datei haben muss. Bei einem PDF mit mehreren Ebenen wüsste man beispielsweise bei einer Druckausgabe in 40 Jahren nicht mehr, welche Ebene gelten soll.

Einsatzszenarien: So profitieren wir vom PDF/A-Standard

Da sich ganz unterschiedliche Inhalte als PDF sichern lassen, ist die Norm für alle Branchen geeignet. Ein paar Beispiele sollen die Einsatzmöglichkeiten zeigen – und seien Sie gespannt: Diese gehen über die bloße Archivierung hinaus.

Aufbewahrung von Broschüren, Handbüchern und Bedienungsanleitungen

PDF/A-Standard Mit jedem neu erworbenen Elektrogerät, Möbelstück, Spielzeug oder Sportgerät, kommt mal ein Handzettel, dann ein Booklet und manchmal ein ganzes Pamphlet mit ins Haus. Nun gehört es zum Wesen von papiergebundenen Handbüchern, dass sie immer dann verschwunden sind, wenn sie gebraucht werden. Ein Karton mit allen Anleitungen darin könnte eine Lösung sein. Oder besser noch: Ein Ordner auf der Festplatte. Denn die meisten Hersteller bieten Benutzerhandbücher zum kostenlosen Download auf ihren Webseiten an: Gesichert als PDF und nach Wahl benannt, können sie nicht mehr verlorengehen. Und im Zweifelsfall ist der Computer schneller hochgefahren und das benötigte Stichwort dank Volltextsuche schneller gefunden als die Abstellkammer durchwühlt.

Weitergabe von Druckdaten

Zwar wurde der PDF-Standard häufig zur Archivierung genutzt. Es gibt aber auch Varianten, die im Graphik- und Druckbereich zum Einsatz kommen. Und zwar dann, wenn Sie zum Beispiel Bild- und Druckdaten an Druckereien weitergeben möchten. So garantiert z.B. PDF/X die Konsistenz der Daten. Pannen mit nicht eingebetteten Schriften, die beispielsweise zu „Buchstabensalat“ führen, sind ausgeschlossen. Die vorlagengetreue Übermittlung der Daten bis zum Druck mit farbgetreuer Wiedergabe im CMYK-Farbmodell wird dadurch ermöglicht.

Das Farbmanagement verhindert zu blasse oder zu bunte Farben bzw. Bilder, denn PDF/A sorgt für eine verbindliche Darstellung von Farben. Zudem vermeidet PDF/A viele Verarbeitungsprobleme, die beispielsweise durch passwortgesicherte PDF-Dokumente oder bei der Druckausgabe von Dateien auftreten können.

Umwandlung von E-Mail Anhängen zum Schutz vor Schadcode

PDF/A-Standard Immer häufiger missbrauchen Hacker Office Dokumente, um versteckte Trojaner in Makros zu verbreiten. Die Umwandlung von Office-Dokumenten in PDF kann darin eingebetteten, aktiven Schadcode an seiner Ausführung hindern.

So erlaubt beispielsweise auch unsere Lösung iQ.Suite Convert die Umwandlung von E-Mail-Anhängen ins PDF- oder ZIP-Format. E-Mails mit potentiell gefährlichen Office Dokumenten werden angehalten und mit iQ.Suite Convert in PDF umgewandelt. Der Empfänger erhält den ursprünglichen Anhang als PDF-Datei. Aktiver Schadcode ist nun keine Bedrohung mehr. Eine Antivirus-Lösung, wie beispielsweise unsere iQ.Suite Watchdog, kann anschließend den originalen E-Mail-Anhang einer erneuten Virus-Prüfung unterziehen. Wird die Datei dabei als ungefährlich bewertet, erfolgt die Zustellung an den Empfänger im ursprünglichen Format.

Vereinheitlichung von Dateiformaten

Apropos E-Mail-Anhänge: Es ist nicht immer sinnvoll, E-Mail-Anhänge im Original zu versenden. Insbesondere wenn der Empfänger Historien in Office-Dokumenten nicht sehen soll oder sichergestellt werden soll, dass dem Empfänger der Anhang so dargestellt wird, wie der Autor es vorgesehen hat, ist PDF eine sinnvolle Alternative. Ob Office Dokumente oder Bilder – unzählige Formate lassen sich konvertieren und als PDF versenden. Übrigens übernimmt auch iQ.Suite Convert diese Aufgabe, wobei Sie selbst anhand von Dateityp oder -größe entscheiden, welche Anhänge umgewandelt werden.

PDF-basierte E-Mail-Verschlüsselung

Der sichere Versand von E-Mails an Kunden ohne eigene Verschlüsselungslösung ist für viele Unternehmen eine Herausforderung. Denn entweder sind die verwendeten Lösungen zu komplex und stören durch ihr aufwändiges Schlüsselmanagement einen reibungslosen Ablauf. Oder es ist nicht sichergestellt, dass beide Kommunikationspartner das identische Verfahren bzw. die gleiche Software einsetzen.

PDF/A-Standard Eine Verschlüsselungslösung, die solche Hindernisse überwindet, ist unser iQ.Suite PDFCrypt. Zur Verschlüsselung von E-Mails setzt sie auf den PDF-Standard und kommt deshalb ohne Schlüssel, Zertifikate oder Installation von Software auf Empfängerseite aus. Eine E-Mail wird inklusive ihrer Anhänge automatisiert in eine verschlüsselte PDF-Datei umgewandelt und dem Empfänger zugestellt. Wie es dem Wesen des PDFs entspricht, bleiben dabei alle Anhänge in ihrem ursprünglichen Format erhalten. Der Empfänger öffnet dann einfach mit Hilfe eines PDF-Readers und eines ihm zugesandten Passworts die verschlüsselte PDF-Datei im Mail-Client.

Hochvolumige Herstellung von Archiv-PDF-Dateien

Der PDF- bzw. PDF/A-Standard eignet sich auch zur Archivierung von Inhalten nicht länger benötigter Geschäftsanwendungen. Wir haben uns diese Eigenschaften beispielsweise zunutze gemacht, um ganze Geschäftsanwendungen zu archivieren. Konkret nutzen wir diese Technologien im GBS Retirement Manager, mit dessen Hilfe ungenutzte IBM Notes Datenbanken abgeschaltet und die Inhalte in ein einheitliches PDF-Format überführt werden, wodurch eine zukünftige, plattformübergreifende Nutzung überhaupt erst möglich wird. Denn im PDF-Standard bleiben nicht nur die Inhalte und zusätzliche Metadaten erhalten, sondern auch das originale Erscheinungsbild. Gleichzeitig erfüllt das langlebige PDF/A-Format auch hier höchste Revisionssicherheit. Die erzeugten PDF-Dateien können in Kombination mit dem GBS AppDesigner dann sogar im Browser zugänglich gemacht und Anwendern in Microsoft SharePoint oder IBM Connections zur Verfügung gestellt werden.

Für welche Anwendungsfälle nutzen Sie das PDF-Format? Wir freuen uns über Ihren Kommentar.

geschrieben von: Bernd Hesse

Bernd Hesse

Bernd Hesse ist bei GBS PAVONE als Senior Product Manager verantwortlich für die Collaboration-Lösungen. In dieser Funktion betreut er unter anderem Produkte aus den Themengebieten Workflowmanagement sowie Erstellung, Modernisierung und Retirement von Geschäftsanwendungen. Aus seiner Zeit als Senior Consultant bei GBS verfügt er auch über umfassende Projekterfahrungen in den genannten Gebieten.

Abonnieren Sie den GBS Newsletter und erhalten Sie neue Artikel sofort in Ihre Mailbox!

Posted in:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.