+41 52 208 03 33|

PDF ist nicht gleich PDF

Das Dateiformat PDF kennt jeder. Möchte man ein x-beliebiges Dokument versenden, das der Empfänger auf jeden Fall öffnen und lesen kann? Und soll das Dokument möglichst in seiner ursprünglichen Darstellung bleiben? Dann ist PDF der absolute Standard. Das gilt auch für die Dokumenten-Archivierung, wobei dafür das optimierte Format PDF/A verwendet wird. Viele User wissen das bereits. Der Beitrag könnte also an dieser Stelle zu Ende sein, wenn es bei PDFs nicht so grosse Unterschiede geben würde. Doch wie genau sehen diese Unterschiede aus und warum sind sie so relevant?

Dateigrösse

Beschäftigt man sich nicht weiter mit der Thematik, würde man erwarten, dass die Grösse einer PDF/A-Datei nicht davon abhängt, mit welchem Werkzeug sie erstellt wurde. Das ist ein Irrtum, wie die Praxis zeigt. Je nach Tool kann zum Beispiel ein 100-seitiges Dokument von ein paar wenigen bis zu 20 MB gross werden – und dies bei gleichem Inhalt! Der Grund dafür liegt in der Arbeitsweise der verschiedenen Werkzeuge. Die meisten versuchen, den Inhalt der Ursprungs-Datei als Ganzes zu komprimieren und erreichen damit eine vergleichsweise schlechte Kompressionsrate. Einige wenige Programme verfolgen einen aufwändigeren Ansatz: Sie zerlegen den Inhalt der Datei in seine Bestandteile, komprimieren diese Komponenten einzeln und verwenden dafür jeweils entsprechend optimierte Algorithmen. In der Summe führt dies zu weitaus «schlankeren» PDF-Dateien.

Warum ist das wichtig? Bei einer einzelnen Datei oder bei einer geringen Anzahl von Dateien spielt das auf den ersten Blick keine grosse Rolle. Auch wenn gemanagter Speicherplatz seinen Preis hat, ist er nicht per se sonderlich teuer. Betrachtet man die Gesamtmenge der Dokumente und vor allem deren Lebenszyklus, ergibt sich ein anderes Bild: Einerseits sind da die Daten, mit denen aktuell gearbeitet wird (meistens machen diese den kleineren Teil aus), anderseits müssen alle geschäftlich relevanten Dokumente aufbewahrt werden – und das über einen längeren Zeitraum! Auch bei kleineren Unternehmen kommen im Verlauf von zehn Jahren, der in der Schweiz üblichen Mindestaufbewahrungszeit, schnell Hundertausende bis Millionen Dokumente zusammen. Da macht es einen gewichtigen Unterschied, ob ein PDF/A 2 oder 10 MB gross ist.

Angenommen ein KMU hat 30 Mitarbeitende, wovon jeder 220 Tage pro Jahr arbeitet. Pro Tag erstellt jeder Mitarbeitende selbst 3 Dokumente und erhält 3 Dokumente von extern, die er ablegt. Sprich, er generiert 6 neue Dokumente. Wenn man von allen möglichen Dokumenten ausgeht – Offerten, Rechnungen, Briefe, Präsentationen, Konzepte, Protokolle … – ist dies nicht mal so viel.

Summa summarum ergibt dies jährlich 39’600 neue Dokumente!

Gross macht langsam

Ein zweiter Aspekt ist die Ladezeit. Dabei geht es nicht um das Suchen des Dokuments in einer Datenablage, sondern um die Zeitspanne zwischen dem Klicken auf das Dokument und dessen Anzeige auf dem Bildschirm. Insbesondere beim Zugriff via Smartphone oder Tablet macht es einen erheblichen Unterschied, ob 2 oder 10 MB über das Netzwerk transportiert werden müssen. Eine schnelle Ladezeit fördert nicht nur die Nutzerakzeptanz, sondern erhöht auch die Effektivität jedes einzelnen Mitarbeitenden – unabhängig davon, wo er arbeitet.

Qualität: Verpixelt oder gestochen scharf

Neben der Ladezeit ist es für den Benutzer wichtig, dass die angezeigte Datei eine gute Qualität aufweist. Insbesondere bei Dokumenten, die Grafiken und/oder Bildelemente enthalten, zeigt sich, dass nicht jede Lösung zur Generierung von PDF/A-Dateien gleich gut funktioniert. Werden die Inhaltsbestandteile getrennt verarbeitet, ist die Qualität der Datei höher.

Durchsuchbarkeit in Dokumenten

Ein dritter Aspekt betrifft die Durchsuchbarkeit von PDF-Dateien. Je nach Werkzeug, mit dem eine PDF-Datei erstellt wurde, ist der Inhalt des Dokuments durchsuchbar oder nicht. Die Möglichkeit einer Volltextsuche – das heisst, dass auch der Text innerhalb der abgelegten Dokumente (nicht nur zum Beispiel deren Name) durchsucht wird – ist jedoch gerade in einem Archiv von grossem Vorteil. Abermals schneiden hier Programme, die Dokumente fragmentiert verarbeiten, besser ab, da sie Text als Text belassen. Programme, die Dokumente als Ganzes komprimieren, ändern Textelemente vielfach in Bilder, welche nicht mehr durchsuchbar sind.

Ästhetische Probleme

Zwei Dinge, welche Nutzer zwar häufig stören, am Ende des Tages jedoch lediglich kosmetischer Natur sind: die Lochungen und die Heftklammer-Ecken. Lochungen sind nach dem Scannen des Papierdokuments in der Regel als schwarze, mehr oder weniger runde Flecken sichtbar. Die Heftklammer-Ecke entsteht durch das (meist angewandte) Abschneiden der Klammerheftung für den Scanvorgang und führt zu einem schwarzen Dreieck. Mit welcher Methode ein PDF erstellt wird, ist bei diesen ästhetischen Defiziten egal. Gute Lösungen zur PDF/A-Generierung können diese «schwarzen Löcher» zielgerichtet und automatisiert entfernen.

Einsatz in Unternehmen und für Enduser

Um diesen Anforderungen gerecht zu werden, gibt es verschiedene Lösungen, welche im Unternehmensbereich zum Einsatz kommen. Mit DocYard haben wir einen professionellen Partner, damit unsere Kunden Best-in-Class-PDF/A-Dateien erstellen können.

Für den privaten Einsatz können wir zwei Lösungen empfehlen, welche die angesprochenen Anforderungen erfüllen und – je nach gewünschtem Umfang – frei oder mit einer geringen (einmaligen) Lizenzgebühr verfügbar sind:

Gerne geben wir Ihnen Auskunft, welche weiteren Vorteile ein Dokumentenmanagement-System hat und wie es funktioniert. CROSS-WORKS erarbeitet mit Ihnen die geeignete Lösung für Ihr Unternehmen. Kontaktieren Sie uns für ein unverbindliches Beratungsgespräch.

Kontakt aufnehmen