Anfrage des Kunden

Ein Kunde möchte Bilddateien, in einem Format, das sich für die Langzeitarchivierung eignet, ins ETH Data Archive laden. Die Originalbilder liegen im JPG Format vor. Der Kunde schreibt gerade Software Routinen um eine grössere Anzahl von Files in ein Format zu konvertieren, das sich für die Langzeitarchivierung eignet. Der Kunde stellte für die Langzeitarchivierung komprimierte PNG Files und TIF Files her und sandte sie an das ETH Data Archive als Beispiele.

Lösung vorgeschlagen vom ETH Data Archive

(Stand Februar 2017 - die Angaben werden nicht aktualisiert)

Das ETH Data Archive empfiehlt für Bilder meistens das unkomprimierte baseline TIF Format. Falls Sie Ihre Bilder sowieso konvertieren müssen, wäre das TIF Format für den Langzeiterhalt die etwas bessere Lösung als das PNG Format (Siehe Empfehlungen der KOST).

Wir ziehen die unkomprimierten Bilder vor, wenn die Speicherkosten vertretbar sind. Wir empfehlen normalerweise unkomprimierte Daten, weil dadurch ein Hindernis für die Langzeiterhaltung wegfällt.

Wir haben die Beispieldateien mit drei verschiedenen Validatoren getestet. Gemäss den beiden Software Tools KOST-Val und JHOVE ist das File ein fehlerloses TIFF 4.0 File. KOST-Val ist dabei der empfindlichere Validator. Die Resultate von KOST-Val zeigen, dass die Kriterien der KOST für TIFF erfüllt sind. Zudem ist die visuelle Qualität bei starker Vergrösserung identisch mit dem Originalfile. Der DPF Manager gibt zudem ausführliche und verständliche Informationen zu den Fehlern, was bei JHOVE häufig nicht der Fall ist. Der DPF Manager gibt unter anderem folgende Information:

                                             

Die zwei roten „Fehlermeldungen“ verletzen Baseline TIFF; die drei zusätzlichen „Fehlermeldungen“ könnte man auch noch zu erfüllen versuchen, wenn man noch strenger sein möchte.
Der Kunde setzte dann in einem weiteren Beispiel File das Tag für die Auflösung auf 300 dpi. So wurde das File durch DPF Manager als Baseline TIFF akzeptiert. Die unkomprimierten Baseline TIFF Files sind nun für die Langzeiterhaltung optimal geeignet.

Warum fand nun DPF Manager einen Fehler obwohl die beiden anderen Validatoren keinen Fehler fanden? Der DPF Manager testete das TIFF File, als wäre es ein Baseline TIFF 6.0, obwohl es ein TIFF 4.0 File ist. Ist es wirklich gerechtfertigt, ein TIFF 4.0 mit den Baseline-Anforderungen von TIFF 6.0 zu testen? Ich denke ja, denn das TIFF 4.0 ist etwas veraltet. Der Standard Baseline TIFF 6.0 wurde erst später geschaffen und zwar, weil die Diversität bei TIFF Files zu einem Problem wurde. (siehe Sektion «Baseline TIFF» bei Wikipedia).

  • No labels