Forschungsarbeit: The eXtensible Characterisation Languages – XCL

Manfred Thaller (Hrsg.)The eXtensible Characterisation Languages –
XCL

- in englischer Sprache -

Kölner Beiträge zu einer geisteswissenschaftlichen Fachinformatik, Band 3

Hamburg 2009, 482 Seiten

ISBN 978-3-8300-4766-7 (Print)

ISBN 978-3-339-04766-3 (eBook)

Zum Inhalt deutschenglish

Wenn Sie ein Office Dokument von Microsoft Word in ein PDF konvertieren, enthält es dann immer noch dieselbe Information? Wenn Sie ein Bild aus einem Format in ein anderes verwandeln, ist es immer noch dasselbe? Überraschenderweise gibt es heute noch keine technische Antwort auf diese Fragen: Der einzige Weg sie zu beantworten verlangt, dass ein menschlicher Beobachter die fraglichen Objekte vor und nach einer solchen Umwandlung beurteilt.

Für einzelne Konversionen von Dateien mag dies eine gangbare Lösung sein: Wenn man Millionen davon zu bearbeiten hat, ist sie es offensichtlich nicht. Dies ist gravierend in allen Fällen, in denen derartige Formatumwandlungen oder Migrationen systematisch durchgeführt werden müssen, vor allem im Bereich der digitalen Langzeitspeicherung, wo extrem große Datenmengen langfristig sicher durch eine sich wandelnde technische Umwelt geleitet werden sollen.

Innerhalb von Planets - einem der strategischen Projekte für die digitale Langzeitspeicherung, die derzeit von der Europäischen Kommission finanziert werden - wird deshalb derzeit eine Lösung für dieses Problem an der Universität zu Köln entwickelt.

Kurz gesagt: Es wurde eine formale Sprache entwickelt, die es erlaubt komplexe Datenobjekte von Typen wie „Text“ oder „Bild“ zu repräsentieren. Wurde der Inhalt zweier Dateien in diese abstrakten Repräsentationen überführt, können Vergleichsalgorithmen auf sie angewendet werden, die eine Abschätzung des Umfangs der Änderungen erlauben, die durch den Migrationsprozess herbeigeführt wurden. Eine weitere formale Sprache erlaubt es, die technischen Spezifikationen von Dateiformaten, die sich an menschliche Programmierer richten, so auszudrücken, dass spezielle Software in die Lage versetzt wird, den Inhalt in bestimmten Formaten gespeicherter Dateien in diese abstrakte Form zu überführen, die für den Vergleich benötigt wird. Da diese Formalismen ein konsistentes Verständnis der Information erfordern, die von diesen Prozessen verarbeitet wird, bauen die entwickelten Lösungen auf einem dedizierten abstrakten Informationsmodell auf.

Dieser Band beschreibt den derzeitigen Stand des Projekts: Er wurde als Arbeitsunterlage produziert, die derzeit an führende Forschungsgruppen verteilt wird, um die geschilderte Vorgehensweise in einer Reihe von Workshops zu diskutieren.

Schlagworte

Datenabstraktion Fachinformatik Formatbeschreibungssprachen Informatik Konvertierung Langzeitsicherung Software

Ihr Werk im Verlag Dr. Kovač

Informationen: Wir veröffentlichen Ihre wissenschaftliche Arbeit >>

Weitere Bücher des Herausgebers

Manfred Thaller (Hrsg.)

Das Digitale Archiv NRW in der Praxis

Eine Softwarelösung zur digitalen Langzeitarchivierung

Hamburg 2013, ISBN 978-3-8300-7278-2 (Print) | ISBN 978-3-339-07278-8 (eBook)

[…] Insgesamt ist das Buch ein hilfreicher Schritt zur gemeinsamen Weiterentwicklung entsprechender Systeme im Konzert der Rechenzentren und…
Kai Naumann in: Archivpflege in Westfalen-Lippe, 80 (2014)

Janet Delve & David Anderson

The Trustworthy Online Technical Environment Metadata Database – TOTEM

Hamburg 2012, ISBN 978-3-8300-6418-3 (Print) | ISBN 978-3-339-06418-9 (eBook)

Manfred Thaller (Hrsg.)The eXtensible Characterisation Languages – XCL

- in englischer Sprache -

Zum Inhalt deutschenglish

Schlagworte

Ihr Werk im Verlag Dr. Kovač

Manfred Thaller (Hrsg.)The eXtensible Characterisation Languages –
XCL