Forschungsarbeit: The eXtensible Characterisation Languages – XCL

The eXtensible Characterisation Languages –
XCL

- in englischer Sprache -

Buch beschaffeneBook-Anfrage

Kölner Beiträge zu einer geisteswissenschaftlichen Fachinformatik, Band 3

Hamburg , 482 Seiten

ISBN 978-3-8300-4766-7 (Print) |ISBN 978-3-339-04766-3 (eBook)

Zum Inhalt deutschenglish

Wenn Sie ein Office Dokument von Microsoft Word in ein PDF konvertieren, enthält es dann immer noch dieselbe Information? Wenn Sie ein Bild aus einem Format in ein anderes verwandeln, ist es immer noch dasselbe? Überraschenderweise gibt es heute noch keine technische Antwort auf diese Fragen: Der einzige Weg sie zu beantworten verlangt, dass ein menschlicher Beobachter die fraglichen Objekte vor und nach einer solchen Umwandlung beurteilt.

Für einzelne Konversionen von Dateien mag dies eine gangbare Lösung sein: Wenn man Millionen davon zu bearbeiten hat, ist sie es offensichtlich nicht. Dies ist gravierend in allen Fällen, in denen derartige Formatumwandlungen oder Migrationen systematisch durchgeführt werden müssen, vor allem im Bereich der digitalen Langzeitspeicherung, wo extrem große Datenmengen langfristig sicher durch eine sich wandelnde technische Umwelt geleitet werden sollen.

Innerhalb von Planets - einem der strategischen Projekte für die digitale Langzeitspeicherung, die derzeit von der Europäischen Kommission finanziert werden - wird deshalb derzeit eine Lösung für dieses Problem an der Universität zu Köln entwickelt.

Kurz gesagt: Es wurde eine formale Sprache entwickelt, die es erlaubt komplexe Datenobjekte von Typen wie „Text“ oder „Bild“ zu repräsentieren. Wurde der Inhalt zweier Dateien in diese abstrakten Repräsentationen überführt, können Vergleichsalgorithmen auf sie angewendet werden, die eine Abschätzung des Umfangs der Änderungen erlauben, die durch den Migrationsprozess herbeigeführt wurden. Eine weitere formale Sprache erlaubt es, die technischen Spezifikationen von Dateiformaten, die sich an menschliche Programmierer richten, so auszudrücken, dass spezielle Software in die Lage versetzt wird, den Inhalt in bestimmten Formaten gespeicherter Dateien in diese abstrakte Form zu überführen, die für den Vergleich benötigt wird. Da diese Formalismen ein konsistentes Verständnis der Information erfordern, die von diesen Prozessen verarbeitet wird, bauen die entwickelten Lösungen auf einem dedizierten abstrakten Informationsmodell auf.

Dieser Band beschreibt den derzeitigen Stand des Projekts: Er wurde als Arbeitsunterlage produziert, die derzeit an führende Forschungsgruppen verteilt wird, um die geschilderte Vorgehensweise in einer Reihe von Workshops zu diskutieren.

Ihr Werk im Verlag Dr. Kovač

Bibliothek, Bücher, Monitore

Möchten Sie Ihre wissenschaftliche Arbeit publizieren? Erfahren Sie mehr über unsere günstigen Konditionen und unseren Service für Autorinnen und Autoren.

Weitere Bücher des Herausgebers

Sammelband: Das Digitale Archiv NRW in der Praxis

Das Digitale Archiv NRW in der Praxis

Eine Softwarelösung zur digitalen Langzeitarchivierung

Hamburg , ISBN 978-3-8300-7278-2 (Print) |ISBN 978-3-339-07278-8 (eBook)

[...] Insgesamt ist das Buch ein hilfreicher Schritt zur gemeinsamen Weiterentwicklung entsprechender Systeme im Konzert der Rechenzentren und…

in: Archivpflege in Westfalen-Lippe,

Forschungsarbeit: The Trustworthy Online Technical Environment Metadata Database – TOTEM

The Trustworthy Online Technical Environment Metadata Database – TOTEM

Hamburg , ISBN 978-3-8300-6418-3 (Print) |ISBN 978-3-339-06418-9 (eBook)