iX Special 2016
S. 100
Hintergrundwissen
Office-Interna
Aufmacherbild

Beim Konvertieren steckt der Teufel oft im Detail

Stolperfallen

Offenheit ist eine zentrale Forderung, die Unternehmen zum Vermeiden von Abhängigkeiten an Dateiformate für ihre Dokumente stellen sollten. Offene XML-Formate aktueller Office-Suiten lassen sich ihre Interna leicht entlocken und können so helfen, Ecken und Kanten beim Datenaustausch zu erkennen und abzumildern.

Aktuelle Office-Pakete setzen standardmäßig auf XML-Dateiformate. Diesen lassen sich leicht nicht nur Inhalte, sondern selbst die internen Strukturen entlocken. Schließlich bestehen sowohl das OpenDocument Format (ODF) als auch Microsofts Office-Open-XML-Dateiformat (OOXML) lediglich aus einer Sammlung von XML-Dateien, die als Zip-Archiv verpackt und komprimiert erst die „sprechende“ Dateierweiterung erhalten, um als Datei im System zu erscheinen.

Aus dem Zip-Format ergeben sich mehrere Vorteile. Unter anderem zeigt die Analyse der Inhalte, welche Informationen sich in der Datei befinden – auch die unabhängig vom sichtbaren Inhalt gespeicherten. Es gibt also keine Geheimnisse. So lassen sich aus defekten Dateien mit einfachen Mitteln oft noch Inhalte extrahieren. Weiter können Fachapplikationen XML-Dateien auch ohne Frontend (wie LibreOffice oder MS Office) und APIs direkt erzeugen sowie auswerten.