Beim Konvertieren steckt der Teufel oft im Detail
Stolperfallen
Offenheit ist eine zentrale Forderung, die Unternehmen zum Vermeiden von Abhängigkeiten an Dateiformate für ihre Dokumente stellen sollten. Offene XML-Formate aktueller Office-Suiten lassen sich ihre Interna leicht entlocken und können so helfen, Ecken und Kanten beim Datenaustausch zu erkennen und abzumildern.
Aktuelle Office-Pakete setzen standardmäßig auf XML-Dateiformate. Diesen lassen sich leicht nicht nur Inhalte, sondern selbst die internen Strukturen entlocken. Schließlich bestehen sowohl das OpenDocument Format (ODF) als auch Microsofts Office-Open-XML-Dateiformat (OOXML) lediglich aus einer Sammlung von XML-Dateien, die als Zip-Archiv verpackt und komprimiert erst die „sprechende“ Dateierweiterung erhalten, um als Datei im System zu erscheinen.
Aus dem Zip-Format ergeben sich mehrere Vorteile. Unter anderem zeigt die Analyse der Inhalte, welche Informationen sich in der Datei befinden – auch die unabhängig vom sichtbaren Inhalt gespeicherten. Es gibt also keine Geheimnisse. So lassen sich aus defekten Dateien mit einfachen Mitteln oft noch Inhalte extrahieren. Weiter können Fachapplikationen XML-Dateien auch ohne Frontend (wie LibreOffice oder MS Office) und APIs direkt erzeugen sowie auswerten.