Zaubernetz

Im Verlagswesen eröffnet die Technik mittlerweile die Möglichkeit, literarische Werke als Buch und parallel als elektronische Ausgabe zu planen. S. Fischer arbeitet an einem neuen Publikationskonzept der Werke Thomas Manns. Ein Projektbericht.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 19 Min.
Von
  • Ingrid Schmidt
  • Carolin Müller
Inhaltsverzeichnis

Herbst 1929: Der Knaur-Verlag will eine preiswerte Volksausgabe der Buddenbrooks veröffentlichen und sucht dafür um eine Sonderlizenz beim S. Fischer Verlag nach. Dies führt zu Meinungsverschiedenheiten zwischen Thomas Mann und seinem Verleger Samuel Fischer. Der ist grundsätzlich gegen die Idee der Volksausgabe; Mann befürwortet sie und führt als Argument die ‘geänderte Zeit’ ins Feld. Die Verhandlungen mit Knaur scheitern; Fischer bringt schließlich selbst eine Volksausgabe der Buddenbrooks heraus, die ein Riesenerfolg wird.

Herbst 2001: Bei S. Fischer erscheinen die ersten drei Bände der ‘Großen kommentierten Frankfurter Ausgabe’ (GKFA) der Werke Thomas Manns als Buchausgabe und CD-ROM. Im Vorfeld bewarben sich mehrere Softwarehersteller um die Lizenz für eine elektronische Version. Fischer beschloss jedoch, sie in eigener Regie herzustellen [4]. Diese Entscheidung leitete gleichzeitig einen Strategiewechsel im Verlag bezüglich der neuen Medien ein: Die Inhalte selber werden zur Sache des Verlags, unabhängig von ihrem Publikationsmedium.

War 1929 die Volksausgabe eine Neuerung im Verlagsbereich, sind es heute die elektronischen Medien. Mit der Veränderung der Medienlandschaft entstehen neue Publikationsmöglichkeiten neben - nicht statt - der alten: CD-ROMs, Internet, E-Books. Mehr denn je geht es heute um die Inhalte als solche. Sie werden nicht mehr ausschließlich zu Papier gebracht, sondern vielmehr zu entmaterialisierten Datenströmen, die idealerweise unabhängig von ihrem aktuellen Publikationsmedium sind und in unterschiedlichen Medien manifest werden können.

Solche Möglichkeiten entstehen nicht von selbst, man muss sie schaffen. Dafür sind tragfähige Konzepte notwendig, die für die jeweiligen Inhalte maßgeschneidert sind, aber auch die praktische Umsetzbarkeit und die Kosten nicht aus den Augen verlieren. Standards spielen in diesem Zusammenhang eine Rolle, wenn es darum geht, bei langfristig anzulegenden Planungen auf sicherem Boden zu stehen. Im Publikationsbereich sind SGML, XML [2] und alle ihre Verwandten hier an erster Stelle zu nennen. Visionen sind vonnöten, um heute schon zukunftsweisende Wege beschreiten zu können. Semantische Netze oder Topic Maps [3], ihre XML- beziehungsweise SGML-Version werden eine zunehmend wichtige Rolle spielen, wenn es darum geht, die Inhalte großer Datenmengen gezielt recherchierbar zu machen. Ein Sachverhalt, der heute ‘Knowledge Management’ oder ‘wissensbasiertes Publizieren’ heißt.

Für den S. Fischer Verlag ist Thomas Mann bis heute einer der umsatzstarken Autoren. Der Verlag hält bis 2025 die exklusiven Publikationsrechte an seinem Werk. Zwischen 2001 und 2015 wird Fischer in jährlichem Rhythmus eine 58-bändige Referenzausgabe der Werke, Briefe und Tagebücher Thomas Manns veröffentlichen.

Die Entscheidung zu dieser neuen Referenzausgabe ging im Verlag mit einer Reihe weiterer Überlegungen einher. Bei einem auf so lange Zeit angelegten Projekt lag es auf der Hand, die Ausgabe nicht nur als Buch, sondern auch elektronisch zu publizieren. Nach Sichtung am Markt vorhandener Editionen war klar, dass diese Produkte nicht der Vorstellung einer elektronischen Version der GKFA entsprachen. Nicht klar war allerdings, wie genau die aussehen sollte; auf keinen Fall war ein einfaches Abbild des Buches angestrebt. Es sollte sichergestellt sein, dass die elektronische Ausgabe den hohen Anforderungen der Buchausgabe entspricht. Qualitativ hochwertig war dabei auf die Inhalte und deren mediengerechte Umsetzung bezogen. Darüber hinaus war gefordert, im Zuge dieser großen Ausgabe die Inhalte so aufzubereiten, dass sie langfristig nutzbare Ressourcen werden. Bei einem anderen großen Projekt - dem Fischer Weltalmanach - hatte sich seit einigen Jahren SGML/XML für die langfristige Datenhaltung bewährt [1]. Grund genug, auch für Thomas Mann auf diese Standards zu setzen. Daraus resultierten als zentrale Projektvorgaben erstens, dass die GKFA als Buchausgabe und als elektronische Ausgabe erscheinen wird, und zweitens, dass die Texte der GKFA SGML/XML-strukturiert vorliegen sollen.

Mit der ersten Projektvorgabe war nicht angestrebt, sich an das gängige Publikationsmodell für literarische Editionen anzulehnen. Herkömmlich entsteht die elektronische Version in der Regel auf der Datenbasis der gedruckten Ausgabe. Diese Datenbasis, die zunächst die Herstellung der Buchausgabe durchlaufen hat, transportiert folgerichtig in erster Linie typographische und layoutorientierte Informationen. Eine elektronische Version kann sich unter solchen Voraussetzungen nur mit erheblichem Zusatzaufwand von der Buchausgabe lösen. Die Folge ist ein elektronisches Buchimitat, das gerade wegen dieser Imitation erheblich an Qualität einbüßt: Es entsteht eine Art Buch, das weder das klassische Medium Papier mit all seinen sinnlichen Eigenschaften benutzt, noch die Eigenschaften des elektronischen Mediums ausschöpft. Einzig über Volltextsuche und einige festgelegte semantische Suchmöglichkeiten wird eine Annäherung an die Möglichkeiten der neuen Medien erreicht. Das für die GKFA angestrebte Modell hingegen zielt gerade darauf ab, die spezifischen Eigenschaften - den Werkzeugcharakter - elektronischer Medien nutzbar zu machen. Gleichzeitig sollte sichergestellt sein, dass es sich um eine Referenzausgabe handelt, die in zwei Medien realisiert ist.

Die zweite Projektvorgabe zielte darauf ab, den Workflow des herkömmlichen Modells dahingehend zu verändern, dass die verschiedenen Publikationsmedien aus einer Datenbasis parallel bedient werden können. Dieser so genannte Informationspool besteht aus

  • einer Textbasis, die ihrerseits SGML/ XML-Instanzen, Textdaten in anderen Formaten, Grafiken, Musik et cetera umfasst,
  • den zu den SGML/XML-Instanzen gehörigen Document Type Definitions (DTDs) sowie
  • aus der Metastruktur, welche die verschiedenen Teile der Textbasis miteinander verknüpft.

In seiner Rolle als zentrale Ressource für den Verlag dient der Informationspool nicht nur als Herstellungsbasis, sondern auch für verschiedene andere Publikationen, wie eine Schulausgabe oder ein Themenband ‘Thomas Mann und Goethe’. Solche Abfragen für die Erstellung von Sonderpublikationen nutzen genauso das semantische Netz aus, wie es die elektronische Version tut, wenn sie es ermöglicht, nach den für Thomas Mann relevanten russischen Autoren des 19. Jahrhunderts zu fragen. Im Lektorat verschieben sich mit dieser Veränderung des Workflows traditionelle Aufgaben: Nicht mehr die spezifische Ausgabe steht im Mittelpunkt der Arbeit, sondern mehr und mehr die Arbeit rund um den Informationspool. Er wird zur eigentlichen Arbeitsbasis, um die gesamte Textmenge zu editieren, miteinander zu verknüpfen und dabei auf den verschiedenen Ebenen konsistent zu halten. Der Informationspool ist nicht auf einen einzelnen Autor beschränkt. Er soll nach und nach um andere kommentierte und unkommentierte literarische Editionen sowie Einzelwerke erweitert werden.

Schema der Publikationsarchitektur (Abb. 1)

Das Schema der Publikationsarchitektur (Abbildung 1) zeigt den Informationspool als zentrale Komponente des Gesamtkonzepts. Auf ihm setzen die Bereiche der redaktionellen Inhaltsbearbeitung und der Produkterstellung auf. Es werden entweder Inhalte neu nach den SGML/XML-DTDs strukturiert oder schon strukturiert vorliegende Dokumente bearbeitet. Hinzu kommt der Aufbau des semantischen Netzes als redaktionelle Aufgabe. Daneben werden für die Produkterstellung die Inhalte der jeweiligen Ausgabe bestimmt und aus dem Informationspool als produktbezogener Ausschnitt herausgezogen. Das kann beispielsweise ein einzelner kommentierter Roman der GKFA sein, eine Sammlung von Briefen oder andere Ausgaben, die aus der Textbasis und der Metastruktur des Informationspools generiert werden. Die inhaltliche Basis für die elektronische Präsentation kann dabei umfangreicher sein als die für das Buch. Die gemeinsame Datenbasis ermöglicht jedoch als Resultat eine Ausgabe in zwei medialen Ausprägungen. Die Tiefe der Strukturierung nach semantischem Gehalt und die Ausdifferenziertheit der Metastruktur bestimmen dabei über die Möglichkeiten der mediengerechten Umsetzung, gerade für das elektronische Medium.

Um das Potenzial des neuen Mediums für die elektronischen Ausgaben der GKFA auszuschöpfen, lag es nahe, sich - neben der Entwicklung neuartiger Zugriffsmöglichkeiten auf die Inhalte - der multimedialen Möglichkeiten zu bedienen. Daran schloss sich unmittelbar die Frage an, welche multimedialen Erweiterungen im Rahmen einer wissenschaftlichen Werkausgabe angebracht sind. Der Phantasie waren da zunächst keine Grenzen gesetzt: verschiedene Porträtaufnahmen der Familie Mann, Filmaufnahmen zur Nobelpreisverleihung, die Skizze der Sitzordnung der Familie Buddenbrook beim Weihnachtsessen et cetera. Auf den ersten Blick schien sich eine schöne neue Welt aufzutun. Schon der zweite Blick trübte sie erheblich. Bei einer solchen Ausweitung im elektronischen Medium war es unklar, in welchem Verhältnis die elektronische Ausgabe zur Buchversion stehen sollte: die Buchausgabe als wissenschaftliche Werkausgabe in strengem Sinne; die elektronische Version als weniger wissenschaftliche Werkausgabe, dafür aber mit höherem Fun-Faktor?

Zentraler Anspruch der GKFA ist, die neue Referenzausgabe zu Thomas Mann zu sein; die verbindliche Ausgabe, um Thomas-Mann-Texte zu zitieren. Wenn aber die Konzeption der Buchausgabe von der der elektronischen abweicht, kann dann noch von einer Referenzausgabe in beiden Medien gesprochen werden? Aus dieser Fragestellung heraus wurde ein Konzept entwickelt, das die Vorteile der möglichen Erweiterungen im elektronischen Medium mit der Geschlossenheit der inhaltlichen Konzeption in beiden Publikationsmedien der GKFA verbindet. Denn dass sie in beiden Medien Referenzausgabe sein sollte, war eine zentrale Anforderung.

Die Textbasis, die der Buch- und elektronischen Ausgabe zu Grunde liegt, wird aufgeteilt in die GKFA und ein Archiv zu ihr. Die GKFA besteht aus der Buchausgabe und möglichen, jedoch klar begrenzten Erweiterungen für die elektronische Ausgabe. Diese Erweiterungen könnten unter anderem Quellen sein, die aufgrund ihrer medialen Beschaffenheit nicht im Buch publiziert werden können. Neben die GKFA wird ein Archiv gestellt, das in Verantwortung des Verlages steht. In diesem Archiv finden sich Dokumente und Texte rund um das Werk Thomas Manns. Es nutzt die oben angesprochenen Möglichkeiten des elektronischen Mediums, nämlich Tondokumente zu präsentieren, schwer zugängliche Faksimiles einem breiten Publikum zur Verfügung zu stellen oder auch das Briefwerk Thomas Manns durch Antwortbriefe seiner Briefpartner anschaulicher zu machen. Das Archiv gibt dem Verlag die Möglichkeit, in eigener Verantwortung selten Gesehenes und Attraktives auf die elektronische Ausgabe zu stellen und damit dem Publikum einen Kaufanreiz zu bieten. Gerade dadurch, dass das Archiv ganz klar von der GKFA getrennt ist, ist es möglich geworden, eine Referenzausgabe in der oben beschriebenen Form zu haben und trotzdem multimediale Erweiterungen zu bieten.

Zum größten Teil ist die Textbasis der GKFA in SGML/XML strukturiert. Um die Daten für einen solchen Kontext aufzubereiten, muss das Modellierungskonzept der DTDs in erster Linie auf die Abbildung der inhaltlichen Einheiten und ihrer Zusammenhänge abzielen und nicht auf die hierarchische Strukturierung der Dokumente. Die Inhalte sind unabhängig von einer bestimmten medialen Präsentationsform gespeichert. Die DTDs stellen die Schnittstelle zwischen Konzeption und technischer Umsetzung dar, da sie die Anforderungen an die Ausgabe in einer formalen Sprache festhalten und damit die Basis für die technische Umsetzung schaffen. Das DTD-Konzept selbst ist mit den bereits beschriebenen Teilen der Konzeption eng verwoben; auch hier wird die Textbasis von der Metastruktur und dem Archiv unterschieden.

Gerade der Anspruch einer inhaltlich ausgerichteten Strukturierung setzt voraus, dass die Entwicklung dieser Strukturen in enger Zusammenarbeit zwischen den inhaltlich Verantwortlichen, dem Lektorat, und den Informationsarchitekten erfolgt. Vergibt der Verlag diese Aufgabe an einen Softwarehersteller und zeichnet nicht selbst dafür verantwortlich, so kann die Modellierung zwangsläufig keine so hohe konzeptionelle Bedeutung einnehmen.

Ein wesentlicher Bestandteil des Projekts ist der Aufbau eines semantischen Netzes. Es hat die Funktion einer Metastruktur und wird als Topic Map exportiert. Enzyklopädien und Wörterbücher sind geprägt von festen Strukturmustern und Formulierungsvorgaben. Ganz anders verhalten sich die Texte einer literarischen Edition; sie weisen gerade keine festen Strukturen auf, sondern leben von der Varianz der Sprache. Diese Lebendigkeit erschwert eine automatisierte Inhaltserschließung, beziehungsweise macht sie geradezu unmöglich. Um auf den Informationsgehalt der Texte dennoch mit technischen Mitteln gezielt zugreifen zu können, müssen die sprachlich verschieden dargestellten Sachverhalte in die formale Notation eines semantischen Netzes beziehungsweise einer Topic Map übertragen werden. Diese Übertragung ist sowohl ein intellektueller als auch ein technischer Vorgang. Wird eine solche Formalisierung von Fakten geleistet, ist es möglich, komplexe Fragen zu recherchieren wie:

  • In welchen Zeitungen wurden Rezensionen von Thomas Mann veröffentlicht?
  • In welchen Essays äußert sich Thomas Mann zu anderen Schriftstellern seiner Zeit?
  • In welchen Briefen schreibt Thomas Mann über seinen Zauberberg?
  • Welche Autoren hat Thomas Mann am häufigsten zitiert?

Schema des semantischen Netzes (Abb. 3)

Antworten auf diese Fragen finden sich in den Texten; diese sind jedoch ohne Aufbereitung technisch nicht zu erschließen. Interessiert sich der Benutzer beispielsweise für den Briefwechsel Thomas Manns mit Schriftstellerkollegen zwischen 1889 und 1932, kann ihm eine solche Gruppierung von Personen auf Grundlage der Modellierung des semantischen Netzes angeboten werden (Abbildung 3). Wählt er Gerhart Hauptmann aus, werden alle an ihn gerichteten Thomas-Mann-Briefe gefunden. Das Suchergebnis kann wahlweise als einfache, chronologisch geordnete Liste angezeigt oder auch grafisch aufbereitet auf einer Zeitleiste präsentiert werden (Abbildung 2 rechts). Sie wird nicht vorab in der Redaktion erstellt und gespeichert, sondern als Ergebnis der individuellen Anfrage automatisch generiert.

Links die menügesteuerte Suchanfrage; rechts das Ergebnis in Form einer Zeitleiste (Abb. 2)

Die Visualisierung auf der Zeitleiste zeigt, dass es einen Zeitraum intensiver Korrespondenz zwischen den beiden Schriftstellern gab. Möglicherweise steht der Anlass dieses regen Schriftverkehrs im Brief vom 11. April 1925, der den Beginn dieser Phase markiert. In diesem Brief entschuldigt sich Thomas Mann bei Gerhart Hauptmann dafür, dass er Charaktereigenschaften seines Kollegen in eine seiner Romanfiguren einfließen ließ. Der Brief sagt jedoch nichts darüber aus, um welche Figur es sich handelt. Auch eine solche Suchanfrage lässt sich auf Basis des semantischen Netzes formulieren. Ziel der konkreten Frage ist es, eine Figur zu finden, die in einem Thomas-Mann-Werk auftaucht und Gerhart Hauptmann zur Vorlage hat. Das Suchergebnis weist die gesuchte Figur als Mynheer Peeperkorn aus und ordnet sie dem Roman ‘Der Zauberberg’ zu.

Um die eben beschriebenen Funktionen möglich zu machen, ist ein formales Modell der Metastruktur erforderlich, das in seiner inhaltlichen Ausgestaltung auf den Gegenstandsbereich der literarischen Edition maßgeschneidert ist. Auf der formalen Ebene teilt sich die Metastruktur in die Konzeptebene und die der Individuen. Auf der Konzeptebene findet sich das abstrakte Modell der Objekte und Relationen, in dem sowohl die möglichen Objekt- und Relationstypen als auch deren Verknüpfungsmöglichkeiten festgelegt werden.

Diese Ebene des semantischen Netzes dient als Raster für die Einordnung der Individualobjekte. So werden beispielsweise auf der Konzeptebene Personen nach ihren verschiedenen Rollen und Funktionen, als Familienmitglieder, Verleger, Schriftsteller et cetera gruppiert, um dann das Individualobjekt Thomas Mann mit dem Konzept Schriftsteller zu verbinden. Entsprechend wird mit dem Individualobjekt Zauberberg verfahren. In einem weiteren Schritt können diese durch eine auf der Konzeptebene ermöglichte Relation miteinander verbunden werden, sodass das Faktum ‘Thomas Mann hat den Zauberberg geschrieben’ im semantischen Netz abgebildet und damit auch recherchierbar ist.

Die Individuenebene ausschließlich manuell mit Individualobjekten aufzufüllen und diese zu verknüpfen, sodass Fakten gebildet werden können, wäre zeitaufwändig und arbeitsintensiv. Als Alternative bietet sich an, Basisdaten automatisiert einzufüllen und sie redaktionell weiterzubearbeiten und zu ergänzen. Um zu einer solchen Basisfüllung zu kommen, lag es nahe, schon bestehende Register zum Werk Thomas Manns in das semantische Netz einzulesen.

Register bieten sich deshalb an, weil sie es dem Leser ermöglichen, nach bestimmten Begriffen die Texte zu erschließen. Sie sind außerdem stark formalisiert und daher gut automatisch auszuwerten. Für Thomas Mann liegen zahlreiche Register vor, die im Zusammenhang mit bereits früher publizierten Ausgaben entstanden sind. Sie werden für das automatisierte Füllen der Individuenebene des semantischen Netzes zunächst auf ihre Registerbegriffe reduziert, das heißt beispielsweise, dass die Seitenzahlen entfernt werden; ein weiterer Konvertierungsschritt wertet die Gestaltung der Register aus. Layout und Typographie setzen im Druck die Registerbegriffe nach einem strengen Regelsystem zueinander in Beziehung.

Auf diese Weise werden auch hier Fakten wie ‘Zauberer ist eine Namensvariante für Thomas Mann’ abgebildet. Solche festen Strukturen ermöglichen eine automatisierte und damit regelbasierte Auswertung der Register. Das Ergebnis dieser Auswertung ist ein semantisch ausgerichtetes XML-Dokument.

Diese XML-Auszeichnungen dienen der Erstellung von Teilregistern. Ein solches gruppiert beispielsweise alle Personen mit ihren Verwandtschaftsbeziehungen. Durch diesen Filtermechanismus entstehen spezifische Sichten auf das Gesamtregister, die eine Überarbeitung der Konvertierung vereinfachen, da Inkonsistenzen im Datenbestand leichter sichtbar werden.

Es wurde vielfach deutlich, dass ein Vorhaben wie das hier dargestellte Projekt eine intensive Zusammenarbeit zwischen verschiedenen Beteiligten voraussetzt. Die konkrete Arbeitsgruppe in diesem Projekt setzt sich zusammen aus Mitarbeitern von Lektorat und Herstellung beim Verlag (Konzepterstellung, editorische Arbeit, Betreuung der Buchausgabe, Aufbau des semantischen Netzes, Datenarbeiten), VIA (Beratung, Konzepterstellung, Aufbau der Informationsarchitektur, Kommunikationsschnittstelle zwischen Verlag und Softwarehersteller, Konzeption des semantischen Netzes, Datenarbeiten), Intelligent Views (Konzeption des semantischen Netzes, Entwicklung der redaktionellen Tools und von Werkzeugen rund um das semantische Netz, Entwicklung der elektronischen Ausgabe) und Clausen & Bosse (Buchausgabe, Datenarbeiten). Den Kern der Arbeitsgruppe mit regelmäßigen Treffen bilden die Verlagsmitarbeiter und die Beratungsfirma.

S. Fischer hat die neue Werkausgabe zum Anlass genommen, neue Strategien im Umgang mit Inhalten zu etablieren. Der Verlag hat sich auf den Weg gemacht, seine Inhalte so aufzubereiten, dass er auch für die neuen Medien gerüstet ist. Die neuen Publikationsmärkte wie CD-ROM, E-Book und Internet verändern sich beständig. Es ist eine ‘Forderung der Zeit’, diese Märkte mit qualitativ hochwertigen Produkten bedienen und auf ihre Veränderungen flexibel reagieren zu können. Dieser neue Umgang mit den Inhalten geht einher mit Veränderungen im Verlag: Neue Aufgaben entstehen, schon bestehende Aufgabenbereiche verzahnen sich stärker.

Ingrid Schmidt
arbeitet seit 1986 im Bereich SGML-basiertes elektronisches Publizieren. Sie leitet die VIA Informationsarchitekturen in Heidelberg.

Carolin Müller
arbeitet als Beraterin und Informationsarchitektin bei VIA.

[1] Thomas Kamps, Christoph Obermeier, Klaus Reichenberger, Ingrid Schmidt; SGML für dynamische Publikationen - das Beispiel Fischer Weltalmanach, in: Wiebke Möhr, Ingrid Schmidt (Hg.); SGML und XML; Anwendungen und Perspektiven; Heidelberg (Springer) 1999, S. 173-192

[2] Eve Maler, Jeanne El Andaloussi; Developing SGML DTDs; From Text to Model to Markup; Upper Saddle River (Prentice Hall) 1996

[3] Hans Holger Rath; Mozart oder Kugel; Mit Topic Maps intelligente Informationsnetze aufbauen; iX 12/1999, S. 149

[4] Ingrid Schmidt, Carolin Müller; Planning a new type of literary edition: the Thomas Mann Project; in: XML Europe 2000 Conference Proceedings, S. 83-97;

[5] Steve Pepper; Navigating haystacks and discovering needles; Introducing the new topic map standard; In: Markup Languages; Theory & Practice 4, 1999, S. 47-74

Mehr Infos

iX-TRACT

  • CD-ROMs, das Internet und E-Books stellen traditionelle Verleger vor neue Aufgaben.
  • Strukturierte Daten sind die Voraussetzung dafür, Inhalte für unterschiedliche Medien aufbereiten zu können.
  • Die bei S. Fischer verlegte neue Thomas-Mann-Ausgabe ist von vornherein für Buch und elektronisches Medium konzipiert worden.

(hb)