
Nie, nie, hätte er dieses Buch in einen normalen Scanner gelegt. „Im Leben nicht“, sagt Marco Dittrich. 304 Seiten Kalbspergament, im prächtigen Vorderdeckel aus Silber, mit Edelsteinen und Elfenbeinskulptur, der Rückdeckel mit purpurfarbenem Stoff überzogen. Ziselierte silberne Schließen halten das Buch zusammen, das in Nordfrankreich vor 1400 Jahren geschrieben wurde und das über die Jahrhunderte als sorgsam gehüteter Privatbesitz des Frankenapostels Kilian galt.
Das Kiliansevangeliar in den Scanner? Als die Würzburger Universitätsbibliothek vor knapp zehn Jahren begann, die 214 wertvollen Handschriften der Würzburger Dombibliothek, die „Libri Sancti Kiliani“, zu digitalisieren – da stand das Team um Handschriften-Spezialist und Abteilungsleiter Dr. Hans-Günter Schmidt vor einer Herausforderung. Auf keinen Fall durften die millionenschweren Inkunabeln, Versicherungswert zehn Millionen Euro, Schaden nehmen.
Also in die 60 000 Euro teuren Geräte legen, mit denen die Schriftwerke aus alter Zeit üblicherweise digital erfasst werden? Teure Vakuummaschinen anschaffen, um Buchseiten für einen optimalen Scan zu fixieren? Marco Dittrich, der Diplomingenieur für Medientechnologie schüttelt den Kopf. „Ich hätte sie da nicht reingelegt.“
Spezialkonstruktion für hochsensible Fälle
Nichts durfte den Schatz belasten, beschweren, nichts durfte darauf drücken. Der Herr der Maschinen in der Universitätsbibliothek begann zu entwickeln, zu tüfteln, zu konstruieren. Nichts passte. Am Ende fand Dittrich eine kleine Maschinenbaufirma, die sein Problem verstand – und das Evangeliar konnte erfasst werden in herausragender Bildqualität.
Heute steht der Scanner Marke Eigenbau von vielen starken Scheinwerfern beleuchtet in einem Raum im <%LINK href="https://www.bibliothek.uni-wuerzburg.
de/service0/digitalisierungszentrum/" text="Kallimachos-Zentrum für Digital Humanities" target="_blank"%>: Eine Wippen-Konstruktion hatte Marco Dittrich entworfen, in die empfindliche, fragile Handschriften sanft gelegt werden, in der jede Buchseite bei geringem Öffnungswinkel von maximal 120 Grad gerade, ohne Biegung an der Innenseite, ohne Verzerrung von oben aufgenommen werden kann. Und hinten dran: ein Staubsauger, um für leichten Unterdruck zu sorgen, damit das Pergament glatt und flach liegt. „Not macht erfinderisch“, sagt Marco Dittrich.
Viele Geräte, 72 Leuchtstoffröhren: Für Massenscans und aufwändige Handschriften-Scans
Aufsicht-Scanner, Zeilenscanner mit Hochauflösung, Buchwippen-Spezialkonstruktion, Stapelscanner für schnelle Einzelblattdigitalisierung, Mikrofilmscanner und Fachkameras, dazu eine riesige Saugwand von drei mal zwei Metern, an der gerade die 20 000 Schulwandbilder der großen Würzburger Sammlung in einem Zug aufgenommen werde – das Kallimachos-Zentrum ist ein Dienstleister für die Wissenschaft und bietet alles vom Standard-Reproscan bis zur farbprofilierten Sonderreproduktion für Veröffentlichungszwecke.
Mehr als 100 000 Scans pro Jahr kommen hier zusammen. Darunter sind viele einfache „Massen-Scans“ für den täglichen Lern-, Lehr- und Arbeitsalltag an der Uni. Und dann eben die Spezialfälle, die zeitaufwändige Digitalisierung der sensiblen, wertvollen alten Werke, die die Unibibliothek Forschern weltweit und jederzeit bestmöglich zugänglich machen will.
Würzburg ist führend bei der Digitalisierung
An der Massendigitalisierung alter Bücher arbeiten zwar viele. An der schwierigen, risikoreichen Digitalisierung von Handschriften aber nur wenige Spezialisten. In Bayern sind es nur die Bayerische Staatsbibliothek, das Germanische Nationalmuseum in Nürnberg und die Universitäten. Und von denen wiederum machen sich die wenigsten so wie die Würzburger die Mühe mit Großformataufnahmen von zwei mal drei Metern oder besonders verletzlichen Objekten, die aus Schutzgründen nicht mehr als 90 Grad geöffnet werden dürfen. So wie die „Libri Sancti Kiliani“, die zu den bedeutendsten Handschriftensammlungen des Mittelalters zählt.
Inzwischen könne man eine ganze Inkunabel innerhalb von zwei bis drei Tagen „inklusive Bildern komplett erfassen“, sagt Marco Dittrich. „Dazu brauchte ein Fotograf früher bis zu zwei Wochen“. Wenn ein alter Druck, eine wertvolle Handschrift gut gescannt ist, müssen Wissenschaftler nicht mehr aufwändig begründen, warum ein wertvolles, sensibles Stück allen konservatorischen Bedenken zum Trotz aus dem Tresor geholt werden soll. Und Philologen und Historiker aus Irland, aus Kalifornien oder sonstwo in der Welt brauchen nicht mehr nach Würzburg zu reisen, um für das Quellenstudium wochenlang im Lesesaal zu sitzen. Das macht das Forschen nicht nur einfacher, sondern freut auch Dr. Uwe Springmann: „Nutzung ist der Feind des Bibliothekars“, sagt er lächelnd.
Ein Astrophysiker, der das schriftliche Erbe wahren und bergen will
Seit Mai leitet Springmann das Digitalisierungszentrum.
Und mindestens so sehr wie um das Erhalten, Sichern und Bewahren geht es ihm darum, die Schriftwerke, die Gedanken früherer Jahrhunderte grenzenlos und demokratisch sichtbar, verfügbar zu machen. Springmann kommt vom Center für Informations- und Sprachverarbeitung (CIS) der Ludwig-Maximilians-Universität München. Und er ist promovierter Astrophysiker. 13 Jahre lang hat er in IT- und Telekommunikationsunternehmen gearbeitet. Bis er eines Tages genug davon hatte, sich damit zu beschäftigen, was die Aktionäre bewegt: „Ich wollte machen, was mich bewegt.“
Der Physiker und Softwarespezialist ging noch einmal an die Universität und studierte Latein. Weil das im Mittelalter und in der Frühen Neuzeit „die internationale Wissenschaftssprache war wie heute Englisch“. Springmann geht es darum, „das literarische Erbe zutage zu fördern“. Ihm geht es um die Gedanken der damaligen Zeit, um die Gedankentiefe, das intellektuelle Gewicht: „Altes Wissen ist nicht obsoletes Wissen.“ Und im Vergleich zu den Äußerungen, Veröffentlichungen, Verlautbarungen der heutigen Zeit seien die alten Schriften „hochkonzentriert“.
Twitter sei „gedanklich hochverdünnte Materie“, sagt der Philologe, „das Alte dagegen ist im Vergleich dazu fast reines Gold“. Und er will es ausbuddeln und an die Oberfläche befördern. Denn alte Schriften zu konservieren und sicher zu verwahren, ist das eine. Ihren Inhalt, den Text nicht mit zu verschließen hinter Archivtüren und Tresorwänden aber die große Herausforderung.
Und wo die Arbeit für Marco Dittrich beendet und eine Aufgabe erfüllt ist mit einer perfekten Abbildung der Seiten, fängt sie für Uwe Springmann an. Der Inhalt der Handschrift soll zu einem Datensatz werden, zu einem elektronischen Text. Das Stichwort, für das Springmann Spezialist ist, heißt Digital Humanities und OCR: Optical character recognition, zu Deutsch automatisierte Texterkennung. Mit Hilfe ausgeklügelter Software und Mustererkennung bringt man den Computer dazu, die Abbilder der Buchstaben zu Buchstaben, also zu Text, zu machen.
Die Tücken der Texterfassung
Mag einfach klingen, ist aber komplex. Denn in früher Zeit gab es weder eine einheitliche Schreibweise noch einheitliche Schriftbilder oder Buchstabentypen. Die Drucker und Schriftsetzer schnitzten, formten, gossen ihre Buchstaben nach Gusto. Man schrieb und druckte im lokalen „Dialekt“. Für die Geisteswissenschaften ist die Digitalisierung epochal: Wo früher der einzelne Philologe in wochenlanger Arbeit Wort für Wort las, Satz für Satz transkribierte und Textstellen verglich, arbeitet jetzt die Maschine. Jetzt lässt sich nach Wörtern oder Passagen suchen, Querverbindungen und Verweise lassen sich darstellen, Zitate aus anderen Werken sichtbar machen – überhaupt der ganze Text weiterverarbeiten.
Zugang für alle: „Die Digitalisierung darf man nicht allein einem Privatunternehmen überlassen“
Alle 30 000 Inkunabel-Titel aus aus den ersten 50 Jahren der Druckgeschichte und überhaupt alle Werke aus 567 Jahren Buchdruckgeschichte zu erfassen – das ist eine Grundidee der digitalen Geisteswissenschaften. „Wir streben Vollständigkeit an“, sagt Springmann. Das sei „eine überschaubare Aufgabe“.
Innerhalb der vergangenen 20 Jahre sei bereits ein Drittel der in Deutschland von 1500 bis 1800 gedruckten Bücher als Bilddigitalisat erfasst worden. Dass dies auch Universitätsbibliotheken tun und das Digitalisieren nicht nur einem Konzern wie Google überlassen, hält Springmann für essenziell: „Eine Demokratisierungsbemühung. Die Digitalisierung darf man nicht allein einem Privatunternehmen überlassen“. Das Wissen der Vorfahren soll „jederzeit, ohne Barrieren, weder finanziell, noch räumlich, noch zeitlich“ allen zur Verfügung stehen.
Beeindruckende Erkennungsraten
In Springmanns Abteilung arbeiten deshalb nicht nur eine Fotografin, Medientechniker Marco Dittrich und Bibliothekare, sondern auch zwei Software-Experten. Mit Kollegen aus München ist Springmann gerade auf der Fachkonferenz DATeCH (Digital Access to Textual Cultural Heritage) für seine Arbeiten zur nachträglichen Korrektur von OCR-Texten ausgezeichnet worden. Auch Informatiker der Uni Würzburg arbeiten an der möglichst fehlerfreien Verarbeitung der digitalisierten Dokumente mit: In der Universitätsbibliothek wurde ihre neue Software an einem Werk aus dem Zeitalter des Frühdrucks getestet.
Die Inkunabel „Der Heiligen Leben“ von 1488 wurde gescannt, mit dem neuen Werkzeug in semantische Einheiten wie Kapitelüberschrift, Illustration, Randbemerkung und Haupttext aufgetrennt und dann mit einem OCR-Programm erfasst, das speziell auf dieses Werk trainiert war. „Da wurde eine Zeichenerkennungsrate von über 97 Prozent erzielt“, sagt Springmann. Ein Wert, der noch vor kurzem undenkbar war. Man hielt es schlicht für unmöglich, frühe Drucke mit OCR zu bearbeiten.
Genau wegen dieses Fortschritts spielt die Würzburger UB momentan eine weltweit führende Rolle, und Springmann hofft, diesen Stand halten und weiter ausbauen zu können. So hat das Bundesforschungsministerium gerade das namensgebende Kallimachos-Projekt, in dem die UB gemeinsam mit Lehrstühlen der Philologie und Informatik an Fragestellungen der Digital Humanities arbeitet, um weitere zwei Jahre verlängert.
Außerdem kooperiert man mit den Informatikern im Projekt „OCR-D“, das von der Deutschen Forschungsgemeinschaft gefördert wird und zum Ziel hat, alle Bilddigitalisate von Drucken aus dem deutschen Sprachraum zwischen 1500 und 1800 automatisch als Text zu erfassen.
Und wer war Kallimachos?
Bleibt nur die Frage, wer Kallimachos war, nach dem das Zentrum für Digital Humanities benannt ist? Der Bibliothekar an der Bibliothek von Alexandrien legte im dritten Jahrhundert vor Christus als Erster einen Katalog von Werkstiteln an – und erleichterte damit den Zugang zu den Schriften in der größten Bibliothek der Alten Welt. In seinem Sinne haben sich die Wissenschaftler und Spezialisten an der UB dem Auftrag verschrieben, den Zugang zu gedrucktem Wissen durch die Digitalisierung zu revolutionieren.