Fragwürdige Qualität des Münchner Digitalisierungszentrums

Ein gruseliges Beispiel des Digitalisats des Romans Tahiti von Friedrich Gerstäcker vom Münchner Digitalisierungszentrum:

bsb10108669_00006-svg_

Schaut da eigentlich noch jemand auf die Resultate des Scanvorgangs drüber oder wie hat man sich das vorzustellen? Oder haben die jemanden da rangesetzt, der keinen Bock mehr auf seinen Job hatte? Zumindest das was auf der Webseite des MDZ von diesem Roman gezeigt wird, kann man komplett in die Tonne treten. Und nach Aussage von Wikisource-Mitarbeitern, sieht es mit anderen Werken auch nicht besser aus.

Bewahrung des kulturellen Erbes geht irgendwie anders.

Update:

Laubenpieper bei Wikisource

Heute möchte ich mal auf ein Projekt hinweisen, dass zwar schon eine  geraume Weile läuft, aber dennoch noch in den Kinderschuhen steckt: Die Gartenlaube. Einige werden vll. wissen was ich meine, für alle anderen zitiere ich einfach mal den entsprechenden Wikipedia-Artikel:

Die Gartenlaube Illustrirtes Familienblatt (später Illustriertes Familienblatt) war ein Vorläufer moderner Illustrierten und das erste große erfolgreiche deutsche Massenblatt. Es erschien ab 1853 und erreichte 1876 unter dem Verleger Ernst Keil eine Auflagenhöhe von 382.000 Exemplaren. Da Die Gartenlaube sowohl in der gemeinsamen Familienlektüre konsumiert wurde als auch in zahlreichen Leihbibliotheken und Cafés als Auslage zur Verfügung stand, beläuft sich die Schätzung der eigentlichen Leserschaft auf zwei bis fünf Millionen zu ihren Hochzeiten.

und

Die Gartenlaube stellt eine ebenso umfassende wie für viele historische Untersuchungsfelder unverzichtbare Quelle zur deutschen Kulturgeschichte dar, z. B. auch bzgl. der in der Illustrierten veröffentlichten Fortsetzungsromane.

Eine kleine Auswahl der an der Gartenlaube mitwirkenden Autoren, zeigt ebenso die Wichtigkeit dieser Quelle:

und viele andere. Der Wikipedia-Artikel enthält ebenfalls eine kleine Liste von Autoren der Gartenlaube.

Bisher befinden sich 12,5 Jahrgänge auf Wikisource und wurden zum Teil bereits per Inhaltsverzeichnis erschlossen. Einige Artikel wurden auch als eigenständige Werke herausgezogen und korrekturgelesen. Eine Übersicht über die vorhandenen Jahrgänge und den Fortschritt des Projektes kann man sich auf der Werkseite der Gartenlaube verschaffen.

Hauptinitiator und -betreuer des Projektes ist Joergens.mi, der sich die jahrgangsbücher bei Antiquariaten und bei EBay besorgt hat und extra eine Kamerausrüstung angeschafft hat, um die Blätter in optimaler Qualität (soweit es für Privatpersonen eben geht) digitalisieren zu können.

Die OCR der Seiten wurde nach dem Digitalisieren der Seiten durch mich gemacht. Dafür habe ich Finereader 9 verwendet. Die spezielle Fraktur-Version benötigt man nicht unbedingt, wenn man etwas Arbeit investiert und ein paar Sachen beachtet. Hilfreich war allerdings die in der Version 9 eingbaute Funktionalität, dass fotografierte Seite durch die Software automatisch entzerrt werden.

Mit welcher Ausrüstung und wie die Scans genau von Joergens hergestellt wurden und was man bei der OCR von Fraktur-Schriften mit Finereader beachten sollte, darauf gehe ich in einem meiner nächsten Beiträge dann etwas genauer ein.