Laubenpieper-Statistik

Das Telephon.
Typische Gartenlauben-Illustration aus dem Artikel "Der Musiktelegraph

Auf meine neugierige Frage im Chat, wie viele Seiten der Gartenlaube denn bereits korrekturgelesen wurden oder sogar fertig sind, hat mir Joergens mal auf die Schnelle eine kleine Statistik bereitgestellt. Und damit diese Arbeit nicht umsonst war, erfährt sie nun die ganze Welt:

  • 22 Bände haben Scans und sind durch die OCR gejagt worden, das macht insgesamt 18916 Seiten
  • Ausgekoppelt, soll heißen als eigenständige Werke angelegt, wurden insgesamt 223 Artikel. Führend dabei der Jahrgang 1863 mit 89 Artikeln.
  • Das macht 532 einmal korrigierte Seiten und 283 Seiten die fertig sind, also zweimal korrekturgelesen wurden.
  • Bei 4 Bänden mit ca. 3000 Seiten existieren Scans auf Commons, die OCR fehlt aber noch.

Fazit: Ein büsschen ist noch zu tun.

P.S. Hätte ich fast vergessen. Seit dem Wochenende gibt es eine Liste der Autoren der Gartenlaube und eine Liste der Liste der Illustratoren, Zeichner und Maler der Gartenlaube. Zweck der Übung ist zuerst mal rauszubekommen, welche Texte und Bilder garantiert gemeinfrei sind. Anlaß diese Listen anzulegen, war der Umstand, dass wir vor ein paar Tagen darauf aufmerksam gemacht wurden, dass Bilder eines bestimmten Zeichners noch nicht gemeinfrei sind. Zu den beiden Listen schreibe ich in den nächsten Tagen noch etwas mehr.

Neuigkeiten aus Wikisource (6)

Es ist mal wieder Zeit und zum Glück auch Gelegenheit einige Neuigkeiten aus Wikisource der geneigten Leserschaft darzubieten:

  • Das Wichtigste gleich zu Beginn: Auf Wikisource befinden sich seit heute insgesamt 11.000 Werke. Damit hat die Neuanlage der letzten tausend Werke etwa 80 Tage gedauert. Dieser Bestand setzt sich u.a. zusammen aus über 4500 Gedichten, etwa 1300 Rechtstexten und fast 800 Texte die wissenschaftliche Sachverhalte darlegen. Hinzukommen über 1700 Autoren-, 187 Themen- und 84 Ortsseiten die den Gesamtbestand zumindest zu großen Teilen erschließen.
  • Mittlerweilen wurden von 18 Jahrgängen der Gartenlaube Scans und OCR-Texte auf Commons bzw. Wikisource verfügbar gemacht. Das sind rund 16.000 Seiten Text. Fast 200 Artikel wurden korrekturgelesen und sind als eigenständige Werke vorhanden.
  • Etwa ein Viertel des Gesamtbestandes von fast 120.000 Seiten in Wikisource wurde bereits zweimal korrekturgelesen. Ein weiteres Viertel wurde zumindest einmal korrekturgelesen.
  • Auch bei der ADB geht es gut voran. Mehr als 26 Prozent der Artikel wurden einmal korrekturgelesen und gute 5 Prozent bereits zweimal. Umgerechnet bedeutet dies, dass 6 Bände bzw. die Buchstaben A, B, C, D und X, Y komplett einmal korrekturgelesen wurden.

Gesundheitsschädlicher Kaffee aufgetaucht

Zitat aus einer auflagenstarken Zeitschrift:

Man hat nicht mit Unrecht die grüne Farbe der Kaffeebohnen als ein Merkmal der Güte betrachtet, aber in neuester Zeit hat dieses Zeichen seinen Werth verloren, weil man häufig die schlechteren Sorten grün färbt, und leider geschieht dieses mit einer Kupfer enthaltenden Farbe, die unbedingt der Gesundheit nachtheilig ist.

und weiter

Daß der geröstete, gemahlene Kaffee zuweilen mit Cichorie gefälscht wird, ist bekannt, da dieser Zusatz billiger als der Kaffee ist, und […] diese Fälschung sich, wenn man darauf achtet, schon durch den Geruch kundgiebt

Aber keine Panik: Wie schon an der Rechtschreibung erkennbar ist, so ganz brandneu ist die Meldung nicht mehr. Datei:Die Gartenlaube (1875) 001.jpgDie Meldung stammt aus einem Artikel in der Gartenlaube des Jahres 1875. Sie zeigt aber sehr schön, dass Lebensmittelskandale keine Erfindung des 20. oder 21. Jahrhunderts sind. In der Vergangenheit wurde genauso gefälscht, gepanscht und der Verbraucher behumst, dass es ein wahres Grauen war.

Als Lektüre in diesem Zusammenhang empfehle ich auch den Artikel über Friedrich Accum in der Wikipedia, einem Chemiker der die Öffentlichkeit bereits im frühen 19. Jahrhundert vor den Gefahren gepanschter und verfälschter Lebensmittel warnte. Accum war der erste, der sich dieses Themas annahm und zugleich eine breite Öffentlichkeitswirkung erzielte.

Natürlich halte ich die geneigte Leserschaft auch weiterhin über neu auftauchende Lebensmittelskandale auf dem Laufenden.

Laubenpieper bei Wikisource

Heute möchte ich mal auf ein Projekt hinweisen, dass zwar schon eine  geraume Weile läuft, aber dennoch noch in den Kinderschuhen steckt: Die Gartenlaube. Einige werden vll. wissen was ich meine, für alle anderen zitiere ich einfach mal den entsprechenden Wikipedia-Artikel:

Die Gartenlaube Illustrirtes Familienblatt (später Illustriertes Familienblatt) war ein Vorläufer moderner Illustrierten und das erste große erfolgreiche deutsche Massenblatt. Es erschien ab 1853 und erreichte 1876 unter dem Verleger Ernst Keil eine Auflagenhöhe von 382.000 Exemplaren. Da Die Gartenlaube sowohl in der gemeinsamen Familienlektüre konsumiert wurde als auch in zahlreichen Leihbibliotheken und Cafés als Auslage zur Verfügung stand, beläuft sich die Schätzung der eigentlichen Leserschaft auf zwei bis fünf Millionen zu ihren Hochzeiten.

und

Die Gartenlaube stellt eine ebenso umfassende wie für viele historische Untersuchungsfelder unverzichtbare Quelle zur deutschen Kulturgeschichte dar, z. B. auch bzgl. der in der Illustrierten veröffentlichten Fortsetzungsromane.

Eine kleine Auswahl der an der Gartenlaube mitwirkenden Autoren, zeigt ebenso die Wichtigkeit dieser Quelle:

und viele andere. Der Wikipedia-Artikel enthält ebenfalls eine kleine Liste von Autoren der Gartenlaube.

Bisher befinden sich 12,5 Jahrgänge auf Wikisource und wurden zum Teil bereits per Inhaltsverzeichnis erschlossen. Einige Artikel wurden auch als eigenständige Werke herausgezogen und korrekturgelesen. Eine Übersicht über die vorhandenen Jahrgänge und den Fortschritt des Projektes kann man sich auf der Werkseite der Gartenlaube verschaffen.

Hauptinitiator und -betreuer des Projektes ist Joergens.mi, der sich die jahrgangsbücher bei Antiquariaten und bei EBay besorgt hat und extra eine Kamerausrüstung angeschafft hat, um die Blätter in optimaler Qualität (soweit es für Privatpersonen eben geht) digitalisieren zu können.

Die OCR der Seiten wurde nach dem Digitalisieren der Seiten durch mich gemacht. Dafür habe ich Finereader 9 verwendet. Die spezielle Fraktur-Version benötigt man nicht unbedingt, wenn man etwas Arbeit investiert und ein paar Sachen beachtet. Hilfreich war allerdings die in der Version 9 eingbaute Funktionalität, dass fotografierte Seite durch die Software automatisch entzerrt werden.

Mit welcher Ausrüstung und wie die Scans genau von Joergens hergestellt wurden und was man bei der OCR von Fraktur-Schriften mit Finereader beachten sollte, darauf gehe ich in einem meiner nächsten Beiträge dann etwas genauer ein.