Wikisource – Eine Einführung

Mit diesem Beitrag möchte ich eine kleine Reihe über Wikisource eröffnen. Vielen dürfte dieses Schwesterprojekt der allseits bekannten Wikipedia noch unbekannt sein und auch vielen Wikipedianern ist nicht so recht klar, was wir da so treiben und was das Ganze soll. Wischen wir also mal den Staub von den alten Büchern weg und legen los. *hust*

Wikisource versteht sich selbst als eine Sammlung von Quellentexten, die entweder gemeinfrei sind oder unter einer freien Lizenz stehen. Zweiteres trifft meist auf Übersetzungen eigentlich gemeinfreier Texte zu. Nun mag man einwenden: „Sowas gibt es doch schon mehrfach im Internet, z.B. gutenberg.de. Braucht es sowas noch einmal?“ Nunja, es gibt bereits mehrere Projekte im Internet, die wie Wikisource alte, meist gemeinfreie Texte digitalisieren. Es gibt aber zwischen diesen Projekte teilweise sehr große Unterschiede und so hat sich Wikisource auch ein eigenes Profil geschaffen, was dieses Projekt unserer Meinung nach einzigartig macht ;-). Bevor ich aber dazu komme, erstmal ein kleiner Ausflug in die Vergangenheit des Projektes.

Wikisource wurde am 24. November 2003 als multilinguales Projekt gestartet. Damals trug es noch den Namen Sourceberg, weshalb das Logo auch ein Eisberg ziert. Hintergrund der Grüpndung war, dass immer mehr versucht wurde reine Quellentexte, z.B. Gesetze, Gedichte, Lieder, Chroniken usw. in die Wikipedia einzustellen, was verständlicherweise auf wenig Gegenliebe stieß. Deshalb also das neue Projekt, das diese Texte aufnehmen sollte.

Irgendwann 2004 oder 2005 stieß ich auf das Projekt und es war auch auf Grund der verschiedenen Sprachen das reinste Kuddelmuddel. Jeder lud dort seine Texte ab, die er irgendwo, meist im Internet gefunden hatte und verschwand oft wieder. So faszinierend ich die Idee fand, so wenig begeisterte mich die Umsetzung. Ansprüche an die Qualität der Texte? Keine. Nachweise der Herkunft der Texte? Keine. Autorenangaben? Kaum bis gar nicht. Erläuterungen? keine. Kategorien? Das gleiche Chaos wie in der Wikipedia. (Mit dem heutigen Kategoriensystem in Wikisource beschäftige ich mich in einem gesonderten Beitrag). Irgendwelche sinnvollen Vorgaben und Hinweise wie man Texte ediert? Faktisch nicht vorhanden. Also machte ich mich erstmal wieder vom Acker.

Wohl auch auf Grund dieses Chaos gab es ab Anfang 2005 Bemühungen das gemeinsame Projekt ähnlich wie die Wikipedia nach Sprachen aufzutrennen. Nach einigem Hickhack wurde das dann auch so gemacht und so gibt es seit dem 23. August 2005 de.wikisource.org, das deutschsprachige Wikisource-Projekt. Anfänglich war die deutschsprachige Community sehr klein und teilweise waren nicht mal mehr Admins vorhanden, so dass ich gebeten wurde, da ich weiterhin alle Weile mal reinschaute Admin zu werden, um zumindest den gröbsten Blödsinn dort zu verhindern. Ein Konzept war allerdings noch nicht so wirklich in Sicht, auch wenn sich die zwei, drei Leute redlich bemühten die Texte die aus dem gemeinsamen Projekt übertragen worden waren, aufzuarbeiten und zumindest erst mal zu sichten, was denn alles so vorhanden war.

Richtig eingestiegen bin ich dann bei Wikisource im Januar 2006, weil jemand auf die Schnapsidee kam, die Zimmerische Chronik zu digitalisieren, besser gesagt die Ausgabe von 1888. Das waren immerhin rund 2500 Seiten. Also versprochen und getan. OCR angeworfen und begonnen Seite für Seite hochzuladen. Daneben noch ein bisschen Werbung machen in der Wikipedia und anderswo für dieses konkrete Projekt und Wikisource insgesamt. Natürlich haben wir auch geholfen die Altbestände aufzuarbeiten und dabei festgestellt, ohne ein neues Konzept und die konsequente Umsetzung dieses Konzeptes wird Wikisource immer eine beliebige Textsammlung von aus dem Internet kopierten Texten bleiben und die Frage von oben müsste man folgendermassen beantworten: „Nein, sowas bräuchte es nicht nochmal.“

Wikisource hat seit dieser Neukonzeptionierung im Frühjahr 2006 den Anspruch, E-Texte wissenschaftlich verwertbar zu präsentieren. Dies beinhaltet korrekte Angaben der Textquellen, also aus welcher Ausgabe eines Buches oder einer Zeitschrift wurde der Texte entnommen oder wurden beispielsweise die Scans einer Universitätsbibliothek zugrundegelegt. Es müssen immer Verfasser, Entstehungszeit, Erscheinungsort und -zeit angegeben werden. Weiterhin kommentieren wir die Texte und bieten z.B. durch die Identifizierung von in den Texten erwähnten Personen einen deutlichen Mehrwert zur reinen Textdarstellung. Oft finden sich auch kleine Einleitungen, die den Text in ihren historischen Kontext stellen oder auf bestimmte Merkmale des Textes hinweisen.

Weiterhin haben wir uns darauf verständigt, nur noch Texte aufzunehmen, zu denen eine gescannte Vorlage entweder auf Wikimedia Commons oder im Netz vorliegt. Warum das? Im Zuge der Arbeit an der Zimmerischen Chronik hat sich herausgestellt, dass ein durch eine OCR oder von der Vorlage abgetippter Texte mindestens zweimal korrekturgelesen werden muss, um eine akzeptable Qualität zu erreichen. Und dies geht eben nur wenn jeder Zugriff auf die Scans hat. Als schöner Nebeneffekt kann der Leser später jederzeit nachprüfen, ob wir richtig gearbeitet haben und vll. noch Fehler melden. Auf diese Weise soll die Zitierfähigkeit der Texte gewährleistet werden.

Außerdem finde ich persönlich die alten Drucke aus dem 15., 16. oder 17. Jahrhundert sehr interessant und meist auch ästhetisch ansprechend. Und auch der Leser kann sehen wie Drucke oder Briefe zu dieser Zeit aussahen. Von den meist sehr schönen, informativen oder skurrilen Stichen und Holzschnitten mal ganz zu schweigen. Sowas unseren Besuchern vorzuenthalten würde ich als inakzeptabel empfinden.

Mittlerweilen sind rund 8600 Seiten von etwas über 20.000 Seiten bei Wikisource zweimal korrekturgelesen geworden und die kleine aber recht stabile Community umfasst ca. 30 Leute. Wobei viele der bei Wikisource Aktiven auch in der Wikipedia sehr bekannte Autoren sind, und Wikisource u.a. dafür nutzen, um die dortigen Artikel mit den Quellentexten zu ergänzen.

Zusätzlich zum wissenschaftlichen Anspruch, hat sich Wikisource auf die Fahnen geschrieben, insbesondere Texte vorzustellen, die sonst nirgends im Netz zu finden sind. Also z.B. Flugblätter aus dem Dreißigjährigen Krieg, Texte aus der Wissenschafts- und Technikgeschichte, Dichter und Literaten, wie z.B. Erich Mühsam, die fast vergessen sind, Handschriften und Briefe. Und da bin ich schon fast beim Thema meines nächsten Beitrages.

Im nächsten Beitrag werde ich die thematische Bandbreite bei Wikisource vorstellen und auf verschiedene Projekte etwas genauer eingehen.