Wikisource – Das Kategoriensystem

Nach einer halben Ewigkeit setze ich heute mal meine kleine Serie mit etwas tieferen Einblicken in Wikisource fort. Der letzte Beitrag in dieser Serie stammt ja aus dem August 2007, weshalb es doch mal wieder Zeit wird, etwas Neues hinzuzufügen.

Heute widmen wir uns dem Kategorien auf Wikisource, speziell das Kategoriensystem in die die Texte auf Wikisource einsortiert werden, kurz Systematik genannt. Einen Übersicht über die Systematik gibt die entsprechende Seite auf Wikisource.

Für Neuankömmlinge insbesondere aus der Wikipedia mit ihrem überbordenden und oft auch chaotischen Kategoriensystem ist das im deutschsprachigen Wikisource verwendete System erst mal sehr ungewohnt und führt immer wieder zu Verwirrung und auch gelegentlich zu etwas längeren Diskussionen. Und soweit ich weiß, verwendet auch kein anderes Wikimedia-Projekt eine derartige Facettenkategorisierung.

Ziel

Mit dem Kategoriensystem auf Wikisource sollte eine langfristige Lösung geschaffen werden, die genügend Flexibilität und Genauigkeit für die Einodnung und vernünftige Möglichkeiten zur Auffindbarkeit von Texten bietet. Andererseits sollte das System nicht bereits nach kurzer Dauer ausfransen und ins Chaos abgleiten und damit für den Leser unbenutzbar werden.

Die verwendete Facettenkategoriserung wurde, ich glaub 2005, für die Wikipedia vorgeschlagen, aber damals per Meinungsbild abgelehnt. Da die zu kategorisierenden Elemente auf Wikisource allerdings wesentlich homogener sind, bot diese sich meines Erachtens perfekt für Wikisource an, zumal die einzelnen Facetten wesentlich konkreter gewählt werden konnten, als damals in der Wikipedia-Version.

Und die bisherige Erfahrung zeigt, dass das Ziel erreicht wurde. Seit der Einführung im Jahr 2006 wurden nur sehr wenige Kategorien innerhalb der Facetten neu angelegt. So wurden z.B. das 18., 19. und 20 Jahrhundert vor Kurzem in Jahrzehnte unterteilt, da diese doch schon recht groß geworden waren. Außerdem wurde eine zusätzliche Facette Herstellungsform angelegt, um abbilden zu können, in welcher Form, z.B. als Handschrift, uns der Text vorliegt.

Die Facetten

Die Wikisource-Systematik baut auf sechs sogenannten Facetten auf, die grundlegende Eigenschaften des Textes grob beschreiben. Dies sind:

  • Fachgebiet – welchem Fachgebiet kann der Text inhaltlich zugeordnet werden bzw. welches Fachgebiet befasst sich mit dem Text. Werden mehrere Fachgebiete berührt kann ein Text in mehrere Fachkategorien einsortiert werden. Diese Facette wurde nach Vorbild der sogenannten Göttinger Online Klassifikation angelegt.
  • Entstehungszeit – In welchem Jahrhundert ist der Text entstanden. Für die Zeit ab dem 18. Jahrhundert ist eine genauerer Unterteilung in Jahrzehnte vorhanden.
  • Entstehungsort – Wo ist der Text ursprünglich entstanden? Dabei wird der Entstehungsort des Originals angegeben. Die Einsortierung richtet sich grob nach der heutigen Geografie. Es gibt für einige wenige historische Territorien Kategorien, wenn eine genauere Einordnung schwer fällt, so z.B. für das Heilige Römische Reich oder das Römische Reich. Umgedreht gibt es für einige historische Territorien Kategorien, wenn die Texte eindeutig diesem Territorium zugeordnet werden können. Diese Kategorisierung ist allerdings nur für recht wenige Texte wichtig und wird insbesondere für literarische Texte nicht verwendet
  • Sprache – In welcher Sprache wurde der Originaltext verfasst? Eine Einordnung nach Sprachstufen sollte durchgeführt werden, insbesondere für deutschsprachige Texte. Eine Einordnung in mehrere Sprachen erfolgt dann, wenn das Originaldokument in diesen Sprachen abgefasst wurde. Dies trifft insbesondere auf Verträge zu. Gelegentlich kann es auch sinnvoll sein, Übersetzungen in frühere Sprachformen des Deutschen dementsprechend zu kategorisieren (Siehe als Beispiel die Übersetzung der Goldenen Bulle ins Frühneuhochdeutsche). Bei neuhochdeutschen Übersetzungen wird diese Doppelkategorisierung allerdings nicht durchgeführt.
  • Textgattung – Diese Facette beschreibt in welcher Form der Text verfasst wurde (Stil, Art der sprachlichen Mittel). Also ob es sich beispielsweise um ein Gedicht, eine Rede oder um ein Essay handelt. Bei unsicherer Zuordnung zu einer bestimmten Textgattung, kann eine entsprechende Oberkategorie für die Kategorisierung verwendet werden.
  • Herstellungsform – Diese Facette ist optional. Diese Facette wird nur verwendet, wenn auch die in Wikisource verwendete Textgrundlage einer der Herstellungsformen entspricht. So wird ein Brief der uns im Original als Handschrift vorliegt in die Kategorie Handschrift einsortiert. Würde uns derselbe Brief als Ausgabe in einem gedruckten Editionsband vorliegen, dann würde diese Facette nicht vergeben werden.

Der Kategorienbaum

Alle Facetten sind vollständig unabhängig voneinander. Das heisst: Jede Kategorie in der Systematik gehört zu genau einer Facette und jede Kategorie hat genau eine Oberkategorie.  Sogenannte Schnittmengen, wie z.B. “Englische Gedichte des 19. Jahrhundert“, ergeben sich zwanglos aus den zugeordneten Kategorien der verschiedenen Facetten. Solche und ähnliche Kategorien brauchen und dürfen deshalb nicht angelegt werden. Ganz im Gegensatz zur Wikipedia, wo Hunderte solcher Schnittmengenkataegorien existieren und es immer wieder Löschanträge hagelt, weil es etliche dieser Schnittmengen gibt, die nur sehr dünn besetzt sind, aber der Vollständigkeit wegen angelegt wurden. Sehr beliebt sind da immer wieder Sportlerkategorien, wie Biathlet aus Neuseeland oder ähnliches.

Einige Kategorienamen in verschiedenen Facetten klingen ähnlich, sind aber nicht äquivalent oder bedeuten nicht das Gleiche. So wird ein Text mit der Kategorie Rechtstext der Facette “Textgattung“ sicherlich in den meisten Fällen auch in der Kategorie Rechtswissenschaft der Facette “Fach“ oder einer der Unterkategorien einsortiert werden, aber umgedreht muss nicht jeder Text aus der Kategorie Rechtswissenschaft auch ein Rechtstext sein. So finden sich viele Texte die dem Fach Rechtsgeschichte zugeordnet sind, auch in der Textgattung Kategorie Darstellung.

Ein anderes Beispiel ist der Text Der Prosector in der Westentasche. Dies ist ein Text aus dem Bereich Medizin, der in Versform geschrieben ist. Solche Kombinationen können völlig problemlos über das Facettensystem abgebildet werden, ohne zusätzliche Kategorien einführen zu müssen.

Kategorisierung von Texten

In die Wikisource-Systematik werden nur Texte einsortiert, keine Orts-, Themen– oder Autorenseiten oder Kategorien die Werke zusammenfassen.  Diese Einschränkung führt auch immer wieder zu Verwirrungen. Aber wie man oben gesehen hat, gibt es eben keine eindeutige Zuordnung von Themen, Autoren oder Orten zu Kategorien. Außerdem ist die Systematik für die Texte vorbehalten, um diese auffinden zu können.

Jeder Text soll in die fünf Hauptfacetten einsortiert werden. Die Facette “Fach“ und “Textgattung“ kann mehrfach vergeben werden. Im Zweifelsfall sollte bei allen Facetten eine allgemeinere Oberkategorie vergeben werden.

Jede Hierarchiestufe der jeweiligen Facette darf zur Kategorisierung verwendet werden. Eine Ausnahme bildet die Kategorie Historisches Territorium. Diese Kategorie dient nur dem Zusammenhalt der untergeordneten Kategorien. Ein Einordnung eines Texte in diese Kategorie ergibt auch wenig Sinn, da damit keinerlei Informationsgewinn verbunden wäre.

Unabhängig von den Kategorien in der Systematik, darf jeder Text in Werk- und Autorenkategorien einsortiert werden.

Aber wie finde ich nun bestimmte Texte?

Das ist derzeit noch eine Schwachstelle des gesamten Systems. Neben dem rein manuellen Durchklicken durch die einzelnen Facettenbäume, soll natürlich vorrangig CatScan verwendet werden. Das Tool hat allerdings noch ein paar Nachteile. Leider können nicht alle sechs Facetten miteinander geschnitten werden, sondern nur zwei. Außerdem ist die Oberfläche noch etwas nerdig bzw. projektbezogen, um tatsächlich von normalen Lesern so einfach verwendet werden zu können. Aber da ja Duesentrieb seit kurzem beim Verein angestellt ist, habe ich ja die Hoffnung, dass auch an diesem Tool noch etwas Feintuning betrieben wird.

Außerdem gibt es eine, zugegebenermaßen noch etwas dünn besetzte, Seite mit Beispielanfragen, welche dann einfach wiederverwendet werden können.

So, ich hoffe mit diesem Beitrag etwas mehr Klarheit in das auf den ersten Blick etwas ungewohnte Kategoriensystem bei Wikisource gebracht zu haben.

Wikisource -Themen und Projekte, Teil 2

Nun hat der dritte Teil meiner kleinen Serie zu Wikisource leider etwas länger gedauert, als ich eigentlich geplant hatte. Heute möchte ich mich dem Thema Literatur bei Wikisource widmen natürlich ist die Auswahl wie immer subjektiv und völlig unrepräsentativ. Es gibt noch vielmehr schönes bei uns zu entdecken. Und auch hier wieder meine Schmöker- und Stöber-Empfehlung: Zuerst sind da unsere Kategorien Versdichtung, Erzählprosa und Drama zu nennen. Aber auch in Blick in die Kategorie Autoren kann sich lohnen, wenn man Werke eines bestimmten Autors sucht.

Aber erstmal eine Bemerkungen vorneweg. Leider sind die sogenannten Klassiker, wie Goethe, Schiller und Co. recht wenig bei Wikisource vertreten. Wir mussten im Laufe der Zeit leider einige Texte löschen, da für diese keine vernünftigen Textgrundlagen vorlagen. Wie im ersten Teil erläutert, wären dies Scans oder E-Texte einer Erstausgabe oder einer anderen maßgeblichen Edition. Und da mussten wir eben in den sauren Apfel beissen und die Texte löschen, was aber zu einigen Auseinandersetzungen und auch zu einem Sturm im Wasserglas im internationalen Wikisource-Skriptorium führte. Da die meisten der Werke aber sowieso von gutenberg.de oder von woanders im Internet nach Wikisource kopiert wurden, ist kein wirklicher Verlust eingetreten. Und die kleinen gelben Heftchen kosten ja nun auch nicht Welt.

Trotzdem kommt auch der Klassikerfreund bei uns auf seine Kosten. So finden sich zum Beispiel die von Friedrich Schiller herausgegebenen Zeitschriften Thalia und Neue Thalia, sein Geschichtswerk Geschichte des 30jährigen Kriegs, aber auch Kabale und Liebe, Ritter Toggenburg, Maria Stuart und noch einiges mehr. Bei Goethe sieht es leider etwas weniger gut aus, denn die meisten der aufgeführten Werke beruhen auf einer unbekannten Textgrundlage. Sie entsprechen damit zwar nicht unseren hohen Qualitätsansprüchen, für die Lektüre in der Schule oder zum Schmökern, sind die Texte natürlich trotzdem ok.

Ein Schwerpunkt unserer Literaturabteilung bilden die sogenannten „Verbrannten Dichter“. Die Werke dieser Dichter, die als „undeutsch“ und „schädlich“ gebrandmarkt wurden, wurden von den Nazis erstmals am 10. Mai 1933 auf einem Scheiterhaufen verbrannt. Von diesen Dichtern können wir bei Wikisource Joachim Ringelnatz, Kurt Tucholsky und den von den Nazis ermordeten anarchistischen Dichter Erich Mühsam präsentieren. Bekannt ist sicherlich der Kuttel Daddeldu von Ringelnatz. Empfehlenswert ist auch die Satire Hitler und Goethe – Ein Schulaufsatz von Kurt Tucholsky. Die meist kämpferischen Gedichte von Erich Mühsam sind sicherlich nicht jedermanns Geschmack, sind aber auch als Zeitdokumente aus dem ersten Drittel des 20. Jahrhunderts mit seinen Auseindersetzungen und Kämpfen hochinteressant. Als kleine Auswal ein eher poetisches Gedicht von Erich Mühsam, das mir sehr gut gefällt:

Spruch

Juni 1916

Wenn ihr mich weinen seht,
fragt nicht, warum.
Leid, das in Tränen steht,
tröstet sich stumm.

Wenn ihr mich fluchen hört,
stimmt mich nicht mild.
Zorn, der sich laut empört,
schmilzt, wenn er schilt.

Doch wenn ich trink und lach,
lad ich euch ein.
Freude wird grau und schwach,
bleibt sie allein.

Die Fabeln und Erzählungen von Christian Fürchtegott Gellert verdanken wir dem unermüdlichen Einsatz der bereits erwähnten Dame aus der historischen Gymnasialbibliothek hier in Hamburg. Das besondere daran ist, dass wir die Texte nach der Ausgabe von Gellerts Schriften aus dem Jahre 1769 transkribiert haben. Auch wenn moderne Ausgaben relativ wenig von dieser abweichen, finde ich es sehr schön wenn wir auch solch alte Ausgaben präsentieren können. Lese- und Schmunzelttipp: Das Gespenst

Eine Gedichtsammlung der etwas anderer Art und damit fast schon eine kleine Überleitung zum nächsten Teil meiner Serie ist die Gedichtsammlung Die deutschen Kaiser von Max Barack vorstellen. Dieses Buch aus dem Jahre 1888 enthält Gedichte über alle Kaiser von Karl dem Großen bis zum ollen Wilhelm 2. Und zu jedem der Herren gibt es noch ein hübsches Bildchen im typischen heroischen Stil des 19. Jahrhunderts. Hohe Dichteskunst ist sicherlich was anderes und für heutige Leser entwickelt die Reimeskunst auch eher unfreiweillige Komik, aber trotzdem eine nette Lektüre für den historisch interessierten Gedichtfreund.

Da sich natürlich literarische Texte hervorragend zum Vertonen eignen, ist der Anteil solcher Texte innerhalb unseres kleinen, leider etwas eingeschlafenen Projektes Gesprochene Wikisource sehr hoch. Und einige Perlen sind dort bereits zu finden Empfehlen kann ich insbesondere die von Kellerkind und Phantomkommando gesprochenen Werke. Hier zwei Links zu zwei gesprochenen Gedichten, die mir besonders gut gefallen (OGG-Format): An Land und Die Bürgschaft. (Eigentlich wollte ich die beiden hier mit so einem netten Player einbinden, was mir aber noch nicht so recht gelungen ist. Deshalb auf diesem etwas unbequemeren Wege.)

Und noch eine Empfehlung zum Schluss. In den letzten Wochen wurde eine spezielle Seite für Autorinnen aufgebaut, die Texte in Wikisource und andere Digitalisate im Internet auflistet. Da ist bereits einiges zusammengekommen. Viel Spaß beim Schmökern.

Wie immer konnte dieser Beitrag nur einen winzigen Ausschnitt über die Bandbreite an literarischen Texten bei Wikisource zeigen. Man hätte noch viel mehr Dichter und Autoren nennen müssen, wie z.B. Dante, Fontane, Annette von Droste-Hülshoff u.v.a.m.

Hinweis:

Leider habe ich mir mit Einstellen dieses dritten Teils den zweiten Teil (der war über die wissenschaftlichen Texte) zerschossen. Ich konnte den Text zum Glück aus einem Backup wiederherstellen, aber leider sind die Kommentare weg. Und die Bewertungen dieses Teils sind nun hier. Kann man leider nichts machen. Aber besser so, als wenn der Text komplett verschwunden wäre.

Wikisource -Themen und Projekte, Teil 1

Kommen wir also heute zum zweiten Teil meiner kleinen Reihe über Wikisource. Wie beim letzten mal angedeutet möchte ich diesmal die in Wikisource vertretenen Themen und einige größere Projekte vorstellen.

Nach meiner Beobachtung bietet Wikisource eine wesentlich größere thematische Bandbreite an Texten als andere ähnliche Projekte. Die meines Erachtens drei großen Standbeine von Wikisource sind folgende Themengebiete:

  • Historische Texte (z.B. Flugschriften, Handschriften, Gesetze und Vorschriften, Chroniken, Beschreibungen) und wissenschaftliche Aufsätze zur Geschichte die mittlerweile gemeinfrei sind
  • literarische Texte, wie z.B. Gedichte, Novellen, Romane
  • naturwissenschaftliche Texte

Der dritte Punkt ist eines der ganz wichtigen Unterscheidungsmerkmale zu anderen Projekten und auch zu anderen Sprachausgaben von Wikisource, denn solche Texte sind woanders kaum zu finden. Dass wir mittlerweile einige historische wissenschaftliche Aufsätze vorweisen können, ist eher dem Zufall zuzuschreiben, denn einer bewussten Entscheidung. Seit Anfang an arbeiten nämlich einige Leute mit, die nicht aus der historischen Ecke kommen oder sich für Literatur interessieren, sondern die eine naturwissenschaftliche Ausbildung haben und damit wird auch klar, dass ihre Interessen eher bei mathematischen, biologischen oder physikalischen Texten liegen. Und wie es so oft ist, wenn man erst mal mit sowas anfängt, gibt es andere die dadurch angeregt werden mitzuarbeiten und weitere naturwissenschaftliche Texte einstellen.

Kommen wir zu den konkreten Texten díe wir mittlerweile bei Wikisource haben. Die Auswahl ist völlig subjektiv und zufällig und andere hätten sicherlich eine andere Auswahl getroffen. Trotzdem sollte diese ein gutes Bild über die Fülle an Texten bieten, die den Leser erwarten.

Fangen wir mit den Klassiker von Wikisource an. Das sind für mich die Projekte, die wir auch schon mal aktiv in Pressemitteilungen beworben haben und die meist auftauchen, wenn die Rede auf Wikisource kommt. Da müssen wir natürlich als allererstes Projekt die Zimmerische Chronik nennen. Dies ist die Familienchronik der schwäbischen Herren von Zimmern und stellt eine herausragende Quelle zur Adelskultur des 16. Jahrhunderts, deren Werte und Familienleben, aber auch zur Volkskultur und mit ihren vielen Schwänken und unterhaltsamen Geschichten aber auch zur Erzählforschung dar. Ursprünglich wurde diese Chronik in einer Handschrift niedergelegt. In Wikisource wurde die Ausgabe dieser Chronik von Karl August Barack transkribiert, die im Jahre 1880 erschien.

Die Chronik war im Februar 2006 das erste grosse Projekt von Wikisource und die Fertigstellung hat insgesamt über 10 Monate gedauert. Ich hatte die Ehre die 2500 Seiten durch meine OCR-Software zu jagen und die einzelnen Seiten hochzuladen. Viele andere fleissige Helfer haben sich hingesetzt und all diese Seiten zweimal korrekturgelesen. Und ich muss sagen, wir waren unheimlich stolz als das Werk geschafft war. Dieses Projekt hat gezeigt, dass Wikisource lebensfähig ist und auch eine kleine Truppe in der Lage ist Grosses zu stemmen.

Das zweite Projekt was im Frühsommer 2006 durch die Presse und auch durch den Heise-Newsticker gejagt wurde, war das Rechenbuch des Andreas Reinhardt. Das ist ein Mathematiklehrbuch aus dem 16. Jahrhundert, was interessanterweise als Handschrift vorliegt, obwohl zu dieser Zeit der Buchdruck schon längst seinen Siegeszug angetreten hatte. Das Original wurde uns freundlicherweise durch eine hamburgische historische Gymnasialbibliothek zur Verfügung gestellt und die Kosten der Digitalisierung in Göttingen hat der Verein Wikimedia Deutschland übernommen. Leider ist die Transkription des Werkes noch nicht abgeschlossen, aber das was bisher hier geleistet wurde, entspricht den höchsten wissenschaftlichen Ansprüchen an solch eine Edition und die Fertigstellung wird sicherlich auch nicht mehr allzulang auf sich warten lassen.

Und da ja das Korrekturlesen der Zimmerischen Chronik und das Entziffern einer alten Handschrift die nimmermüden Wikisourcler nicht wirklich ausfüllt, wurden natürlich auch neue Projekte begonnen und alte fortgesetzt. Deshalb nun eine kleine Übersicht über die naturwissenschaftlichen Texte in Wikisource

Naturwissenschaftliche Texte

Ein schon seit 2004 brachliegendes Projekt, im Wikisource-Jargon eine Projektruien, wurde dank der neu hinzukommenden Mitarbeiter fortgesetzt und zumindest einmal korrekturgelesen, die Insectenfressende Pflanzen. Vom deutschen Mathematiker Bernhard Riemann gibt es die Karl Hattendorf mitgeschriebenen, ausgearbeiteten und im Jahre 1880 veröffentlichten Mitschriften seiner Vorlesungen mit dem Titel Schwere, Elektricität und Magnetismus. Problematisch bei diesem Buch sind die vielen mathematischen Formeln, die sich einer OCR widersetzen und deshalb per Hand in Wiki-Tex nachgesetz werden mussten, was einerseits einiges an Tex-Kenntnissen aber auch an Fachkenntnissen erfordert.

Eines der etwas grösseren Projekte das auf Grund der Faszination des Textes und des Themas in sehr kurzer Zeit fertig gestellt werden konnte, ist Die Ursache des Einschlagens vom Blitze von Johann Albert Heinrich Reimarus aus dem Jahre 1769. Dabei handelt es sich um die erste deutschsprachige Monografie zum Thema Blitz und Blitzableiter. Dieses wissenschaftliche Werk ist sehr gut lesbar und vermittelt einen sehr guten Eindruck über die Schäden die Blitze jahrein, jahraus in den Städten und Dörfern anrichtete und zeigt wunderbar den Kampf der naturwissenschaftlichen Erkenntnis gegen alten Aberglaube und Unwissen. Und für mich waren besonders interessant die Schilderungen Reimarus‘, wie er den Folgen von Blitzeinschlägen nachforscht. Anhand seiner Schilderungen hatte ich sofort das Bild eines Mannes im Kopf, der in der typischen Kleidung seiner Zeit, die wir ja aus diversen Filmen kennen, auf Kirchtürmen und anderen Gebäuden seiner Heimatsstadt Hamburg herumklettert und für seine Zeitgenossen wahrscheinlich ein wenig wunderlich wirkte.

Ich konnte hier nur einen sehr kleinen Ausschnitt aus den naturwissenschaftlichen Texten bei Wikisource geben. Derjenige der in historischen naturwissenschaftlichen Texten weiterschmökern möchte , dem empfehle ich unsere Fachkategorien: Physik, Mathematik, Technik, Biologie, Chemie

So das war ein erster Streifzug durch die Texte bei Wikisource. Da dieser Beitrag ansonsten viel zu lang geworden wäre, werde ich das nächstemal fortsetzen mit der Vorstellung von historischen und literarischen Texten. Und wenn der Platz reicht auch ein paar amüsante, interessante und kuriose Texte vorstellen. Ansonsten gibt es eben noch einen dritten Teile von „Wikisource – Themen und Projekte“. Einen gesonderten Beitrag werde ich den bei Wikisource vertretenen Lexika und Enzyklopädien widmen und auch das Für und Wider innerhalb der Community versuchen darzustellen.

Bildernachweis:

  • „Hochauflösender Scan im Göttinger Digitalisierungszentrum“, Fotograf: Heiko Hornig, Lizenz: CC-BY-SA 2.5

Wikisource – Eine Einführung

Mit diesem Beitrag möchte ich eine kleine Reihe über Wikisource eröffnen. Vielen dürfte dieses Schwesterprojekt der allseits bekannten Wikipedia noch unbekannt sein und auch vielen Wikipedianern ist nicht so recht klar, was wir da so treiben und was das Ganze soll. Wischen wir also mal den Staub von den alten Büchern weg und legen los. *hust*

Wikisource versteht sich selbst als eine Sammlung von Quellentexten, die entweder gemeinfrei sind oder unter einer freien Lizenz stehen. Zweiteres trifft meist auf Übersetzungen eigentlich gemeinfreier Texte zu. Nun mag man einwenden: „Sowas gibt es doch schon mehrfach im Internet, z.B. gutenberg.de. Braucht es sowas noch einmal?“ Nunja, es gibt bereits mehrere Projekte im Internet, die wie Wikisource alte, meist gemeinfreie Texte digitalisieren. Es gibt aber zwischen diesen Projekte teilweise sehr große Unterschiede und so hat sich Wikisource auch ein eigenes Profil geschaffen, was dieses Projekt unserer Meinung nach einzigartig macht ;-). Bevor ich aber dazu komme, erstmal ein kleiner Ausflug in die Vergangenheit des Projektes.

Wikisource wurde am 24. November 2003 als multilinguales Projekt gestartet. Damals trug es noch den Namen Sourceberg, weshalb das Logo auch ein Eisberg ziert. Hintergrund der Grüpndung war, dass immer mehr versucht wurde reine Quellentexte, z.B. Gesetze, Gedichte, Lieder, Chroniken usw. in die Wikipedia einzustellen, was verständlicherweise auf wenig Gegenliebe stieß. Deshalb also das neue Projekt, das diese Texte aufnehmen sollte.

Irgendwann 2004 oder 2005 stieß ich auf das Projekt und es war auch auf Grund der verschiedenen Sprachen das reinste Kuddelmuddel. Jeder lud dort seine Texte ab, die er irgendwo, meist im Internet gefunden hatte und verschwand oft wieder. So faszinierend ich die Idee fand, so wenig begeisterte mich die Umsetzung. Ansprüche an die Qualität der Texte? Keine. Nachweise der Herkunft der Texte? Keine. Autorenangaben? Kaum bis gar nicht. Erläuterungen? keine. Kategorien? Das gleiche Chaos wie in der Wikipedia. (Mit dem heutigen Kategoriensystem in Wikisource beschäftige ich mich in einem gesonderten Beitrag). Irgendwelche sinnvollen Vorgaben und Hinweise wie man Texte ediert? Faktisch nicht vorhanden. Also machte ich mich erstmal wieder vom Acker.

Wohl auch auf Grund dieses Chaos gab es ab Anfang 2005 Bemühungen das gemeinsame Projekt ähnlich wie die Wikipedia nach Sprachen aufzutrennen. Nach einigem Hickhack wurde das dann auch so gemacht und so gibt es seit dem 23. August 2005 de.wikisource.org, das deutschsprachige Wikisource-Projekt. Anfänglich war die deutschsprachige Community sehr klein und teilweise waren nicht mal mehr Admins vorhanden, so dass ich gebeten wurde, da ich weiterhin alle Weile mal reinschaute Admin zu werden, um zumindest den gröbsten Blödsinn dort zu verhindern. Ein Konzept war allerdings noch nicht so wirklich in Sicht, auch wenn sich die zwei, drei Leute redlich bemühten die Texte die aus dem gemeinsamen Projekt übertragen worden waren, aufzuarbeiten und zumindest erst mal zu sichten, was denn alles so vorhanden war.

Richtig eingestiegen bin ich dann bei Wikisource im Januar 2006, weil jemand auf die Schnapsidee kam, die Zimmerische Chronik zu digitalisieren, besser gesagt die Ausgabe von 1888. Das waren immerhin rund 2500 Seiten. Also versprochen und getan. OCR angeworfen und begonnen Seite für Seite hochzuladen. Daneben noch ein bisschen Werbung machen in der Wikipedia und anderswo für dieses konkrete Projekt und Wikisource insgesamt. Natürlich haben wir auch geholfen die Altbestände aufzuarbeiten und dabei festgestellt, ohne ein neues Konzept und die konsequente Umsetzung dieses Konzeptes wird Wikisource immer eine beliebige Textsammlung von aus dem Internet kopierten Texten bleiben und die Frage von oben müsste man folgendermassen beantworten: „Nein, sowas bräuchte es nicht nochmal.“

Wikisource hat seit dieser Neukonzeptionierung im Frühjahr 2006 den Anspruch, E-Texte wissenschaftlich verwertbar zu präsentieren. Dies beinhaltet korrekte Angaben der Textquellen, also aus welcher Ausgabe eines Buches oder einer Zeitschrift wurde der Texte entnommen oder wurden beispielsweise die Scans einer Universitätsbibliothek zugrundegelegt. Es müssen immer Verfasser, Entstehungszeit, Erscheinungsort und -zeit angegeben werden. Weiterhin kommentieren wir die Texte und bieten z.B. durch die Identifizierung von in den Texten erwähnten Personen einen deutlichen Mehrwert zur reinen Textdarstellung. Oft finden sich auch kleine Einleitungen, die den Text in ihren historischen Kontext stellen oder auf bestimmte Merkmale des Textes hinweisen.

Weiterhin haben wir uns darauf verständigt, nur noch Texte aufzunehmen, zu denen eine gescannte Vorlage entweder auf Wikimedia Commons oder im Netz vorliegt. Warum das? Im Zuge der Arbeit an der Zimmerischen Chronik hat sich herausgestellt, dass ein durch eine OCR oder von der Vorlage abgetippter Texte mindestens zweimal korrekturgelesen werden muss, um eine akzeptable Qualität zu erreichen. Und dies geht eben nur wenn jeder Zugriff auf die Scans hat. Als schöner Nebeneffekt kann der Leser später jederzeit nachprüfen, ob wir richtig gearbeitet haben und vll. noch Fehler melden. Auf diese Weise soll die Zitierfähigkeit der Texte gewährleistet werden.

Außerdem finde ich persönlich die alten Drucke aus dem 15., 16. oder 17. Jahrhundert sehr interessant und meist auch ästhetisch ansprechend. Und auch der Leser kann sehen wie Drucke oder Briefe zu dieser Zeit aussahen. Von den meist sehr schönen, informativen oder skurrilen Stichen und Holzschnitten mal ganz zu schweigen. Sowas unseren Besuchern vorzuenthalten würde ich als inakzeptabel empfinden.

Mittlerweilen sind rund 8600 Seiten von etwas über 20.000 Seiten bei Wikisource zweimal korrekturgelesen geworden und die kleine aber recht stabile Community umfasst ca. 30 Leute. Wobei viele der bei Wikisource Aktiven auch in der Wikipedia sehr bekannte Autoren sind, und Wikisource u.a. dafür nutzen, um die dortigen Artikel mit den Quellentexten zu ergänzen.

Zusätzlich zum wissenschaftlichen Anspruch, hat sich Wikisource auf die Fahnen geschrieben, insbesondere Texte vorzustellen, die sonst nirgends im Netz zu finden sind. Also z.B. Flugblätter aus dem Dreißigjährigen Krieg, Texte aus der Wissenschafts- und Technikgeschichte, Dichter und Literaten, wie z.B. Erich Mühsam, die fast vergessen sind, Handschriften und Briefe. Und da bin ich schon fast beim Thema meines nächsten Beitrages.

Im nächsten Beitrag werde ich die thematische Bandbreite bei Wikisource vorstellen und auf verschiedene Projekte etwas genauer eingehen.