Kurz verlinkt

Wikimedium

Im Wikimedia-Blog wurde heute die neue Zeitung von Wikimedia Deutschland mit Namen WIKIMEDIUM vorgestellt. Die gedruckte Version wurde bereits am Wochenende auf der Mitgliederversammlung (Bericht darüber von Ziko im Kurier, dem ich allerdings nicht in allen Details zustimmen kann, aber egal) verteilt. Eine Online-Version im PDF-Format ist auch verfügbar.

Titel WIKIMEDIUM

In den Kommentaren wurde kritisiert, dass die anderen Projekte in der Erstausgabe praktisch nicht vorhanden waren. Das ist bedauerlich und auch nicht verwunderlich, kann aber leicht geändert werden, wenn man die Redaktion, insbesondere Catrin Schoneville, mit entsprechenden Infos zu den Projekten versorgt. Ich werde meinen Teil bezüglich Wikisource dazu beitragen.

Sehr löblich, dass die gesamte Zeitung unter der CC-BY-SA 3.0 steht. Ich kann mich noch gut erinnern, dass es deswegen beim Vorgänger, dem Wikimedia Newsletter, noch einige Diskussionen gab.

P.S. Wenn denn nicht wirklich eine vergilbte Zeitung mit Wasserrändern war, was ich eher nicht glauben mag, die gescannt wurde, dann lassen wir diesen Pseudoantiken Look des PDF bei der nächsten Ausgabe doch besser. Olle Zeitungen kann Wikisource wesentlich besser und sogar in echt.

Neuigkeiten aus Wikisource (6)

Es ist mal wieder Zeit und zum Glück auch Gelegenheit einige Neuigkeiten aus Wikisource der geneigten Leserschaft darzubieten:

  • Das Wichtigste gleich zu Beginn: Auf Wikisource befinden sich seit heute insgesamt 11.000 Werke. Damit hat die Neuanlage der letzten tausend Werke etwa 80 Tage gedauert. Dieser Bestand setzt sich u.a. zusammen aus über 4500 Gedichten, etwa 1300 Rechtstexten und fast 800 Texte die wissenschaftliche Sachverhalte darlegen. Hinzukommen über 1700 Autoren-, 187 Themen- und 84 Ortsseiten die den Gesamtbestand zumindest zu großen Teilen erschließen.
  • Mittlerweilen wurden von 18 Jahrgängen der Gartenlaube Scans und OCR-Texte auf Commons bzw. Wikisource verfügbar gemacht. Das sind rund 16.000 Seiten Text. Fast 200 Artikel wurden korrekturgelesen und sind als eigenständige Werke vorhanden.
  • Etwa ein Viertel des Gesamtbestandes von fast 120.000 Seiten in Wikisource wurde bereits zweimal korrekturgelesen. Ein weiteres Viertel wurde zumindest einmal korrekturgelesen.
  • Auch bei der ADB geht es gut voran. Mehr als 26 Prozent der Artikel wurden einmal korrekturgelesen und gute 5 Prozent bereits zweimal. Umgerechnet bedeutet dies, dass 6 Bände bzw. die Buchstaben A, B, C, D und X, Y komplett einmal korrekturgelesen wurden.

Neuigkeiten aus Wikisource (5)

Akseli Gallen-Kallela: Die Verteidigung des Sampo.
Akseli Gallen-Kallela: Die Verteidigung des Sampo.

Heute ist mal wieder Zeit für ein paar Kurznachrichten aus Wikisource:

  • Das finnische Nationalepos Kalewala in der Übersetzung von Anton Schiefner ist vollständig bei Wikisource vorhanden. Zum Inhalt des Werkes schreibt Cecil im Skriptorium:

 

 

 

eine als Nationalepos getarnte Seifenoper (einige der Themen: Mord, Rache, Selbstmord, Inzest, Zauberwettkämpfe, unbefleckte Empfängnis nur Obst, goldenen Ehefrauen, äußerst ungeschickte Brautwerbungen, usw.)

Den dazugehörigen exzellenten Artikel in der Wikipedia kann ich auch zur Lektüre empfehlen.

  • Seit vorgestern ist parallel zur deutschsprachigen Wikipedia auch in Wikisource die Pediapress-Extension (eine MediaWiki-Erweiterung zur PDF-Ausgabe) in Betrieb genommen worden. Leider gibt es noch ein paar Einschränkungen (z.B. wird die poem-Extension für Gedichte nicht und HTML bzw. CSS nur rudimentär unterstützt), die aber hoffentlich bald behoben werden. Vielen Dank an Frank, dass er unbürokratisch die Anschaltung auch bei uns veranlasst hat. Unsere Erfahrungen dürften ja auch für die anderen Wikisource-Projekte von Nutzen sein, wenn es dann bei diesen soweit ist.
  • Eine der umfangreichsten Themenseiten ist derzeit im Entstehen, und zwar zu den Burgunderkriegen. Wie bei Wikisource üblich führt die Seite Digitalisate, Handschriften etc. im Netz und auch schon einige wenige Texte bei Wikisource zum Thema auf.

Neuigkeiten aus Wikisource (4)

Heute wieder ein paar Neuigkeiten aus Wikisource im Tickerformat.

Neuigkeiten aus Wikisource (3)

Nach etwas längerer Zeit mal wieder ein paar Neuigkeiten aus unserem kleinen Projekt:

  • Dank xarax geht die Arbeit an der ADB und einigen anderen Projekten wesentlich schneller voran. Er hat einen kleinen Bot programmiert, der die Google OCR Engine verwendet und die OCR-Resultate dann automatisch in Wikisource hochlädt. Leider ist die OCR-Qualität noch recht mittelmäßig, so dass der Korrekturaufwand recht hoch ist. Finereader ist auch bei Fraktur wesentlich leistungsfähiger. Dann muss man aber die Texte Seite für Seite von Hand hochladen. Über meine Erfahrungen mit der neuen Version von Finereader werde ich einem der nächsten Beiträge berichten.
  • Ein Großteil der älteren Projekte wurde mittlerweile auf die neue Proofreading-Extension umgestellt (Ich berichtete darüber). Derzeit gibt es im Namensraum „Seite“ rund 3500 Seiten. Nach dem französischen Wikisource stehen wir damit auf Platz 2 der Verwendung dieser Extension.
  • Die Themenseiten auf Wikisource, die nicht nur die Texte auf Wikisource nachweisen, sondern auch Digitalisate überall im Netz (insbesondere von Google Books) aufführen, werden mittlerweile auch international als beispielhaft erkannt. Selbst englische und japanische Blogs berichten darüber.
  • Für Wikisource ist die Aussage „Im Gegensatz zur Wikipedia entwickelt sich Wikisource zu einer sehr seriösen Einrichtung.“ sicherlich sehr schmeichelhaft ;-) (Gefunden bei Digitale Regionalgeschichte. Danke an FrobenChristoph für den Hinweis im Skriptorium.)
  • Mit großer Beteiligung wurde der Handschriftenlesekurs in Wikisource wieder neu belebt. FrobenChristoph weist uns anhand der in Wikisource vorhandenen Beispiele in das Lesen von alten Handschriften ein. Der Kurs findet täglich im Chat ab 21 Uhr statt (irc://irc.freenode.org/paleo). Die aktuellen Leseaufgaben werden auf der Seite zum Kurs in Wikiversity bekanntgegeben. Derzeit wird anhand des Rechenbuch des Andreas Reinhard geübt.

Neuigkeiten aus Wikisource (2)

Mit Sicherheit hat es außerhalb Wikisource keiner mitbekommen. Aber seit heute hat Wikisource zwei neue Namensräume: „Seite“ und „Index“. Für die rasend schnelle Einrichtung in nicht mal 24 Stunden geht mein herzlichsten Dank an JeLuF. Frage ist nun, wozu brauchen wir die Dinger überhaupt.

Schuld ist sozusagen die neue Proofreading-Extension. Bisher hatten wir ja eine Javascript-Lösung, die auch wunderbar funktionierte. Parallel dazu gab es ein Proofreading-Extension, die aber einige funktionale Einschränkungen hatte und von uns bisher nicht benutzt wurde. Nun haben sich aber der französische Wikisourcler ThomasV und Xarax zusammengesetzt und das Positive aus beiden Lösungen zu einer neuen Extension zusammengeführt, die schon als sehr gut bezeichnet werden kann. Welche Möglichkeiten haben wir mit der Extension:

  • Einbindung von Scans auf Commons und auf anderen Servern
  • Einbindung von Seitenscans aus Mulit-Page-Formaten, derzeit nur djvu, aber PDF ist wohl in Vorbereitung. ich hatte über die PDF-Extension von xarax bereits kurz berichtet.
  • Navigation zwischen den einzelnen Seiten wird von der Extension mitgeliefert. Es entfällt also das recht mühsame  Vorlagen basteln für jedes größere Projekt
  • Das mühsame Anlegen der Einzelseiten entfällt. Nach Klick auf Bearbeiten auch einer „roten“ Seite steht die Korrekturlesefunktion sofort zur Verfügung. Bisher musste man erst die verschiedenen Vorlagen reinbasteln, speichern und dann auf „Korrekturlesen“ klicken.
  • Die aus der älteren Lösung gewohnte Darstellung mit dem Scan oben und unten das Eingabefeld ist weiterhin vorhanden.
  • Einfache Zusammenstellung der Einzelseiten nach Kapiteln oder zum Gesamtwerk als Leseversion.
  • Und unsere ältere Lösung mit Javascript wird keinesfalls obsolet. Eine friedliche Koexistenz ist ohne Probleme möglich. Gerade für Einblattdrucke ist die JS-Lösung wohl doch etwas einfacher zu handhaben. 

Nicht direkt ersichtlich, aber in meinen Augen auch sehr sinnvoll, ist die Trennung zwischen der Leseversion und den Einzelseiten zum Bearbeiten und Korrekturlesen, ohne dass wir die Scans vorm Leser verstecken. Außerdem bietet die Indexseite die Möglichkeit den ganzen technischen Krempel, der für einen Leser nicht weiter von Interesse ist von der Leseversion zu trennen. Auf jeden Fall müssen wir aber in der Leseversion noch deutlich drauf hinweisen, wie ein Leser an die Scans gelangt. Der Klick auf die Seitenzahlen ist nicht so wirklich intuitiv. Erste Beispiele für den EInsatz der Extension finden sich bereits.: Soll die plattdeutsche Sprache gepflegt oder ausgerottet werden?, Denkwürdige Männer Für Straßennamen in der Kölner Neustadt. und Der Stadt Hamburg Statuta und Gerichts Ordnung Mir scheint vielen gefallen die neuen Möglichkeiten sehr gut, die wir wahrscheinlich auch erst ansatzweise ausgeschöpft haben.

Weitere (noch etwas knappe) Infos finden sich auf Wikisource: Proofread.

Update 31. August 2007:

Es kam die Frage, wozu die beiden neuen Namensräume dienen. Das hatte ich tatsächlich vergessen. Im Namensraum „Seite“ werden die einzelnen Seiten gegen den Scan transkribiert bzw. korrekturgelesen. Der Index-Namensraum nimmt pro Projekt eine Seite auf, die Links zu den einzelnen Seiten enthält, also eine Indexseite ;-). Im Hauptnamensraum verbleiben damit also nur die Seiten, die die Angaben zum Werk und den zusammengestellten Text enthalten. Eventuell auch als Unterseiten, wenn der Text nach Kapiteln oder ähnlichem zusammengestellt wurde.