Wikisource macht jetzt OCR

und sogar mit Fraktur. Gestern wurde eine Erweiterung live geschaltet, die  imagefür jede noch leere Seite im Seite-Namensraum zwei neue Knöpfe mitliefert. Jeweils einer für OCR von Antiqua-Schrift und von Fraktur-Schrift. Und die Qualität, ist zumindest bei ausreichender Scanqualität und Schriftgröße, auch bei Frakturschrift, verblüffend gut. Die OCR wird auf dem Toolserver mit Hilfe der Open-Source-OCR Tesseract durchgeführt und das Resultat wenig später in das Edit-Fenster gepustet, so dass man anschließend sofort mit der Erstkorrektur fortfahren kann. (Siehe Screenshot) Hier und da streikt die OCR, vermutlich wenn die Schrift auf der Seite zu klein ist. Bei der Gartenlaube werde ich vorerst also noch selbst Hand  anlegen müssen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *