KF8 und Calibre

Ich hatte mich ja im [intlink id=“1727″ type=“post“]letzten Blogbeitrag[/intlink] lang und breit über das Kindleformat 8 und warum es nun zwei verschiedene Downloads für den Kindle gibt etc. ausgebreitet.

Und vermutlich kann ich mir das doppelte Konvertieren bald wieder sparen. Denn seit heute gibt es die Calibre-Version 0.8.49  in der eine Unterstützung für KF8 eingebaut wurde. Allerdings ist diese erstmal nur experimentell und da es doch noch einige kleinere Problem gibt, werde ich den beschriebenen Weg erstmal weitergehen. Wenn dann in Calibre die KF8-Unterstützung soweit fortgeschritten ist, dass man die auch guten Gewissens anbieten kann, dann gibt es selbstverständlich wieder nur noch einen mobi-Download.

Update: Mit der neuen Version 0.8.50 gibt es ein Konvertierungsplugin nach KF8, das ich ich Zukunft auch nutzen werde. Allerdings sind in diesen Dateien nicht wie bei Amazon Kindlegen beide Versionen enthalten, so dass es in Zukunft bei zwei verschiedenen Versionen für den Kindle bleiben wird. Die E-Books im KF8 haben ab sofort die Dateiendung azw3, wie sie Calibre erzeugt, anstelle der von mir verwendeten Endung prc.

E-Books für Wikisource mit KF8-Support

Ab sofort biete ich die E-Books, die ich aus den Beständen von Wikisource erstelle, auch im neuen Kindle-Format 8 an, kurz KF8 genannt. Das KF8 ist eine Weiterentwicklung des ursprünglichen Mobipocket-Formats und bietet eiune wesentlich bessere Unterstützung der aktuellen Technologien. Amazon beschreibt die Vorteile folgendermassen auf der oben verlinkten Webseite:

Kindle Format 8 is Amazon’s next generation file format offering a wide range of new features and enhancements – including HTML5 and CSS3 support that publishers can use to create all types of books. KF8 adds over 150 new formatting capabilities, including drop caps, numbered lists, fixed layouts, nested tables, callouts, sidebars and Scalable Vector Graphics

Hinzu kommt, dass Bilder nicht mehr so arg kleingerechnet und in schwarz-weiß umgerechnet werden, da mit diesem Format auch der Kindle Fire umgehen kann, der eine größere Auflösung bietet und auf Grund des verwendeten LCD-Bildschirms auch farbige Bilder anzeigen kann. Wenn also das Gerät irgendwann auch in Europa angeboten wird, profitieren Besitzer dieses Gerätes sofort von dem neuen Format. Außerdem ist die Liste der unterstützten HTML-Tags und CSS-Eigenschaften wesentlich größer als noch beim alten Kindle-Format. Und da der seit ein paar Tagen in Deutschland erhältliche Kindle Touch dieses neue Format unterstützt, habe ich mich entschlossen, die E-Books auch in diesem Format anzubieten.

Amazon zieht damit gleich zur aktuellen EPUB-Version 3, die einen ähnlichen Funktionsumfang seit Anfang 2011 definiert.

Den Unterschied in der wesentlich besseren Darstellung auf dem Kindle Touch mit KF8 im Gegensatz zum Kindle 4 kann man den beiden Screenshots entnehmen.

Screenshot Kindle 4
Screenshot Kindle 4
Screenshot Kindle Touch
Screenshot Kindle Touch

Auch wenn die generierten Dateien im KF8 dasselbe E-Book im alten Format (KF6) enthält und damit eigentlich auch zum Kindle 4 und dessen Vorgängern kompatibel ist, biete ich weiterhin einen Download nur im alten Format an. Das hat schlicht zwei Gründe: Ersten ist ein E-Book nur im alten Format wesentlich kleiner, da eben die Bilder kleiner gerechnet werden und auch keine herausgeberspezifischen eingebetteten Fonts enthalten sind, die alleine meist 1-2 MB umfassen. Und da das Wikisource-Export-Tool seit kurzem freie gut lesbare Fonts in das EPUB einbettet und ich diese auch nicht entfernen möchte, sind halt auch im resultierenden KF8-Buch diese enthalten. Ein E-Book im KF8 Format ist u.a. deshalb schlicht doppelt so groß wie das EPUB aus dem es erzeugt wird. Für den zweiten Grund muss ich etwas weiter ausholen und meinen bisherigen Workflow kurz schildern.

Zuerst exportiere ich die Texte aus Wikisource mit dem Export-Tool für Wikisource. Das liefert mir ein EPUB-Dokument. Wenn ich einen Sammelband erstellen möchte, muss ich zusätzlich noch die einzelnen Texte als XHTML-Datei exportieren, was auch durch das Export-Tool unterstützt wird.

Danach wird das exportierte EPUB-Dokument mit Sigil weiterbearbeitet, da doch noch zuviele Artefakte darin enthalten sind, die man in einem E-Book nicht haben möchte, aber in Wikisource sinnvoll sind bzw. aus der Historie bedingt sind und oft auch mit exportiert werden. Bei einem Sammelband müssen in das Manteldokument, die oben beschriebenen XHTML-Dateien eingefügt werden. Zu den typischen Aufgaben bei der Bearbeitung gehören dabei:

  • Aufbau eines Inhaltsverzeichnis soweit noch nicht vorhanden bzw. sinnvoll. Die Darstellung von Überschriften in Wikisource erfolgt nämlich meist nicht semantisch mittels HTML-Header-Tags (h1, h2 usw.) sonder nur per Schriftauszeichnung (fett, größer etc.) und lehnt sich an das Layout der Vorlage an.
  • Entfernen überflüssiger Leerzeilen
  • Überarbeiten und Ergänzung der Metadaten
  • Tabellen, die für das Layout verwendet werden entfernt. Da lange Tabelle Probleme im Kindle machen, versuche ich diese mit anderen Mitteln darzustellen.
  • So in Wikisource kein Bild zum Text mitgegeben wird (meist das Titelblatt des Textes), dass auch für das Coverbild des E-Books verwendbar ist, erstelle ich ein neues in einem schlichten, aber hoffentlich ansprechenden Layout und binde dieses in das E-Book ein. Im folgenden ein Beispiel für einen Text der in der Gartenlaube veröffentlicht wurde:
Beispiel generisches Titlebild
Beispiel generisches Titelbild
  • Entfernen von Seitenzahlen und Einzügen die mit Leerzeichen realisiert wurden, dafür ist die Suchen-Ersetzen-Funktion von Sigil mittels Regular Expressions sehr hilfreich.
  • Ich entferne Anmerkungen und Fußnoten, die nur Druckfehler korrigieren. Die sind wichtig in Wikisource, damit nicht der nächste Korrekturleser über den gleichen Fehler stolpert und weiß, dass an dieser Stelle von der Vorlage abgewichen wurde. Für den Leser des E-Books sind diese Anmerkungen m.E. unwichtig. Sachanmerkungen belasse ich allerdings.
  • Entfernt werden weiterhin Verlinkungen im Text, die aus dem E-Book herausführen, also zu Wikipedia-Artikeln oder zu anderen Texten auf Wikisource.
  • Weiterhin füge ich in die vom Export-Tool generierte Titelseite die Textdatenbox aus Wikisource ein, um diese Informationen dem Leser auch über die Metadaten des E-Books hinaus zur Verfügung zu stellen.

Anschließend wird das mit Sigil bearbeitete EPUB in Calibre, einem E-Book-Verwaltungs- und Konvertierungs-Programm, importiert und in das Mobipocket-Format konvertiert. Und hier kommt jetzt der Unterschied im bisherigen Workflow. Das EPUB-Dokument wird nun auch noch zusätzlich mit Hilfe des Kommandozeilen kindlegen von Amazon in das neue Format konvertiert. Wenn man sich das Gehacke auf der Kommandozeile sparen will oder nicht ganz so firm ist damit, verwendet man einfach den KindlePreviewer, der eigentlich zur Vorschau von Kindle-E-Books auf verschiedenen Geräten gedacht ist, aber auch EPUB, DOC und HTML entgegennimmt und diese vorab per kindlegen in das KF8 konvertiert. Neben dem von Calibre konvertierten Dokument importiere ich in Calibre zusätzlich noch das per kindlegen erzeugte Dokument.

Warum mache ich nun aber diese zusätzlich Konvertierung und erzeuge zwei Mobi-Dateien, obwohl ja die von kindlgen erzeugte auch das E-Book im alten Format enthält? Schlicht, weil die Konvertierung von Calibre wesentlich besser und näher am Ausgangs-EPUB ist, trotz der limitierten Fähigkeiten des älteren Formats. Kindlegen erzeugt zwar sehr schöne und gutaussehende E-Books im KF8 aber eben nicht im älteren Format. So werden z.B. Gedichte die in Wikisource gesetzt wurden nicht korrekt formatiert. Deshalb einmal die Version von Calibre erzeugt für Kindle 4 und dessen Vorgänger und dann für Kindle Touch und Fire die Version mit KIndlegen erzeugte Version.

Damit Calibre die beiden Versionen für den Kindle auseinander halten kann, die normalerweise beide die Dateiendung mobi tragen würden, bekommen die mit Kindlegen erzeugten von mir die Dateiendung prc verpasst, welche äquivalent zur Dateiendung mobi ist und von den Readern problemlos als E-Book erkannt werden.

E-Books für Wikisource

Mrs. Finanzer hat mir zu Weihnachten einen E-Book-Reader, genauer einen Kindle, geschenkt. Und ich muss sagen, ich bin begeistert. Handlich, leicht, sehr gut lesbares Display und E-Books in Hülle und Fülle, auch tausende kostenlose, da gemeinfrei oder unter freier Lizenz stehend. Also eigentlich genug Lesestoff auf Jahre hinaus. Aber auch Wikisource hat ja einiges zu bieten, dass es noch nicht als E-Book gibt.

Und da hab ich mir gedacht, warum nicht mal schauen, wie man möglichst einfach die Inhalte von Wikisource für die diversen E-Reader bereitstellen kann. Simples PDF wäre zwar nicht so schwer, aber auf einem E-Book-Reader schwieriger lesbar, da der Reader dafür das Neu-Layouten des PDFs beherrschen sollte, was z.B. Kindle nicht kann, da ansonsten das Lesen recht schwer wird. Beim Kindle muss man z.B. bei jedem PDF erstmal rumprobieren, wann es am Besten  lesbar ist: Quer- oder Hochformat, Vergrößern oder nicht, Kontrast einstellen und was man sonst noch so machen kann. Da ist ein natives E-Book doch wesentlich einfacher zu handhaben.

Also hab ich heute mal ein bisschen rumprobiert und hab mir ein paar Tools und Programme heruntergeladen, womit das Erstellen von E-Books direkt aus Wikisource heraus recht einfach zu machen ist und wenig manuelle Nacharbeit erfordert. Im Folgenden schildere ich kurz den Workflow, den ich mir zusammengebastelt habe. Vorweg schicken möchte ich, dass ich bisher nur Texte umgewandelt habe, die sich bei Wikisource auf einer Seite befinden. Den Fall, dass ein Werk auf mehrere Unterseiten (z.B. die einzelnen Kapitel o.ä.), aufgeteilt ist, habe ich noch nicht ausprobiert, was ich aber die nächsten Tagen auch noch machen möchte. Ich werde darüber berichten, insbesondere um wieviel höher der Aufwand zum hier beschrieben Workflow ist.

  1. Das eigentliche E-Book wird bereits ganz am Anfang mit einem Chrome-Plugin, das es wohl auch für andere Browser gibt, erstellt: dotEPUB. Das sendet den Inhalt einer beliebigen Webseite zum eigenen Webservice, der dann ein fertiges E-Book im EPub-Format zum Download anbietet. Das speichert man einfach auf seiner lokalen Platte. Offenbar analysiert der Webservice die Struktur der Seite und verwirft alle Elemente, die nicht zum eigentlichen Inhalt der Seite gehören. Im Falle von Wikisource (vermutlich auch bei der Wikipedia) sind das die Navigation oben und an der Seite, die Box mit den bibliografischen Angaben oben rechts (das hat mich am meisten verblüfft, da ich dachte die müsste ich später von Hand löschen), die Fußzeile und was es sonst noch so gibt an Elementen, die man in einem E-Book eher nicht haben möchte. Und er versucht die Struktur des Textes zu erkennen, denn aus den rein per Layout ausgezeichneten Überschriften im Text (fett und/oder etwas größer) werden richtige HTML-Überschriften. Das geht hier und da, insbesondere auf Titelseiten, daneben, was sich aber später leicht beheben lässt. HINWEIS: Möchte man die Links und Bilder aus dem Text bei Wikisource übernehmen, sollte man in den Einstellungen des Plugins die Einstellung „Immersive mode“ deaktivieren. Allerdings werden bei zuvielen Bildern alle entfernt und nur Platzhalter eingefügt.
  2. Dieses Grundgerüst eines E-Books, was man auch schon sofort verwenden könnte, kann man nun mit Hilfe des E-Book-Editors Sigil weiterbearbeiten und verfeinern. Sigil bietet einen WYSIWYG-Modus, man kann aber auch die XHTML-Dateien direkt bearbeiten, was hin und wieder sinnvoll sein kann. In Sigil habe ich bspw. die Titelseite angepasst, ein Coverbild ausgesucht oder Bilder wieder eingefügt, die dotEPUB rausgeworfen hat. Da der XHTML-Editor in Sigil eher rudimentär ist, hat mir ein WYSIWYG-HTML-Editor, wie z.B. Kompozer, gute Dienste geleistet, um die vielen Links die bei den Seitenzahlen auf die einzelnen Seiten zur Korrektur verweisen, zu entfernen. Die eigentliche Paginierung möchte man ja nach Möglichkeit erhalten. Weiterhin kann man hier die Metadaten des E-Books anpassen und ergänzen. Am besten macht man das direkt im entsprechenden XML-File, da die Oberfläche von Sigil hier noch etwas rudimentär ist. Alternativ kann man die Metadaten auch im nächsten Schritt ergänzen.Wichtig zu erwähnen ist noch eine Funktion von Sigil: die automatische Generierung eines Inhaltsverzeichnisses. dotEPUB generiert kein vollständiges Inhaltsverzeichnis, sondern nur ein rudimentäres mit Titelblatt, Inhalt und sogenanntem Disclaimer (enthält u.a. Hinweise auf den dotEPUB-Service, sollte man um dem kostenlosen Service die entsprechenden Meriten zuzugestehen einfach drin lassen). Die eigentliche Struktur des Textes kann man aber mit Sigil in Form eines vollständigen Inhaltsverzeichnisses automatisch aufbauen. Ein erster Schritt hierfür bietet die Funktion „Generate TOC from Headings“ rechts unten, was leicht zu übersehen ist. Sigil liest nun die HTML-Überschriften des Dokuments und versucht daraus ein Inhaltsverzeichnis zu basteln. Da ja dotEPUB dankenswerterweise schon einen Teil dieser Arbeit bei der Analyse und Generierung des E-Books übernommen hat, funktioniert das verblüffend gut. Man kann mit Sigil das E-Book noch viel mehr aufpeppen, als hier beschrieben, insbesondere bei Texten die bei Wikisource auf mehreren Unterseiten verteilt sind, wird es sicherlich noch seine Stärken ausspielen können. Wie bereits gesagt, über die dementsprechenden Erfahrungen werden ich später berichten.
  3. Der dritte und letzte Schritt ist notwendig, wenn man das E-Book für verschiedene Reader zur Verfügung stellen möchte. Der Kindle z.B. kann nur das Amazon-eigene Format AZW und das Format Mobipocket lesen und einige andere, aber eben nicht das EPUB-Format mit dem wir hier die ganze Zeit hantiert haben. Den Part der Konvertierung und der (weiteren) Ergänzung der Metadaten übernimmt Calibre. Calibre kann eine Vielzahl von Formaten ineinander umwandeln, bietet aber nur sehr eingeschränkte Möglichkeiten zur direkten Bearbeitung von E-Books. Außerdem ist es durch diverse Plugins erweiterbar und kann mit Hilfe dieser Plugins eine Vielzahl von Quellen aus dem Netz abrufen, für einen E-Reader aufbereiten und an diesen senden. Was ich zum Bsp. entdeckt habe, es gibt ein Plugin für Calibre, mit dem man den aktuellen Printspiegel (wenn man ein Abo hat oder wie ich Mitarbeiter des Spiegel-Verlages ist) herunterladen kann (verwendet wird dabei die Schnittstelle, die eigentlich für die IPad- und IPhone-App gedacht ist) und aufbereitet auf den Kindle senden kann. Das gelingt u.a. deshalb so gut, da die Spiegel-Apps intern ebenfalls das EPub-Format verwenden. Und das alles vollautomatisch und zeitgesteuert. HINWEIS: Für die Bearbeitung in Calibre wird das E-Book von Calibre in ein eigenes Verzeichnis kopiert (normalerweise $USER\Calibre Bibliothek). Wo sich die Datei auf dem eigenen Rechner befindet, kann man mit der Funktion „Öffne Speicherort“ erfahren, die über die rechte Maustaste beim Buch zu erreichen ist. Wenn man also an der ursprünglichen Version Änderungen vornimmt, merkt Calibre davon nichts. Bei mir hat sich deshalb bewährt das E-Book nach dem Herunterladen in Calibre zu importieren und erst diese importierte Version mit Sigil und Co. zu bearbeiten. Mit Calibre kann man die konvertierten E-Books, bzw. falls noch nicht konvertiert aber notwendig nach einer automatischen Konvertierung, dann bequem an seinen E-Reader senden oder so er mit dem Computer verbunden ist, direkt auf den Reader spielen. Im oben erwähnten Verzeichnis in das das E-Book importiert wurde, befinden sich nach der Konvertierung auch die anderen Formate.

Testweise habe ich heute zwei Texte auf Wikisource in E-Book umgewandelt. Zuerst einen einfachen Text ohne Bilder und Schnickschnack. Den historischen Aufsatz von Karl ZeumerDie Goldene Bulle Kaiser Karls IV. Erster Teil: Entstehung und Bedeutung der Goldenen Bulle. Die Erstellung des E-Books dauerte nur wenige Minuten und war wenig aufwändig. Als zweites habe ich mir das reich illustrierte Buch Ein kurtzweilig lesen von Dyl Vlenspiegel, einem der ersten Till-Eulenspiegel-Bücher, aus dem frühen 16. Jahrhundert vorgenommen. Hier gab es das Problem, dass der Text soviele Bilder enthält, dass dotEPUB streikte und anstelle der Bilder nur Platzhalter einfügte. Immerhin konnte man damit später die Bilder an der richtigen Stelle einfügen. Ansonsten wäre diese Nacharbeit wesentlich zeitaufenwändiger gewesen. Außerdem musste ich noch alle Links auf den Seitenzahlen die nach Wikisource verwiesen entfernen, was auch einige Zeit gebraucht hat. Insgesamt habe ich bei diesem Buch rund 4 Stunden benötigt. Wenn man das ganze Drumherum noch etwas sorgfältiger ausarbeiten und das Buch hübscher machen möchte, dann wird man wohl noch einiges mehr an Zeit investieren müssen.

Und nach all der Arbeit sieht dann auf meinem neuen Kindle eine Seite des Eulenspiegel-Buches so aus:

Screnshot KIndle mit Eulenspiegelbuch

Blöderweise kann man keines der E-Book-Format auf Commons oder ein anderes Wikimedia-Wiki hochladen (kann man das irgendwo beantragen?), weshalb eine Verlinkung des E-Books direkt in Wikisource erstmal nicht möglich ist. Deshalb werde ich die E-Books erstmal hier im Blog hosten. Und da ich aber nicht jedesmal wenn ich ein neues E-Book erstellt habe, diesen Blogbeitrag aktualiseren möchte, habe ich eine Seite in diesem Blog erstellt, die in Zukunft alle die von mir erstellten Bücher aufnehmen wird: [intlink id=“1298″ type=“page“]E-Books[/intlink]. Die ist im übrigen auch oben in der Navigation verlinkt.

Über Hinweise, Tricks, Kniffe und Erfahrungsberichte würde ich mich freuen. Und wenn jemand eigene E-Books aus Wikisource erstellt hat und weiß nicht wohin damit, dann lade ich die gerne hier hoch und bau sie in die oben erwähnte Liste mit ein.