Ebook-Selbstbau leicht gemacht
„Zwei Dinge sind zu unserer Arbeit nötig: Unermüdliche Ausdauer und die Bereitschaft,
etwas, in das man viel Zeit und Arbeit gesteckt hat, wieder wegzuwerfen..“
Albert Einstein

Workflow (II): Das Scannen

Wichtig vorab

Achte darauf, dass Deine Scanvorlagen und die Auflage Deines Scanners sauber sind.
Staub oder Krümel (auch von Tabak) solltest Du deshalb vorher mit einem weichen und trockenen Tuch entfernen!
Und auch den Schutzumschlag brauchst Du beim Scannen nicht…

Die ersten Schritte

Wenn Du schon einen Scanner besitzt, wirst Du vermutlich im Grundsatz auch wissen, wie man ihn bedient. Und einiges hatte ich dazu ja auch schon in den vorhergehenden Kapiteln dieser Anleitung geschrieben.
Dennoch möchte ich jetzt anhand der (manchmal etwas fuddeligen, weil unübersichtlichen) Software meines alten Flachbettscanners nochmal näher auf ein paar Punkte eingehen, die später der Texterkennung (und auch Dir!) die Arbeit sicher erleichtern werden, wenn es um das Erstellen von Ebooks aus gedruckten Texten geht.

Wobei natürlich jedes Scannermenue anders aussieht und Du bei der Software Deines Scanners vermutlich manche Einstellungen an anderer Stelle findest.
Aber das macht auch nichts, denn prinzipiell sollten eigentlich alle Hersteller in ihrer Software alle Einstellungsmöglichkeiten bieten.
Und zur Not hilft ja auch das Handbuch weiter.

Grundeinstellung .

Wichtig ist auf jeden Fall, von Anfang an den Modus zu wählen, der sich ja auch nach der weiter geplanten Verwendung der Scans richtet.

Möchte ich die Texte anschliessend weiter mit meiner Texterkennung bearbeiten, also auf jeden Fall „Schwarzweissdokument“ – möchte ich sie lediglich als „nur-PDF“ auf dem Tablett oder Rechner nutzen ist „Zeitschrift“ oder „Farbfoto“ die bessere Wahl.

Den auch an dieser Stelle schon angebotenen OCR-Modus können wir aber erst mal noch vernachlässigen, weil der für unser Zwecke kaum taugt und es zum erstellen eines Stichwortverzeichnisses für durchsuchbare „nur-PDF“ im späteren Verlauf noch eine weitere Variante gibt

Auflösung

Der zweite wichtige Punkt ist die Auswahl der richtigen DPI-Wertes, der für die Texterkennung am Besten 300 DPI betragen sollte, während für die Erstellung von „nur-PDF“-Formaten auch 150 DPI meist reichen

Dabei sind die 300 DPI ein Kompromisswert, zwischen Qualität, Dateigrösse und Zeitaufwand. Höhere Auflösung könnten zwar ggf. die Ergebnisse der Texterkennung verbessern,

( erinnerest Du dich an die zu eng stehenden Worte, mit denen die Texterkennung bei allen meine Scannern Probleme hatte?)

bedingen aber auch, dass manche Scanner fühlbar langsamer arbeiten, der Speicherplatzbedarf für die Scan-Ergebnisse (egal ob JPG oder PDF) enorm steigt und die Texterkennung für ihre Arbeit noch mehr Zeit braucht – meist ohne das daraus grosse Gewinne für die nachfolgenden Arbeitsschritte entstehen würden.

Mehrfach-Scans

Ich hatte ja schon erwähnt, das es aus meiner Erfahrung heraus am günstigsten ist, beim Scannen die Vorlage gleich in gut handhabbare Häppchen aufzuteilen.
20 bis maximal 40 Seiten sind dafür ein brauchbarer Wert, mit dem sowohl die Texterkennung als auch ich selbst bei der anschliessenden Textverarbeitung gut klar kommen. Wobei ich tendenziell inzwischen meist bei Päckchen von 30 Seiten lande, je nachdem, wieviel Inhalt die einzelnen Seiten der Vorlage enthalten.

Ausnahmen davon mache ich nur, wenn ich Vorlagen habe, aus denen ein „nur-PDF“-Format entstehen soll. Dann scanne ich auch mal die ganze Vorlage am Stück oder Kapitelweise, wenn ich anchliessend ein Inhaltsverzeichnis brauche. (darauf gehe ich aber im Thema Textverarbeitung auch nochmal näher ein)

Netterweise bietet mir meine Scannersoftware für dieses Vorgehen auch gleich eine passende Möglichkeit:

Und ich vermute, diese Möglichkeit wir es auch bei anderen Herstellern geben – wenn auch womöglich an anderer Stelle innerhalb der Scannersteuerung.

Erste Bildbearbeitung

Während die Software meiner beiden anderen Scanner diesen Schritt gleich automatisch ausführt, muss ich beim Flachbettscanner vor dem Speichern noch selbst ein wenig Hand anlegen:

Ausrichten
Zuschneiden

Ausrichten, weil Flachbettscanner prinzip-bedingt immer im Hochformat scannen und das bei einer Doppelseite natürlich nicht passt – und Zuschneiden auf den Inhaltsbereich als Vorbereitung für die Texterkennung – aber auch (bei „nur -PDF“) um die optische Anmutung der Scans ein wenig zu verbessern und gleichzeitig den Speicherplatzbedarf ein wenig zu verringern.
Was nicht im Bild enthalten ist, frisst da auch keinen Platz.

Speichern als PDF

Kommt als letzter Schritt das grosse Finale der Scan-Aktion: Der Export in eine PDF-Datei:

und damit unter „Einstellungen“ auch die Möglichkeit, PDF-Dateien durchsuchbar zu machen, falls man das braucht – etwa für Hand-oder Fachbücher:

Doch das macht für unsere weitere Bearbeitung in der Texterkennung wenig Sinn und könnte sogar hinderlich werden, weil wir damit natürlich auch die PDF-Dateien noch weiter aufblähen.

Deswegen sollte man diese Option auf jeden Fall ausschalten, wenn man sie nicht braucht.

Doch das macht für unsere weitere Bearbeitung in der Texterkennung wenig Sinn und könnte sogar hinderlich werden, weil wir damit natürlich auch die PDF-Dateien noch weiter aufblähen.Deswegen sollte man diese Option auf jeden Fall ausschalten, wenn man sie nicht braucht.

Und nach dem Speichern uns kurzer Wartezeit:

Das Ergebnis

Damit kann man doch arbeiten:

Gute Scans minimieren nun mal die Fehlerquote bei der Texterkennung und damit auch die manuelle Nacharbeit bei der Textverarbeitung. Deshalb lohnt es sich auf jeden Fall, sich die Mühe sorgfältigen Arbeitens auch schon beim Scannen zu machen und dafür die notwendige Zeit zu investieren…

Noch ein Wort zum Scannen von Bildern

Natürlich wird es auch vorkommen, dass Du Bilder für Dein Ebook brauchst. Zumindest ein Titelbild gibt es ja immer. Deshalb gibt es bezogen darauf auch Besonderheiten beim Scannen, die ich nicht unerwähnt lassen will:

Bilder für Dein Ebook / oder Deine selbst nachbearbeitete PDF solltest Du in einem Zweiten Durchgang nochmal separat in Farbe oder zumindest in Graustufen mit ebenfalls mindestens 300 DPI einscannen, um eine brauchbare Vorstufe für die noch folgende Bildbearbeitung zu haben.
Die Scans im Textmodus reichen dafür auf keinen Fall aus, weil dabei einfach zu viele Details verloren gehen.

Für „nur-PDF“ reicht üblicherweise der farbige Scan mit 150 DPI zur Darstellung auf Tablets und am Rechner aus, in dem Du deren Vorlagen (und damit auch die Bilder) ohnehin einscannst. Mehr lohnt (mit Rücksicht auf Dateigrössen und Ladezeiten) allenfalls für hochwertige Bildbände, die Du auf diese Art konservieren willst.

Noch eine kleine Nachbemerkung

Für mich ist das Scannen der Vorlagen immer der lästigste Teil des gesamten Workflows, obwohl ich inzwischen in der komfortablen Lage bin, mir dafür jeweils das beste Gerät aussuchen zu können. Dennoch habe ich mir gelegentlich auch schon überlegt, bei umfangreicheren Vorlagen professionelle Hilfe durch Copyshops zu suchen, die das gelegentlich auch anbieten und dank ihre Profigeräte auch gute Qualität abliefern.
Auch das könnte also eine Variante für Dich sein, wenn Du den hohen Preis für solche Dienste nicht scheust und Dein Geld nicht lieber in einen guten Scanner investieren möchtest.

Soviel dazu – und nun weiter zur Texterkennung


-13-

Workflow (I): Vorüberlegungen und Vorbereitungen

Nachdem dem Exkurs zur notwendigen Hardware und zur Software – und bevor endlich der praktische Teil dieser Anleitung beginnt – noch ein paar kurze Vorüberlegungen, die ich eigentlich immer vor einem neuen Projekt anstelle.
Schliesslich will ich mir ja auch keine unnötigen Arbeiten machen sondern nur soviel Aufwand treiben wie für den späteren Verwendungszweck unabdingbar ist.

Die „einfache“ PDF-Datei

So muss ich aus einer einfachen Gebrauchsanweisung für ein Haushaltsgerät (soweit die nicht ohnehin schon als PDF downloadbar ist) sicher kein aufwändig zu bearbeitendes Ebook erstellen.
Dafür reicht auch einfaches scannen der gesamten Vorlage in einem Arbeitsgang in niedriger Auflösung (150 DPI reichen für diesen Zweck locker) – ggf. auch noch mit einer schnellen Texterkennung durch die OCR-Funktion der Scannersoftware, um in der PDF später nach Stichworten suchen zu können – und speichern an einem entsprechenden Ort samt Entsorgen der Vorlage ins Altpapier, um zum Ziel zu kommen.

Viel mehr Aufwand würde ich auch für Vorlagen nicht treiben, bei denen es im Wesentlichen auf Bilder ankommt oder die ich ohnehin wegen der grösseren Darstellung lieber auf dem Tablet oder am Rechner lesen würde.
Zeitschriften oder Comics beispielsweise, oder Bildbände, deren Original sein Leben als Staubfänger verbringt und allenfalls alle Jubeljahre mal in die Hand genommen wird, Fotoalben, aber auch Fachbücher, die ich nicht gemütlich im Bett eingekuschelt lesen muss – also alle Druckwerke, die zur Verwendung als Ebook nicht taugen oder nicht lohnen – sind mit 150-300 DPI und farbig eingescannt ebenfalls eher Kandidaten für diese einfachste Form der Umarbeitung in ein elektronisches Medium, wobei ich auch hier von Fall zu Fall die OCR-Funktion der Scanner-Software nutzen würde, soweit mir das für eine Stichwortsuche nötig scheint – und darüber hinaus, falls ich auch ein Inhaltsverzeichnis brauche, die Scans später in der LibreOffice noch in Kapitel aufteilen.

Das geht übrigens am Einfachsten, indem man die Vorlage gleich kapitelweise scannt, die Einzelteile später in separate Writer- (oder Draw- je nachdem) -Dokumente einfügt, die man jeweils am Ende mit einem Seitenumbruch versieht und danach zu einem einzigen Dokument zusammenfügt, das man beim Export endgültigen Transport zurück ins PDF-Format auch gleich durch Reduktion der Auflösung noch etwas komprimieren kann.
Darauf gehe ich im Kapitel „Textverarbeitung“ nochmal ausführlicher ein.

Das „richtige“ Ebook

Mehr Aufwand (und damit die im Folgenden beschriebene Herangehensweise) wird also tatsächlich nur für das nötig, was später auch auf E-Readern lesbar sein soll.

Und in etwas reduzierter Form auch dann, wenn, wenn die schnelle PDF-Lösung von der optischen Anmutung her nicht dem entspricht, was wir haben wollen und sich für eine „schöne“ Fassung der Mehraufwand mit Texterkennung, Korrektur und Formatierung lohnt.

Wobei Bildbände als Vorlage für weiteres Bearbeiten zum Ebook oder für eine bearbeitete Form der PDF so oder so ausscheiden, weil Bilder innerhalb einen Fliesstextes eine Menge Probleme bringen und zudem der Qualität wegen auch vorher noch einzeln bearbeitet und optimiert werden sollten.
Wozu ja auch noch die Problematik der eingeschränkten Bild-Darstellungsmöglichkeiten auf E-Readern kommt, wie wir später im Bildbearbeitungs-Kapitel noch sehen werden.

Letzte Vorbereitungen

Nachdem nun auch die Entscheidung über die weitere Vorgehensweise getroffen ist, Kaffee und Snacks bereitstehen (und falls Du Raucher bist: auch genug Tabakwaren für eine länger Sitzung) fehlt eigentlich nur noch eines:
Eine Ordnerstruktur, mit der Du gut arbeiten kannst, denn Du wirst – je nach Umfang der Vorlage – im Verlauf der einzelnen Arbeitsschritte eine ziemliche Menge an zwischengespeicherten Dateien ansammeln, bis am Ende Dein Ebook fertig ist – und dafür auch einiges an Speicherplatz benötigen.

Wobei ich mir meist einen Ordner auf dem Desktop anlege, um mir längeres Suchen zu ersparen – und darin auch gleich die notwendigen Unterordner anlege:

  • „Scans“ (der Name erklärt sich vermutlich von selbst) für alle PDF und Bildateien die ich für das Ebook brauche, auch für Titelbild und den Klappentext des Buches, den wir später sinnvollerweise in die Metadaten des Ebooks einfügen.
  • „Rohtext“ für die zwischengespeicherten Ergebnisse der Texterkennung, die ich genau wie die Scans immer bis zum Ende meines Workflows aufhebe
  • „Bearbeitet“ für die fertig gestellten Teile aus der Textverarbeitung
  • Und „Montage“ für das, was ich nach und nach daraus zusammenfüge. Auch hier bewahre ich die einzelnen Zwischenschritte auf, bis die finale Fassung erstellt ist.

So hat es sich jedenfalls für mich bewährt, aber natürlich steht Dir frei, Dir auch ganz andere Strukturen anzulegen, wie sie Dir am besten erscheinen.

-_-_-_-

Bleibt nur noch die Vorbereitung Deiner Scan-Vorlage, mit der dann auch das nächste Kapitel beginnen wird….

…. und der ernst gemeinte Rat, nicht gleich mit dem dicksten Wälzer Deiner Büchersammlung anzufangen, sondern vielleicht erst mal mit einem kleineren und einfach gestaltetem Übungsobjekt zu beginnen.


-12-

Über diesen Blog

Hallo Lieber Leser!

Wie Du sicher gemerkt hast, erscheinen hier im Blog gelegentlich auch Beiträge, die scheinbar noch in der Luft hängen, weil vorher noch einige Arbeitsschritte meines Workflows fehlen.
Aber keine Sorge, die offenen Lücken werde ich auch noch füllen, je nachdem mit welchem Thema ich gerade Lust habe, mich zu beschäftigen – und damit kommt auch das in die richtige Abfolge, was bisher noch für sich alleine steht….


-11-

Einsortiert in: - News, Übersicht

Bilder einbinden und optimieren

Bilder in Ebooks – das ist wahrlich ein Thema für sich, da sich die handelsüblichen E-Reader damit alle ziemlich schwer tun und zum Betrachten grossformatiger farbiger Bildbände ohnehin nicht eignen.
Weil sie keine farbigen Abbildungen wiedergeben können, sondern lediglich die Darstellung von 16 Graustufen beherrschen. Und weil ihre Displays recht klein sind und bei älteren E-Readern maximal 764 Pixel in der Breite darstellen können (bei neueren auch mal 1024 oder mehr).

Bilder im Textfluss

Ausserdem werden bei der Bilddarstellung die beiden grossen Vorteile der Reader auf einmal zu Nachteilen, weil beide Einfluss auf die Position der Bilder in der angezeigten Seite haben:
Sowohl der Satz in Fliesstext als auch die skalierbare Schriftgrösse bewirken mit ihren damit beeinflussbaren Veränderungen der Zeilenbreite und -Höhe, dass wir es hier nicht mit statischen Seiten und einem festen Layout zu tun haben, sondern ihre Darstellung auf jedem E-Reader anders aussieht.
Da tauchen Bilder dann mal am Anfang, mal in der Mitte und mal am Ende einer Seite auf – oder sind schlimmstenfalls nach einer grossen Lücke sogar erst auf der nächsten Seite zu sehen, weil der Platz unter dem Text in der aktuellen Seite nicht mehr reicht.

Denn Effekt kannst auch schon in der ebenfalls im Fliesstext gesetzten PDF meines Tutorials finden, wenn Du da mal durch scrollst.
Hier mal ein Beispiel:

Schön ist das nicht – und zumindest für mich auch sehr störend im Lesefluss.

Weshalb ich auch bezogen auf reine Ebook-Formate – anders als in den PDF-Versionen – inzwischen immer überlege, ob der Informationswert der Bilder überhaupt hoch genug ist, um sie unbedingt erhalten zu müssen – und wenn, ob nicht eine Platzierung an anderer Stelle – beispielsweise in einem ans Ende des Buches angehängten Bildteil mit einer Verlinkung im laufenden Text – die bessere Variante wäre, um diese störenden Effekte zu vermeiden.
Denn dann kann der Leser sie bei Bedarf einzeln aufrufen und – die „Zurück“-Funktion des Readers nutzend – mühelos zum Text zurück springen, ohne dass sein Lesefluss durch unschöne Lücken im Text gestört wird.

Viel Mehraufwand ist das nicht, wenn Du in der Textbearbeitung zuerst die PDF-Fassung erstellst, in der alle Bilder innerhalb des Textflusses an der richtigen Stelle platziert sind – und anschliessend für die Ebook-Fassung die Bilder in einem weiteren Schritt mit einer Sprungmarke versehen in den Anhang verschiebst (pro Bild eine Seite mit ausreichend Platz für erklärende Texte) und anstelle des Bildes den zugehörigen Hyperlink in den Fliesstext einbaust… ähnlich, wie ich das auch schon bei den Fussnoten beschrieben hatte.

Bilder optimieren

Angesichts der eingeschränkten Darstellungsmöglichkeiten der E-Reader-Displays macht es natürlich wenig Sinn, farbige Bilder in voller Grösse darin einzubinden, die zudem auch noch die Dateigrösse des gesamten Buches unnötig aufblähen würden.
Deshalb lohnt es auf jeden Fall, sich vorher ein paar Gedanken darüber zu machen und die Bilder auf die Fähigkeiten des Ausgabemediums hin zu optimieren.

Wobei es für eine reine PDF-Fassung prinzipiell schon reicht, sie einfach auf eine Breite von 1024 Pixel zu verkleinern und ggf. noch ein wenig zu schärfen und an Kontrasten und Helligkeit zu schrauben:

Hier mal das Bild von der ersten Seite – in Pinta, einer Light-Weight-Bildbearbeitung unter Linux:

Für die Ebook-Formate solltest Du aber noch ein wenig mehr Aufwand treiben, um eine optimale Darstellung zu bekommen. Zumindest ein Anpassen der Bildbreite auf 764 Pixel Breite und die Umwandlung in ein 16-Bit Graustufenbild sind hier Pflicht, auch wieder mit Anpassung von Kontrast und Schärfe und anschliessend als PNG gespeichert, weil das verlustfreier ist als übliche JPG-Formate – und die Dateigrösse trotzdem kleiner bleibt:

Was in der Endstufe der Bearbeitung dann so aussieht:

Nicht wirklich schön, aber mehr kann ein E-Reader nun mal nicht.

-_-_-_-

Bleibt noch ein Bild, das auf jeden Fall in jedem Ebook vorkommt:

Das Titelbild

In der PDF ausser der üblichen Verkleinerung kaum weiterer Beachtung wert, sondern stumpf als erste Seite vor den Inhalt des Buches gesetzt – gibt es hier beim Export in die Ebook-Formate noch eine weitere Besonderheit.

Denn das Titelbild ist bei Ebooks, egal, ob EPUB, MOBI oder AZW3 immer Teil der Metadaten und sollte deshalb nicht im Text, sondern separat eingebunden werden, damit es auch in der Bibliotheks-Übersicht des Readers angezeigt werden kann.

Und so wird es Dir auch im Exportprogramm Calibre angeboten, wenn Du ohnehin die anderen Metadaten erstellst. Wie es dann genau funktioniert, zeige ich Dir im Kapitel über das Exportprogramm.

Wichtig ist aber auch hier, dass Du Dein Titelbild vorher schon für den Reader optimierst, also seine Grösse anpasst und es zum Graustufenbild konvertierst, wie oben beschrieben:

(ich wähle hier immer 900 Pixel Höhe, da die Breite sich von Buch zu Buch unterscheidet und manche E-Reader die unschöne Tendenz haben, das Bild bei Nutzung der vollen Breite unschön in der Höhe zu stauchen.)

Fortsetzung folgt

Aber damit sind wir natürlich noch nicht ganz am Ende dieses Dramas.
Denn ein weiterer Schritt wird nach dem Export Deines Buches in die Ebook-Formate noch folgen müssen, bevor mit den Bildern alles stimmt: Abgesehen vom Titelbild müssen alle Bilder nachträglich noch mit HTML und CSS formatiert werden, wenn es perfekt aussehen soll.

Überleg Dir also gut, ob Bilder Dir in Deinem Ebook tatsächlich so wichtig sind, dass Du das auf Dich nehmen willst.


-10-

Ein paar Gedanken zum Thema Software

Ein erster Überblick

Bevor wir uns dem praktischen Teil dieser Anleitung zuwenden möchte ich Dir noch kurz aufzeigen, welche Software ich abgesehen von Betriebssystem und Scanner-Software dafür verwende und auch Dir empfehlen würde.
Wobei ich – von Linux her kommend und partiell auch Windows nutzend – immer Open-Source- Varianten bevorzuge, die (mit Ausnahme des Texterkennungs-Programmes) auf allen Plattformen laufen und möglichst einfach zu installieren und zu bedienen sind.

Als kleinen Service für Dich habe ich in den einzelnen Abschnitten Download-Möglichkeiten für Windows und MacOs verlinkt – bezogen auf Linux kommt man am leichtesten an alle hier vorgestellten Programme, wenn man den Weg über wiki.ubuntuusers.de geht und dort die Suche bemüht. Dort findet man auch Hilfe zur Installation und Konfiguration der Programme unter Linux

Die Texterkennung mit einem OCR-Progamm

ist nach dem Scannen der wichtigste Schritt, um uns eine gute Basis für alles weitere zu schaffen und gleichzeitig auch der Teil, der als grafiklastiges Programm dabei am meisten Hardware-Ressourcen benötigt. Um so mehr, je umfangreicher die beim Scannen erzeugten Bild- und PDF-Dateien sind.
Also ist es um so wichtiger, dafür ein Programm zu wählen, das selbst möglichst wenig an Ressoucen benötigt und nicht noch unnötigen Ballast mitbringt als viele kommerzielle Programme, deren Vollversionen dennoch geeignet sind, wenn Dein Windows- oder Apple-Rechner ausreichend Reserven dafür hat.

Aber das kam damals für mich als nur-Linux-Benutzer natürlich nicht in Frage, weshalb ich letztendlich bei einer Kombination aus dem von Google gepflegten Tesseract als OCR-Basis und gImageReader (nur für Linux und Windows verfügbar) als grafischer Benutzeroberfläche gelandet bin – ähnlich, wie sie bei einigen Online-Angeboten und bei Google Lens zur Texterkennung üblich sind.

Wobei die meisten Online-Lösungen zwar durchaus auch nutzbar sind (damit habe ich anfangs auch herumprobiert) und sogar gute Erkennungsraten haben, aber (ähnlich den kastrierten OCR-Versionen in der Scannersoftware) häufig ebenfalls Beschränkungen in der Funktion aufweisen. Korrektur von Silbentrennungen und Umwandlung in Fliesstext beherrschen nur die wenigsten, oder wenn, dann nur in kostenpflichtigen Abo-Modellen, die unbegrenzten Zugriff erlauben und auch die häufig auf diesen Seiten geltenden Upload-Limits aufheben.
Allerdings wüsste ich auch keinen Grund, auf derartige OCR-Lösungen zurückgreifen zu müssen – es sei denn, mein eigener Rechner käme bei der Texterkennung leistungsmässig an seine Grenzen.

Für Nutzer von MacOS habe ich mangels eigener Erfahrungen an dieser Stelle leider keine Empfehlung ausser, die grossen Suchmaschinen zu befragen.

Die Textverarbeitung

ist das Programm, mit dem Du am meisten Zeit verbringen wirst.
Zumindest bei der hoffentlich nicht allzu notwendigen Fehlerkorrektur und beim sehr zeitaufwändigen Formatieren ist sie unumgänglich und auch sehr hilfreich, wenn Du einen Text „nur“ als PDF zur Verwendung am Rechner oder auf dem Tablet aufbereiten willst, weil sich hier schon eine direkte Exportmöglichkeit bietet.
Meine Empfehlung dazu ist auf alle Fälle das kostenlose und auf allen Plattformen verwendbare Open-Source-Programm LibreOffice, das im Bereich der Textverarbeitung einen ähnlichen Funktions-Umfang wie Microsoft Word bietet und zusätzlich über Funktionen verfügt (beispielsweise auch einen direkten schnellen Export in EPUB-Format und erweiterte Bearbeitungsmöglichkeiten für PDF-Dateien) die Word nicht kennt.

Falls Du schon Word auf dem Rechner hast, kannst Du das natürlich trotzdem benutzen. Meine Tipps sollten eigentlich auch damit funktionieren

Die Bildbearbeitung

ist ein notwendiges Übel, auch wenn es nicht zur Kernkompetenz von E-Readern gehört, Bilder darzustellen. Aber zumindest ein Titelbild gibt es immer und auch im Text kommen sie gelegentlich vor – und deshalb musst Du Dich zwangsläufig auch mit diesem Thema beschäftigen um sie entsprechend anpassen zu können. Zumindest die Grösse und Schärfe der Bilder solltest Du anpassen können und – weil es der bessern Darstellung dient – auch das Konvertieren von Farbigen Bildern in Graustufen.
Immerhin: Als Nutzer von Windows oder MacOs reichen dafür die Bordmittel aus, welche diese Betriebssysteme ohnehin mitbringen – und wenns ein wenig mehr sein darf, gerne auch das ebenfalls für alle Plattformen erhältliche und kostenlose Gimp, wie es in jeder Linux-Distribution ohnehin enthalten ist.

Boliden wie Photoshop sind jedenfalls nicht nötig.

Der Export in E-Reader-taugliche Formate

ist der letzte Schritt zum fertigen Ebook und auch der, wo der letzte Feinschliff stattfindet und alles zusammengeführt wird, was Du in den vorhergehende Schritten erarbeitet hast – Dein korrigierter und formatierter Text und ggf. die Inhalts-Bilder in ihrer angepassten Form.
Auch Titelbild, Inhaltsverzeichnis und Metatexte (Klappentext und Impressum eines Ebooks) werden erst an dieser Stelle erstellt und eingebunden, sowie auch (falls gewünscht) die dynamische Silbentrennung.
Und das alles mit nur einem Werkzeug, mit dem kostenlosen Open-Source-Programm Calibre, für das es leider nur eine englische Website gibt, auch wenn seine Oberfläche perfektes deutsch beherrscht, die im Übrigen auch noch eine Reihe weiterer, sehr nützlicher Funktionen beinhaltet:

Angefangen bei einer eigenen Bibliothek zur Ebook-Verwaltung (sowohl auf deiner Festplatte als auch auf Deinem E-Reader) bis hin zum komfortablen Ebook-Versand per Mail versammelt sich da alles, was man sich nur wünschen kann, auch wenn ich es hier nicht bis ins letzte Detail beschreiben werde und mich nur auf die Funktionen beschränke, die es für unser Vorhaben braucht.

Weitere Bearbeitung nach dem Export in Ebook-Formate

Auch wenn Calibre schon einiges an Werkzeugen bietet, kann es sinnvoll sein, noch ein weiteres Werkzeug in der Hinterhand zu haben, das allerdings eher für Experten geeignet ist, die schon etwas Erfahrung im Umgang mit HTML und CSS haben:
Sigil (ebenfalls Open – Source und für alle Plattformen erhältlich.) ist dann hilfreich, wenn man mit den einfachen Formatierungsmöglichkeiten der Textverarbeitung nicht mehr weiterkommt, was insbesondere für Spezialaufgaben wie das Einbinden und die spezielle Formatierung von Bildern zutrifft.

Für „nur Text“-Ebooks mit allenfalls ein oder zwei Bildern wirst Du es also sicherlich nicht brauchen – deshalb erwähne ich es auch nur der Vollständigkeit halber und ohne die Absicht, im weiteren Verlauf dieser Anleitung detaillierter darauf einzugehen. Zumal ich selbst mit diesem Problem bisher nur einmal konfrontiert war und deshalb auch kaum Erfahrung damit habe..
Hilfen dazu gibt es aber einige im Netz – Google wird also auch in Bezug darauf sicherlich Dein Freund, wenn Du Dich an solche Aufgaben heranwagen willst.

Was Du nicht brauchen wirst

sind extra Programme zum Lesen und Bearbeiten von PDF-Dateien, auch wenn insbesondere Windows gerne mal mit diesem Vorschlag um die Ecke kommt. Denn zum Lesen kannst du ganz bequem Deinen Webbrowser nutzen, der mit entsprechendem Plugins (für Firefox und Chrome erhältlich) auch das Ebook-Format EPUB darstellen kann (die Kindle-Formate MOBI und AZW3 aber leider nicht) – und zum Bearbeiten reicht Deine Textverarbeitung (egal ob LibreOffice oder Word) allemal aus, solange es nur um das Einfügen oder Löschen einzelner Seiten geht.

Deshalb muss es auch nicht der Adobe-Acrobat-Reader mit seinen teuren Abo-Modellen sein.

-_-_-_-


Und jetzt kommt der Punkt, wo ich Dir mal gratulieren muss,

weil Du bis hierher durchgehalten hast.
Denn am Ende dieser Seite bist du auch am Ende der grauen Theorie angekommen und kannst anfangen, Dich mit der Praxis zu beschäftigen.

Also: Herzlichen Glückwunsch und auf zu neuen Taten!


-9-

Das Tutorial als Download

Natürlich mag es auch Situationen geben, wo Du gerne auch Teile meiner Anleitungen offline nachlesen würdest, ohne erst in Netz zu gehen. Oder, wo Du sie gerne ausgedruckt auf Papier hättest.

Und genau deshalb gibt es alle Inhalte auch zusammengefasst in einer PDF-Datei als Download – momentan noch in unvollständige Fassung mit dem jeweils aktuellen Stand an fertig gestellten Seiten, aber immer dann ergänzt und auf den neusten Stand gebracht, wenn ich den nächsten Teil meiner Anleitungen beendet habe

Momentan also in der Fassung (V 0.5a) vom 25.10.2023
Zum Download hier klicken
:

-> Download <-

Und nein, das ist jetzt nicht nur Spielerei, sondern hat auch für den weiteren Workflow eine ganz praktische Bedeutung. Weil ich für einige der weiteren Schritte ein Demonstrationsobjekt brauche, an dem ich bestimmte Dinge erklären kann, ohne dabei auf fremde Texte zurückgreifen zu müssen. Schon in der Textverarbeitung, und erst recht beim Export in die verschiedenen Formate – etwa, wenn es um das Einbinden von Links und Bildern und die Erstellung des Inhaltsverzeichnisses geht.

Nach Fertigstellungen der kompletten Seite wird es dann auch noch E-Reader-taugliche Fassungen als EPUB, MOBI und AZW3 geben, damit Du Dir auch selbst einen Eindruck vom Endergebnis verschaffen kannst.


-8-

Scanner (V): Die Scanbox

Der Vollständigkeit halbe möchte ich Euch auch noch eine weitere Möglichkeit zum Bücher scannen vorstellen: Diese merkwürdige Konstruktion, hergestellt aus billigen Kunststoffplatten, aber auch in Pappe oder Holz unschlagbar günstig auf allen einschlägigen Onlineplattformen zu finden:

Nicht in meinem Besitz: Die Scanbox (Bilder zum Vergrössern anklicken)

Die Scanbox , auch unter anderen Handelsnahmen erhältlich – und mit ein wenig Eigenleistung auch kinderleicht aus einer alten Bananenkiste aus dem nächsten Supermarkt herzustellen
Ein „Gerät“, was prinzipiell die Funktion eines Aufsicht-Scanners imitiert und dabei das Handy als Kamera nutzt – mit allen Nachteilen, die sich daraus ergeben.

Grund genug für mich, einmal auszuprobieren, was damit denn so möglich ist – und einerseits tatsächlich ein Grund zum staunen, als ich die Texterkennung von Google Lens nutzte um aus freihand geknipsten Handybildern Textdateien zu machen, die sich direkt in der Textverarbeitung weiter verarbeiten lassen. Denn auf den ersten Blick war die Erkennungsrate tatsächlich ziemlich hoch:

Anderseits aber – und auf den zweiten Blick betrachtet – zeigen sich in der Textverarbeitung neben den üblichen Fehlern bei unbekannten Vokabeln noch weitere zum Teil gravierende Mängel, die für den weiteren Workflow nichts Gutes verheissen:
Nicht nur, dass Google Lens alle Silbentrennungen ohne Korrektur lässt und gelegentlich Leerstellen in den Text einbaut, wo keine hingehören, sondern auch, dass es den gesamten Inhalt dieser Doppelseiten in einen einzigen Fliesstext verarbeitet und dabei Überschriften und Absätze gnadenlos ignoriert, so das man spätestens bei der abschliessenden Formatierung den gesamten Text durchgehen (und damit wohl auch lesen) muss, um das wieder gerade zu biegen. Doppelseite für Doppelseite, die man anschliessend auch noch in ein grösseres Dokument zusammenführen muss. Mehr Seiten auf einmal schafft man mit dieser Methode nicht.

Womit diese Lösung sich schlussendlich als ziemlich untauglich erweist und eigentlich nur bestätigt, was ich schon auf einer vorhergehenden Seite über die Tauglichkeit von Handyfotos geschrieben habe. Zusätzlich bestätigt durch eine Gegenprobe mit fest an ein Stativ montierten Handy samt optimaler Ausleuchtung, die trotz etwas besserer Qualität der Bilder ebenfalls bei der Texterkennung sang- und klanglos unterging. Sowohl bei der Nutzung von Google Lens, als auch (mit etwas besserem Ergebnis) mit nachbearbeiteten und optimierten Bildern innerhalb meines üblichen Workflows, die offenbar trotzdem nicht die für die Texterkennung optimale Auflösung von 300 Dpi erreichten.

Wozu dann als weiteres Handicap dieser Handy-Methode auch noch kommt, dass einem in diesem Setting gelegentlich eine dritte Hand fehlt, nämlich dann, wenn die Buchseiten in der Mitte des Buches die Tendenz haben, sich an den Rändern immer wieder hochklappen zu wollen und man seine Finger zum Niederhalten der Seiten benötigt.
Dann bleibt im Zweifelsfall nur die Nasenspitze zum Auslösen oder der meist erfolglose Versuch, dasselbe per Sprachbefehl über den Assistenten im Handy anzustossen.
Beides nur sehr unbefriedigende unzuverlässige Lösungen gegenüber dem teureren echten Aufsichtscanner mit seinem Fusspedal und seiner gut funktionierende Software – und einmal mehr unterstreichend, dass Hilfsmittel wie Handy und Scanbox allenfalls als Notlösung taugen und auf Dauer sicher keine Freude machen werden.

So gesehen sind also selbst die +- 20 Euro noch zu viel, die für derartige Konstruktionen verlangt werden… zumal man mit etwas Glück und Geduld zum gleichen Preis auch einen guten gebrauchten Flachbettscanner bekommen würde, der ausserdem noch einiges an hilfreicher Software mitbringt, auf die man bei dieser Handylösung verzichten müsste.
Jedenfalls lieferte eine weitere Gegenprobe mit meinem alten Flachbettscanner trotz seiner konstruktionsbedingten Macken mit den gleichen Seiten des gleichen Buches deutlich bessere Ergebnisse als das Beste aller Handybilder.


-7-

Scanner (IV): Der Duplexscanner mit automatischem Einzug

Dieser Scannertyp, üblicherweise in Büros oder Arztpraxen beheimatet, dürfte mit Abstand (auch gebraucht, weil sehr gesucht) der teuerste der vorgestellten Typen sein und wird sich für Dich wohl nur rechnen, wenn Du entweder vorhast, mit Ebook-Basteleien in Serienproduktion zu gehen, oder ihn wie ich zu einem sehr, sehr günstigen Preis gebraucht erwerben kannst.

Mein Gerät: Brother ADS-2100e (Bilder zum Vergrössern anklicken)

Was sich durchaus lohnen könnte, denn er ist tatsächlich in der Lage sehr schnell und sehr ordentlich eine grosse Menge an Vorlagen beidseitig in guter Auflösung einzuscannen (meiner schafft bis zu fünfzig Blatt = 100 Seiten in der Minute!!) und als fertige PDF auszugeben.

Allerdings solltest Du dann auch bereit sein, ein wenig chirurgische Vorarbeit zu leisten und Dein Buch mit scharfem Bastelmesser und Stahllineal vorher zu zerschneiden:

„Am Stück“ kann dieser Scanner aufgrund seiner Bauweise ein Buch oder eine Zeitschrift nämlich nicht verdauen, sondern er braucht tatsächlich die einzelnen Blätter als Futter für seine Arbeit, möglichst so beschnitten, dass die Klebekanten der Leimung ordentlich entfernt sind.

Da ich selbst hauptsächlich sehr günstig erworbene Letzthand-Taschenbücher in Ebooks verwandele und danach ohnehin ins Altpapier entsorge, weiss ich diese Prozedur als Arbeitserleichterung wirklich zu schätzen und mache mir diese notwendige Mehrarbeit gerne, auch wenn sie manch anderem als Sakrileg („man zerstört keine Bücher“) oder als anderweitig grosser Nachteil dieses Scannertyps erscheinen mag.

Wobei dieser Scanner tatsächlich alles verarbeiten kann, was entsprechend vorbereitet in den Einzugschacht passt:
Alte schmaddelige und zerlesene Taschenbücher ebenso wie farbige Hochglanzmagazine – mit Ergebnissen, die mindestens ähnlich gut (und meist sogar noch wesentlich besser) sind als beim vorher vorgestellten Bücherscanner:

Auch hier habe ich wieder zwei Seiten nebeneinander montiert, die in der originalen Ausgabe als Einzelseiten untereinander standen.

Und auch bei der Texterkennung erweist er sich als über jeden Zweifel erhaben und hatte mit meinen Testseiten die niedrigste Fehlerquote von allen bis auf (wieder einmal!) die zu dicht zusammenstehenden Worte der Vorlage, mit denen die Texterkennnung offenbar auch hier nicht zurecht gekommen ist:

Wobei ich Dir trotz aller Vorzüge dieses Scanner-Typs aber auch noch einen weiteren Nachteil nicht verschweigen will, der zumindest dann relevant werden könnte, wenn Du Dir so ein Gerät gebraucht beschaffen willst:

Tatsächlich gibt es bei diesem Typ zwei oder drei Verschleissteile, die gelegentlich (bei meinem nach 50.000 Scans ) gewechselt werden müssen und je nach Fabrikat auch nicht ganz billig sind.
Die Andruckrollen für den Papiertransport nutzen sich halt irgendwann ab, sind aber zum Glück kinderleicht zu wechseln und auch für ältere Scanner meist noch problemlos über Amazon zu bekommen…

Frag also vor dem Gebrauchtkauf-Kauf eines solchen Scanners auf jeden Fall nach, ob diese Rollen schon gewechselt wurden und wie viele Scans der Zählerstand in der Scannersoftware aktuell zeigt…

-_-_-_-

Und noch eines bleibt zu ergänzen, was ich schon mehrfach in diesem Zusammenhang gelesen habe:
Manche Kombi-Drucker haben ja ebenfalls eingebaute Scanner mit automatischem Einzug.
Diese funktionieren trotz komplizierterer (weil um die Ecke führender) Papierführung wohl auch für unser Zwecke, haben aber oft keine echte Duplexfunktion, so dass man schlimmstenfalls den gleichen Papierstapel zweimal hindurchlaufen lassen muss:

Einmal für die Vorderseite und dann nochmal für die Rückseite, um anschliessend die Scans per Software automatisch in die richtige Reihenfolge zu bringen…

Womit sich unter Umständen eine höhere Fehlerquote in der Seitensortierung ergibt und Du zumindest den Zeitvorteil wieder verlierst, den echte Duplexscanner bieten – mal ganz abgesehen von der möglicherweise schlechteren Qualität der Scans, weil die Auflösung dieser Art Scanner dem angestrebten Tempo und dem günstigen Preis geschuldet in diesem Modus manchmal viel zu niedrig ist.
Insofern sind derartige Kombi-Scanner also tatsächlich nur bedingt empfehlenswert, selbst wenn sie wohl meistens ihren Zweck erfüllen.


-6-

Scanner (III) Der Aufsicht- oder Buchscanner

Dieses Gerät mit dem Habitus einer modernistischen Schreibtischlampe hingegen dürfte Dir, lieber Leser, vermutlich völlig unbekannt sein – und auch in meinem Scannerpark ist es ein absoluter Exot:

Mein Gerät: CZUR Shine Ultra (Bilder zum Vergrössern anklicken)

Schon der Technik wegen die drin steckt – angelehnt an professionionelle Faksimile-Scanner, wenn auch deutlich einfacher aufgebaut: Im Grunde eine recht einfache Digitale Kamera mit einem angepassten Objektiv und parallel dazu eingebauter, regelbarer Beleuchtung, mit der die Vorlage nicht zeilenweise eingelesen , sondern lediglich in hoher Qualität fotografiert wird, ausgelöst entweder automatisch oder durch ein zugehöriges Fusspedal, das ganz einfach per USB angeschlossen wird und ein sehr hohes Arbeitstempo ermöglicht. Und so geht es mit bis zu einer Doppelseite pro Sekunde (falls Du selbst so schnell blättern kannst – ich kann es zumindest nicht) ausgesprochen zügig, selbst dicke Wälzer in handliche PDF zu verwandeln:

Einfach Umblättern – aufs Pedal treten – Umblättern – aufs Pedal treten – Umblättern – aufs Pedal treten – usw….
Und anschliessend die Scans direkt als PDF exportieren. Bequemer geht es fast wirklich nicht.

Wobei der Clou dieses Scanners tatsächlich in seiner (auch hier wieder nur für Windows und MacOS tauglichen) Software steckt, mit der die Bilder im weiteren Verlauf perfekt aufbereitet und in die verschiedensten Formate exportiert werden können (auch als mehrseitige PDF, wie wir sie für unseren weiteren weiteren Workflow brauchen):

So werden zumindest bei meinem Gerät (einem der mittleren Preisklasse) die Seiten automatisch ausgerichtet, Krümmungen bereinigt und selbst die Finger weitgehend herausgerechnet, die man bei störrischen Buchseiten benötigt, um sie unten zu halten.

Und wenn nicht, schaffen weisse Baumwollhandschuhe wirksame Abhilfe

Entsprechend gut sehen dem entsprechend auch die Ergebnisse aus, wenn sie am Ende der Prozedur abgespeichert werden – hier aus Demonstrationsgründen nachträglich zur Doppelseite zusammen montiert, normalerweise stehen in der Ausgabedatei die einzelnen Seiten untereinander:

Was sich natürlich auch bei der Texterkennung bemerkbar macht, insbesondere, nachdem ich alle Eigennamen schon korrigiert habe, die das Wörterbuch natürlich auch vorher nicht kannte:

Denn hier bleiben tatsächlich als einzige Fehler einige Worte, die in der Vorlage schon so eng zusammen gerückt waren, dass die Texterkennung sie nicht mehr als einzelne Wörter identifizieren und entsprechend voneinander trennen konnte.

Und einen echten Nachteil dieses Scannertyps will ich auch nicht verschweigen:
Für Scans von hochglänzenden Vorlagen oder Fotos taugt er nur bedingt, weil die Beleuchtung direkt neben der Kamera sitzt und sich dabei gerne in der Vorlage spiegelt.
Das wiederum kann ein Flachbettscanner eindeutig besser.

Dennoch ist dieser Scanner für mich schon nahe am Optimum dessen, was sich für unser Hobby noch rechnet, zumal es die billigeren Modelle dieses Typs inzwischen tatsächlich schon zu Neupreisen gibt, die kaum noch über dem eines guten Flachbettscanners liegen.
Ob diese Billigscanner dann aber auch so empfehlenswert sind wie mein gebraucht erworbenes Modell der höheren Preisklasse, kann ich Dir nicht sagen, zumal dabei wohl auch gerne an der mitgelieferten Software gespart wird…
Auf jeden Fall würde ich Dir empfehlen, Dich mit Scannern dieser Art mal näher zu beschäftigen, wenn Du mehr als nur ein oder zwei Bücher scannen willst. Weil aus meiner Sicht die Vorteile überwiegen und er auf Dauer auch viel Zeit bei der Nachbearbeitung einsparen kann


-5-

Scanner (II) Der Flachbettscanner

Sicher am weitesten verbreitet, ob nun als Einzelgerät oder in Kombination mit einem Drucker und teilweise auch als Kopierer und Faxgerät nutzbar, dürfte dieser Scannertyp sein:

Mein Gerät: ein alter Canoscan Lide 110 (Bilder zum Vergössern anklicken)

Einfach zu bedienen und ein brauchbarer Scanner für viele Zwecke – mit besonderen Stärken beim einscannen flacher Vorlagen wie Bildern oder Briefen:

Einfach Deckel auf, Vorlage mit dem Gesicht nach unten auflegen und bsssss…

Und doch ist er beim Scannen von Büchern nicht so ganz ideal, weil zur Prozedur des Scanvorganges dann ja auch immer noch das Umblättern kommt und die Handhabung deutlich umständlicher macht

Deckel auf, Vorlage mit dem Gesicht nach unten auflegen, bssss…, Umblättern, Vorlage mit dem Gesicht nach unten auflegen, bssss…., Umblättern – usw, usw…

Wozu auch noch zwei weitere, prinzip-bedingte Nachteile dieses Scannertyps kommen:

  • Zum einen das recht gemächliche Tempo, weil dieser Scanner die Vorlage Zeile für Zeile „liest“ und seine Leseeinheit danach erst wieder in die Ausgangstellung zurück fahren muss, ohne dabei etwas sinnvolles zu tun
  • Und zum anderen die für unser Zwecke fatale Eigenschaft, dass er nur das wirklich scharf abbilden kann, was sich in direktem Kontakt zur gläsernen Auflagefläche befindet – schlimmstenfalls mit Auswirkungen, die für unser Zwecke nicht zu gebrauchen sind:

Denn daraus entsteht bei der Texterkennung natürlich nur noch Wortsalat, wie sich später beim Blick auf die Textverarbeitung zeigt, in der es von rot unterstrichenen Fehlern nur so wimmelt, die man mühselig korrigieren müsste:

Doch zum Glück entstehen solche Scanfehler meist nur auf einigen Seiten in der Mitte des Buches und lassen sich auch weitgehend vermeiden, wenn Du genug Druck auf den Buchrücken ausübst, dass die Seiten möglichst komplett auf der Glasscheibe aufliegen. Nicht mit einem Gewicht, sondern am Besten bei offenem Deckel mit den Fingern.
Dann sieht das Scan-Ergebnis nämlich deutlich besser aus:

Perfekt für unsere Zwecke, wie ein erneuter Blick in die Textverarbeitung zeigt, wo tatsächlich nur noch da Fehler bei Wörtern aufscheinen, die das Wörterbuch noch nicht kennt.

So gesehen kannst Du also ohne weiteres mit diesem Scanner-Typ brauchbare Ergebnisse erzielen, wenn Du mit seinen kleinen Nachteilen leben kannst, die ich vor allem in der umständlichen Scan-Prozedur und in seinem recht langsamen Arbeitstempo sehe- und darin, dass man peinlich darauf achten muss, dass die Scans in allen Bereichen ausreichend Schärfe haben.

Zudem kannst Du Flachbettscanner auch sehr preisgünstig gebraucht erwerben. Auf den einschlägigen Portalen findest sich da immer eine reiche Auswahl, auch an Kombidruckern mit defektem Druckwerk, aber noch gut funktionierenden Scannern. Die bekommst Du teilweise schon für den sprichwörtlichen Apfel und das Ei – und gelegentlich sogar ganz und gar geschenkt.

Allerdings solltest Du auch im Schnäppchenfieber nicht vergessen, vorher abzuchecken, ob Dein Wunschgerät kompatibel zu Deinem Betriebssystem ist, wie schon im vorhergehenden Kapitel angesprochen…..


-4-