Ebook-Selbstbau leicht gemacht
„Zwei Dinge sind zu unserer Arbeit nötig: Unermüdliche Ausdauer und die Bereitschaft,
etwas, in das man viel Zeit und Arbeit gesteckt hat, wieder wegzuwerfen..“
Albert Einstein

Scanner – Übersicht und Gemeinsamkeiten

(Wer vor allem Ebooks aus eigenen oder „gemeinfreien“ Texten erstellen will, kann dieses Kapitel
und die weiteren Seiten zum Thema „Scanner und Texterkennung“ ohne Weiteres überspringen):

Nachdem wir im letzten Kapitel die Frage nach Rechner und notwendiger, weil arbeitserleichternder Peripherie geklärt haben, sind nun die Geräte dran, die Du nur dann brauchst, wenn Du auch Ebooks aus gedruckten Texten erstellen willst:

Scanner, also im weitesten Sinne nichts anderes als Digitalkameras, die in der Lage sind, aus einer gedruckten Vorlage ein digitales Bild zu machen, wie Du es als Grundlage für die weitere Bearbeitung benötigst.

Eine erste Übersicht

Prinzipiell kommt dafür auch erst einmal jedes digitale Bildaufnahmegerät in Frage, ob nun Handy aus der Hand oder Digicam auf einem Stativ, Flachbettscanner als Einzelgerät oder in Kombination mit einem Drucker, sogenannte Aufsicht- oder Buchscanner, Duplexscanner mit automatischem Einzug oder sogar hochspezialierte und extrem teure Faksimile-Scanner, wie manche Bibliotheken sie besitzen.

Allerdings taugt auch nicht jedes dieser Geräte gleich gut für unsere Zwecke, wie sich im Weiteren zeigen wird:
Denn entscheidend ist ja immer, „was hinten dabei rauskommt“, also die Qualität der Bilder, die ausreichen muss, damit im nächsten Arbeitsschritt, bei der Texterkennung, die Fehlerquote möglichst niedrig bleibt und wir später, bei der Textverarbeitung, möglichst wenig Zeit mit der reinen Fehlerkorrektur verbringen müssen.

Mindestvoraussetzungen der Scans

Insofern sollten die Scan-Ergebnisse auch einige Voraussetzungen erfüllen, die Du mit deinem Gerät erzeugen kannst:

  • Eine Auflösung von mindestens 300 Dpi (mehr geht auch, verlängert aber die Zeit für die Texterkennung)
  • Ausreichend Kontrast (am Besten reines Schwarz und Weiss, flaue Graustufenbilder und farbige Aufnahmen erhöhen die Fehlerquote)
  • Keine Verzerrungen und keine Verschattungen (führen ebenfalls zu einer hohen Fehlerquote)
  • gute Bedienbarkeit
  • Mindestens USB 2.0 als Verbindung zum Rechner, damit grosse Datenmengen schnell zum Rechner übertragen werden. (Hoch aufgelöste Scanner-Bilder sind immer ziemlich gross – entsprechendes Tempo ist also Pflicht, wenn Du nicht tagelang am Scanner sitzen willst)
  • Für Dein Betriebssystem passende Treiber und Hilfsprogramme, die auch in der Lage sind, nicht nur Einzelbilder auszugeben, sondern sie auch gleich optimieren und als mehrseitige PDF-Dateien auswerfen können.

Deswegen können wir gleich mal einige der Bildermacher wieder von unserer Liste streichen, weil sie die notwendigen Kriterien nicht erreichen oder zumindest zusätzliche Arbeitsschritte mit einer Bildbearbeitung nötig sind (Portieren auf Schwarz-Weiss, Entzerren, Zusammenfügen zu mehrseitigen PDF-Dateien usw…), um aus einzelnen Farb- oder Graustufenbildern eine passende Vorstufe für unsere Texterkennung zu basteln – oder im Falle des Faksimile-Scanners sein hoher Preis und sein Platzbedürfnis dagegen sprechen.

Kurzer Einschub:
Das Format mehrseitiger PDF ist gegenüber Einzelbildern deshalb im Vorteil, weil es eine Menge Arbeitsschritte einspart.
Jeweils 20-40 Buchseiten darin zusammengefasst sind deutlich besser zu handhaben, als wenn man (mal das Beispiel des 500-Seitigen Wälzers aus der Einleitung genommen) Unmengen von Einzelbildern einzeln durch die Texterkennung schleusen müsste, jedesmal den gleichen Arbeitsgang wiederholend.
Anderseits macht es für die weitere Bearbeitung aber auch keinen Sinn, ein komplettes Buch in eine einzige, riesig grosse PDF zu packen, die schon aufgrund ihrer Grösse ewig lange Ladezeiten im Texterkennungsprogramm benötigt und bei der Textbearbeitung viel zu unübersichtlich ist.

Software, Treiber & Kompatibilität

Auch der letzte Punkt der Aufzählung ist wichtig, insbesondere falls Du dir nun erst einen Scanner kaufen willst: Nicht jeder Scanner funktioniert mit jedem Betriebssystem!

Und das gilt sowohl für Windows, wo es für viele ältere Scanner seit der Umstellung auf Windows 11 keine passenden Treiber mehr gibt, als auch für Linux, wo oft die Hilfsprogramme nicht funktionieren, weil es herstellerseitig für dieses Betriebssystem nur in den seltensten Fällen passende Softwareversionen gibt. Lediglich MacOS macht da wohl nicht allzuviele Probleme, weil sich seit Jahren am grundlegenden Treibermodell kaum etwas geändert hat.

Insofern solltest Du Dich also insbesondere beim Kauf gebrauchter Geräte schon vorab informieren, ob es für Dein Wunschgerät auch passende Software gibt oder wie Du es ggf. mit Work-arounds zum Laufen bekommst. Wobei die erste Adresse immer die Supportseiten des Herstellers sein sollten, aber auch eine Suche mit Google & Co entsprechende Hinweise und Lösungen bringen kann.

BTW:

Keiner meiner drei (!) Scanner funktioniert genuin unter Linux, aber alle liessen sich mit wenig Aufwand und etwas Recherche auf den Seiten des SaneProjektes zur Mitarbeit überreden. Dort gibts nämlich eine Auflistung der unterstützten Modelle und Links zu den passenden Treibern, die von der Linux-Community umgeschrieben und kompiliert wurden. Bezogen auf die Hilfsprogramme sah es allerdings trotzdem eher Mau aus, da half für alle drei nur Ausweichen auf Linux-eigene Lösungen, auf die ich beim Thema Software noch mal näher eingehen werde

Und auch bei Windows kann etwas tricksen hilfreich sein:
Auch zwei meiner drei Scanner werden herstellerseitig unter Windows 11 nicht mehr unterstützt, was passende Treiber angeht. Aber da half in beiden Fällen das Ausweichen auf Treiber für Windows 10 und deren separate manuelle Installation, bevor die zugehörigen Hilfsprogramme installiert werden konnten und nun anstandslos funktionieren. (Übrigens der einzige Grund für mich, doch wieder einen Windows-Rechner zu betreiben, weil die Linux-eigenen Lösungen dagegen deutlich umständlicher zu handhaben sind und weniger Funktionsumfang haben)

Die Hilfsprogramme

Allen Scannern gemeinsam (egal von welchem Hersteller und regelmässig auch auf der Herstellerseite zu finden – leider meist nur für Windows und MacOS. – unter Linux kann man sich beispielsweise mit Simple Scan behelfen ) ist eine Suite mit Dienst- und Hilfprogrammen, die meist auch selbst schon ein Texterkennungsprogramm enthalten, oft kastrierte Versionen des Abbyy-Fine-Readers oder von ReadIris und für unsere Zwecke leider nur eingeschränkt nutzbar, weil beide (im Gegensatz zu ihren kostenpflichtigen Vollversionen) weder die Korrektur der Silbentrennung noch die Umwandlung in Fliesstext beherrschen, sondern einfach nur stumpf die Zeile um Zeile so aneinander reihen, wie sie erkannt wurden.

Wobei sich zumindest das Problem der Silbentrennung auch mithilfe der Textverarbeitung mit der Funktion „Suchen und Ersetzen“ lösen liesse : Wenn man ins „Suchen“-Feld das Trennzeichen mit nachfolgender Leerstelle eingibt und das „Ersetzen“-Feld leer lässt, werden die Trennungen auch entfernt, allerdings erst, wenn vorher auch alle unnötigen Zeilenumbrüche eliminiert sind.
Insofern ist der Weg über die Texterkennung schneller und einfacher

Ansonsten sind diese Suiten immer recht ähnlich aufgebaut und trotz unterschiedlichem Aussehens ohne grosse Unterschiede in der Funktion:
Meist wird bei der Installation gleich ein passendes Symbol auf dem Desktop platziert, über das sich ein Hauptmenue aufrufen lässt, wo man (neben der Möglichkeit, darüber auch andere Geräte des gleichen Herstellers ansprechen zu können) auch die Scanner-Steuerung als Unterpunkt findet.

Klickt man diese an, kann man in weiteren Untermenues die Auflösung einstellen, sowie zwischen Farbscan, Graustufe oder reinen Schwarz-Weis wählen und ausserdem das Ausgabeformat bestimmen.

Also:

300 DPI – Schwarz-Weiss – mehrseitige PDF

und anschliessend (nach Angabe eines Speicherortes, am besten eines separaten Ordners auf dem Desktop) mit einem Klick auf den entsprechenden Menuepunkt oder Button den Scan auslösen.
Screenshots habe ich dazu keine, aber da hilft Dir das Handbuch Deines Scanners sicher weiter…

Kleiner Tipp:
In der Regel kann man im Scannermenue auch den Kontrast einstellen.
Diese Möglichkeit solltet Du unbedingt nutzen, wenn die Scanvorlage farbig oder stark vergilbt ist und sich bei Probescans zeigt, dass die Schrift auf der Seite eher blass wirkt und nicht satt Schwarz erscheint.
Dann kann Nachregulieren an dieser Stelle bei der Texterkennung wahre Wunder wirken

-_-_-_-

Zum Schluss dieses Kapitels noch eine Anmerkung aufgrund eigener schlechter Erfahrungen

Was Du nicht machen solltest, auch wenn es noch so verlockend sein mag:
Windows-Treiber und Software von einer der zahlreichen, angeblich darauf spezialisierten Seiten herunterladen! Denn damit bekommst Du in der Regel auch nur die gleichen Treiber wie auf den Herstellerseiten und fängst Dir oft noch auch unerwünschtes Beiwerk in Form von penetranter Werbung oder Schlimmerem ein.

-_-_-_-

Weiter geht es mit der detaillierteren Vorstellung der einzelnen Scanner-Typen.

Fragen, Anmerkungen und
Kommentare unter dem Blogbeitrag

%d Bloggern gefällt das: