Ebook-Selbstbau leicht gemacht
„Zwei Dinge sind zu unserer Arbeit nötig: Unermüdliche Ausdauer und die Bereitschaft,
etwas, in das man viel Zeit und Arbeit gesteckt hat, wieder wegzuwerfen..“
Albert Einstein

Scanner (I): Übersicht und Gemeinsamkeiten

(Wer vor allem Ebooks aus eigenen oder gemeinfreienTexten erstellen will, kann dieses Kapitel
und die weiteren Seiten zum Thema „Scanner und Texterkennung“ ohne Weiteres überspringen):

Nachdem wir im letzten Kapitel die Frage nach Rechner und notwendiger, weil arbeitserleichternder Peripherie geklärt haben, sind nun die Geräte dran, die Du nur brauchst, wenn Du auch Ebooks aus fremden Texten erstellen willst.

Scanner, also im weitesten Sinne nichts anderes als Digitalkameras, die in der Lage sind, aus einer gedruckten Vorlage ein digitales Bild zu machen, wie Du es als Grundlage für die weitere Bearbeitung benötigst.

Eine erste Übersicht

Prinzipiell kommt dafür auch erst einmal jedes digitale Bildaufnahmegerät in Frage, ob nun Handy aus der Hand oder Digicam auf einem Stativ, Flachbettscanner als Einzelgerät oder in Kombination mit einem Drucker, sogenannte Aufsicht- oder Buchscanner, Duplexscanner mit automatischem Einzug oder sogar hochspezialierte und extrem teure Faksimile-Scanner, wie manche Bibliotheken sie besitzen.

Allerdings taugt auch nicht jedes dieser Geräte gleich gut für unsere Zwecke, wie sich im Weiteren zeigen wird:
Denn entscheidend ist ja immer, „was hinten dabei rauskommt“, also die Qualität der Bilder, die ausreichen muss, damit im nächsten Arbeitsschritt, bei der Texterkennung, die Fehlerquote möglichst niedrig bleibt und wir später, bei der Textverarbeitung, möglichst wenig Zeit mit der reinen Fehlerkorrektur verbringen müssen.

Mindestvoraussetzungen der Scans

Insofern sollten die Scan-Ergebnisse auch einige Voraussetzungen erfüllen, die Du mit deinem Gerät erzeugen kannst:

  • Eine Auflösung von mindestens 300 Dpi (mehr geht auch, verlängert aber die Zeit für die Texterkennung)
  • Ausreichend Kontrast (am Besten reines Schwarz und Weiss, flaue Graustufenbilder und farbige Aufnahmen erhöhen die Fehlerquote)
  • Keine Verzerrungen und keine Verschattungen (führen ebenfalls zu einer hohen Fehlerquote)
  • gute Bedienbarkeit
  • Mindestens USB 2.0 als Verbindung zum Rechner, damit grosse Datenmengen schnell zum Rechner übertragen werden. (Bilder sind immer ziemlich gross – entsprechendes Tempo ist also Pflicht, wenn Du nicht tagelang am Scanner sitzen willst)
  • Für Dein Betriebssystem passende Treiber und Hilfsprogramme, die auch in der Lage sind, nicht nur Einzelbilder auszugeben, sondern gleich mehrseitige PDF-Dateien ausgeben können.

Deswegen können wir gleich mal einige der Bildermacher wieder von unserer Liste streichen, weil sie die notwendigen Kriterien nicht erreichen oder zumindest zusätzliche Arbeitsschritte mit einer Bildbearbeitung nötig sind (Portieren auf Schwarz-weiss, Entzerren, Zusammenfügen zu mehrseitigen PDF-Dateien usw…), um aus einzelnen Farb- oder Graustufenbildern eine passende Vorstufe für unsere Texterkennung zu basteln – oder im Falle des Faksimile-Scanners sein hoher Preis und sein Platzbedürfnis dagegen sprechen.

Kurzer Einschub:

Das Format mehrseitiger PDF ist gegenüber Einzelbildern deshalb im Vorteil, weil es eine Menge Arbeitsschritte einspart.
Jeweils 20-40 Buchseiten darin zusammengefasst sind deutlich besser zu handhaben, als wenn man (mal das Beispiel des 500-Seitigen Wälzers aus der Einleitung genommen) Unmengen von Einzelbildern einzeln durch die Texterkennung schleusen müsste, jedesmal den gleichen Arbeitsgang wiederholend.
Anderseits macht es für die weitere Bearbeitung aber auch keinen Sinn, ein komplettes Buch in eine einzige, riesig grosse PDF zu packen, die schon aufgrund ihrer Grösse ewig lange Ladezeiten im Texterkennungsprogramm benötigt und bei der Textbearbeitung viel zu unübersichtlich ist.

Software, Treiber & Kompatibilität

Auch der letzte Punkt der Aufzählung ist wichtig, insbesondere falls Du dir nun erst einen Scanner kaufen willst: Nicht jeder Scanner funktioniert mit jedem Betriebssystem!

Und das gilt sowohl für Windows, wo es für viele ältere Scanner seit der Umstellung auf Windows 11 keine passenden Treiber mehr gibt, als auch für Linux, wo oft die Hilfsprogramme nicht funktionieren, weil es herstellerseitig für dieses Betriebssystem nur in den seltensten Fällen passende Softwareversionen gibt. Lediglich MacOS macht da wohl nicht allzuviele Probleme, weil sich seit Jahren am grundlegenden Treibermodell kaum etwas geändert hat.

Insofern solltest Du Dich also insbesondere beim Kauf gebrauchter Geräte schon vorab informieren, ob es für Dein Wunschgerät auch passende Software gibt oder wie Du es ggf. mit Work-arounds zum Laufen bekommst. Wobei die erste Adresse immer die Supportseiten des Herstellers sein sollten, aber auch eine Suche mit Google & Co entsprechende Hinweise und Lösungen bringen kann.

BTW:

Keiner meiner drei (!) Scanner funktioniert genuin unter Linux, aber alle liessen sich mit wenig Aufwand und etwas Recherche auf den Seiten des SaneProjektes zur Mitarbeit überreden. Dort gibts nämlich eine Auflistung der unterstützten Modelle und Links zu passenden Treibern, die von der Linux-Community umgeschrieben und kompiliert wurden. Bezogen auf die Hilfsprogramme sieht es allerdings trotzdem eher Mau aus, da hilft für alle drei nur Ausweichen auf Linux-eigene Lösungen, auf die ich beim Thema Software noch mal näher eingehen werde

Und auch bei Windows kann etwas tricksen hilfreich sein:
Auch zwei meiner drei Scanner werden herstellerseitig unter Windows 11 nicht mehr unterstützt, was passende Treiber angeht. Aber da half in beiden Fällen das Ausweichen auf Treiber für Windows 10 und deren separate manuelle Installation, bevor die zugehörigen Hilfsprogramme installiert werden konnten und nun anstandslos funktionieren. (Übrigens der einzige Grund für mich, wieder einen Windowsrechner zu betreiben, weil die Linux-eigenen Lösungen dagegen deutlich umständlicher zu handhaben sind und weniger Funktionsumfang haben)

Die Hilfsprogramme

Allen Scannern gemeinsam (egal von welchem Hersteller und regelmässig auch auf der Herstellerseite zu finden – leider meist nur für Windows und MacOS – unter Linux kann man sich beispielsweise mit Simple Scan behelfen ) ist eine Suite mit Dienst- und Hilfprogrammen, die meist auch selbst schon ein Texterkennungsprogramm enthalten, oft kastrierte Versionen des Abbyy-Fine-Readers oder von ReadIris und für unsree Zwecke leider nur eingeschränkt nutzbar, weil beide (im Gegensatz zu ihren kostenpflichtigen Vollversionen) weder die Korrektur der Silbentrennung noch die Umwandlung in Fliesstext beherrschen, sondern einfach nur stumpf Zeile an Zeile so aneinander reihen, wie sie erkannt wurden.

Wobei sich zumindest das Problem der Silbentrennung auch mithilfe der Textverarbeitung mit der Funktion „Suchen und Ersetzen“ lösen liesse : Wenn man ins „Suchen“-Feld das Trennzeichen mit nachfolgender Leerstelle eingibt und das „Ersetzen“-Feld leer lässt, werden die Trennungen auch entfernt, allerdings erst, wenn vorher auch alle unnötigen Zeilenumbrüche eliminiert sind. Insofern ist der Weg über die Texterkennung schneller und einfacher

Ansonsten ist diese Suite immer recht ähnlich aufgebaut und trotz unterschiedlichem Aussehens ohne grosse Unterschiede in der Funktion:
Meist wird bei der Installation gleich ein passendes Symbol auf dem Desktop platziert, über das sich ein Hauptmenue aufrufen lässt, wo man (neben der Möglichkeit, darüber auch andere Geräte des gleichen Herstellers ansprechen zu können) auch die Scanner-Steuerung als Unterpunkt findet.

Klick man diese an, kann man in weiteren Untermenues die Auflösung einstellen, sowie zwischen Farbscan, Graustufe oder reinen Schwarz-Weis wählen und ausserdem das Ausgabeformat bestimmen.

Also:

300 DPI – Schwarz-Weiss – mehrseitige PDF

und anschliessend (nach Angabe eines Speicherortes, am besten eines separaten Ordners auf dem Desktop) mit einem Klick auf den entsprechenden Menuepunkt oder Button den Scan auslösen.
Screenshots habe ich dazu keine, aber da hilft Dir das Handbuch des Scanners sicher weiter…

Kleiner Tipp:

In der Regel kann man im Scannermenue auch den Kontrast einstellen.
Diese Möglichkeit solltest Du unbedingt nutzen, wenn Deine Scanvorlage farbig oder stark vergilbt ist und sich bei Probescans zeigt, dass die Schrift auf den Scans eher blass wirkt und nicht satt Schwarz erscheint.
Dann kann Nachregulieren an dieser Stelle bei der Texterkennung wahre Wunder wirken

-_-_-_-

Zum Schluss dieses Kapitels noch eine Anmerkung aufgrund eigener schlechter Erfahrungen

Was Du nicht machen solltest, auch wenn es noch so verlockend sein mag:
Windows-Treiber und Software von einer der zahlreichen, angeblich darauf spezialisierten Seiten herunterladen! Denn damit bekommst Du in der Regel auch nur die gleichen Treiber wie auf den Herstellerseiten und fängst Dir oft auch noch unerwünschtes Beiwerk in Form von penetranter Werbung oder Schlimmerem ein.

-_-_-_-

Und nun zur detaillierteren Vorstellung der einzelnen Scanner-Typen.


-3-

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

%d Bloggern gefällt das: