Computertechnik Bücher Digitalisieren und PDF-Aufbereitung

Cryn

Sethskind
Registriert
26. Mai 2007
Beiträge
1.305
Hat schon mal jemand ein (RPG) Buch eingescannt und als PDF aufbereitet? Leider gibt es für FFG Star Wars keine (offiziellen) PDFs und ich überlege, ob ich mir nicht selber PDFs erstelle. Bevor ich mich kopfüber in das Abenteuer stürze und am Ende doch ohne brauchbare Ergebnisse dastehe, wollte ich nach Erfahrungen fragen.

Am Ende hätte ich gerne ein PDF mit ordentlichem OCR Text, Bookmarks für Kapitel und Abschnitte (und ggf. wichtige Tabellen). Bonus wäre klickbares Inhalts- und Stichwortverzeichnis (also auf den Buchseiten direkt anklickbare Links).
Daraus ergeben sich für mich folgende Fragen:
  • Wie Zeitaufwändig ist die Erstellung so eines Buches? Scanzeit hängt vermutlich stark vom Scanner ab, aber wie aufwendig ist die weitere Verarbeitung der einzelnen Scan-Seiten zu einem PDF?
  • Was für Scanner-Hardware wurde verwendet? War das Scanergebnis gut?
  • Scans nachbearbeiten - was für Aufgaben fallen an? Welche Software ist zu empfehlen oder zu meiden?
  • PDF erstellen und OCR - Welche Software ist zu empfehlen oder zu meiden?
Ich versuche, für mich abzuschätzen, ob sich das Thema überhaupt für mich lohnt und ich dann tatsächlich ein paar Bücher aufbereite und der ganze Kram dann nicht nur "rumliegt".
 
Mehrfach. Lohnt sich insbesondere bei Werken, die nicht mehr neu aufgelegt werden oder aber auch, um sie zum Lesen auf einem Ebookreader oder zum Bearbeiten auf dem Recher zu haben.

Ich kenne keine bessere Software als Abbyy Finereader. Sie kann wahlweise Bilder, pdf, ePub oder andere Formate abspeichern.
Es gibt zwei Nachteile, die mir auffallen:
Die Rohdaten nehmen gern mal etwa 1GB für ein Buch ein und
man muss die Seiten manuell sortieren, wenn man einen normalen Scanner mit Einzug besitzt, wenn man per Hand Seite für Seite scannt oder ein Druckerscanner hat, dann entfällt dieses Problem.

Die Qualität ist sehr gut. Wenn normale Schriftsätze verwendet wurden, keine Bilder dazwischen sind, erkennt er eigentlich auch alles. Wenn es jedoch um ungewöhnliche Schriftsätze oder Schrift in Bildern geht, gibt es in der Regel immer Fehler, die man per Hand korrigieren muss.
Auch wenn man ein anderes Format wie ePub verwendet, muss man das Buch aufarbeiten, wenn man einen komplizierteren Seitenaufbau in einen Fließtext verwandeln möchte.

Wenn Du Dir einen (besseren) Scanner suchen solltest, dann solltest Du darauf achten, ob
der Scanbereich genau an der Anlageleiste beginnt bzw. endet,
der Einzug auch kleinere Formate (Oktav) einziehen kann,
er einen üblichen Standard (wie TWAIN) unterstützt.

Fotoscanner kenne ich nicht. Die richtig teuren Scanner blättern sogar und saugen die Blätter mittels Unterdruck beim Scannen an - aber die Dinger kosteten das letzte Mal als ich geschaut hatte im vierstelligen Bereich.

Ich hoffe das hilft Dir erstmal ein wenig weiter ;)
 
Zuletzt bearbeitet:
Wieviele Stunden hast Du ca. für ein Buch gebraucht? Wie viele Seiten waren das?

Als Scanner hätte ich an diesen gedacht: Avision FB2280E - scheint recht schnell zu sein und ordentliche Bilder zu liefern. 1500$ sind dann doch etwas happig... Was nutzt Du für ein Modell?

Interessant fand ich auch die Idee der "Scanner", welche die Bücher abfotografieren. Ich weiß aber nicht, wie gut das Glätten der Seitenwölbung per Software in der Praxis funktioniert. Ich hatte mal vor ein paar Jahren ein Heft nach diesem Prinzip abfotografiert - war schwierig, die Seiten einigermaßen gleichmäßig auszuleuchten und zu verhindern, daß die Seiten ständig umblättern. Da müßte man vermutlich eine Glasplatte auf die Seite legen und hat dann zusätzliche Probleme mit Refexionen. Ich hatte dann Münzen auf die Ecken gelegt als Gewichte - schön ist das aber nicht.
 
An größeren Unis gibts in der Regel Buchscanner in der Bücherei*. Die blättern halt nicht selbst aber machen das mit der Glättung der gewölbten Seiten ausgleichen usw automatisch. Wurde mir zumindest gesagt, ich habe das nie so recht hin bekommen aber auch nicht viel daran herum probiert. OCR haben die nicht, kannst du aber mit NAPS, das ist eine freie Scansoftware, nachträglich machen, das liefert gute Ergebnisse.
Links nachträglich einfügen kannst du meines Wissens nach nur zu Fuss. Mir fallen mehrere Möglichkeiten dazu ein aber alle sind recht aufwändig, genau so mit dem Inhaltsverzeichnis. Bedenke, dass jeder pdf Reader eine Volltextsuche hat - hat die Texterkennung vernünftig funktioniert ist das eventuell auch auf Dauer der einfachere Weg.

*Für die Nutzung muss man kein Uniangehöriger sein, es kann aber sein, dass die Uni die für dein Wohngebiet zuständig ist keinen Scanner hat. Seit ein paar Semestern dürfen die zudem Gebühren erheben.
 
Wieviele Stunden hast Du ca. für ein Buch gebraucht? Wie viele Seiten waren das?

Ich mache das nicht professionell, sondern für mich und da ist es mir egal, wie lange das dauert, habe auch nie gemessen. Aber schneller als 20 Sekunden pro Seite manuell wird es nicht und mit Einzug etwa 5 Sekunden pro Seite, wobei man - wie gesagt - die Seiten dann noch neu ordnen muss.
Dann kommt die Nachbearbeitung, die weniger Zeit beansprucht, je einfacher der Font und je weniger Bildmaterial vorhanden ist. Insbesondere wenn beides ineinander verschachtelt ist, kann man gut nochmal 20 Sekunden pro (komplizierter) Seite rechnen.

Also 120 Seiten manuell in einer Stunde sind wirklich gut, würde eher zwei Stunden ansetzen und locker nebenher kopieren.

Zu dem Scanner kann ich nichts sagen. Geschwindigkeit scheint mir normal zu sein. Linuxunterstützung gibt es bei dem nicht. Falls Du Dir Sorgen machen solltest, ob es eine Rolle spielt, wie man eine Seite scannt: Tut es nicht. Das Programm erkennt die Ausrichtung der Seite automatisch und kann auch sofort die Lage korrigieren, wenn man das möchte.
Die Korrektur der Buchmitte nimmt im Übrigen auch die Software vor - man kann also auch einen normalen Scanner nutzen - jedoch muss man die Bücher natürlich dann "aufbiegen", was eventuell die Bindung öffnet und den Rücken krümmt.

Hier gibt es noch einen anderen günstigeren Selbstbau - aber das sind natürlich Fotoapperate, die haben keinen Treiber für die Software. Man kann aber auch Bilder einlesen.

 
Zuletzt bearbeitet:
Da ich privat keinen "normalen" Scanner habe und die Bücher alle Hardcover sind, wollte ich sie mit einem geeigneten Scanner schonen.
Auf Arbeit haben wir Scan/Kopier-Kombies, die aber auch keine Buchkante haben. Ich habe dort schon mal ein paar Vorlagen aus einem Buch kopiert und mußte die Bindung da schon recht beanspruchen, damit das Ergebnis ordentlich ist. Das ganze will ich eigentlich meinen Büchern nicht zumuten.

Uni ist ein guter Hinweis, danke.
 
Zurück
Oben Unten