Ein neues Verfahren für automatisches Scannen - der Bookreader

Günter Seidl, Arved Carl Hübler*, Institut für Print und Medientechnik, Technische Universität Chemnitz, http://www.tu.chemnitz.de/pm 17.11.2000

  1. Stand der Technik
  2. Lösungsansatz
  3. Eingrenzung der Systemparameter
  4. Realisierung
  5. Versuche zur Bestimmung relevanter Papiereigenschaften
  6. Stand der Arbeit am Projekt Bookreader und Ausblick

Introduktion

Für die Anwendung bei Print-on-Demand und konventionellen Reprints wird die retrospektive Digitalisierung mehr und mehr eingeführt. Im Falle von gebundenen Büchern ist der manuelle Scan-Prozess zur Zeit die aktuelle Technologie. In diesem Beitrag wird eine neue Erfindung für das automatische Scannen vorgestellt. Jede Seite des zu digitalisierenden Buches wird automatisch umgeblättert. Technische Lösungen zur sicheren Verhinderung eines Datenfehlers und die Anwendung für eine breite Palette von verschiedenen Papieren werden diskutiert.

1. Stand der Technik

Das Digitalisieren von älteren analogen Bibliotheksbeständen geschieht aus den verschiedensten Gründen. Ein herausragendes Beispiel hierfür ist die Digitalisierung der Gutenberg-Bibel im Digitalisierungszentrum der Staats- und Universitätsbibliothek in Göttingen. Es hilft, Forschungen am Objekt zu betreiben, ohne dass das Original benutzt oder beschädigt wird. Es wird Kulturgut bewahrt und kann trotzdem genutzt werden. Auf diese Weise werden Bücher, die nicht ausleihbar sind, für breite Interessentenkreise zugänglich gemacht.

"Subito" als Dokumentenlieferdienst deutscher Bibliotheken für Aufsätze und Bücher ist ein Beispiel für eine Dienstleistung, bei der online recherchiert, bestellt und per E-mail direkt an den Benutzerarbeitsplatz geliefert wird. Die Voraussetzung hierfür ist jedoch, dass die Literatur aus dem Regal genommen und von Hand am Buchscanner digitalisiert wird.

In der retrospektiven Digitalisierung unterscheidet man je nach Vorlage, ob der Datensatz mehr Bild- oder Text- orientiert sein soll, ob ein möglichst originalgetreues Faksimile mit hoher Auflösung und exakter Farbtreue hergestellt, oder ob es ein Datensatz wird, der die Inhaltserkennung und die weitere Arbeit mit dem Text gestatten muß (OCR).

Die Objekte, die aus dem Bibliotheksbestand digitalisiert werden, können sein:

Digitalisieren von Büchern

Einzelne Buchseiten können auf Flachbettscannern digitalisiert werden. Hierzu muß jedoch das Buch mit der offenen Seite nach unten auf den Scanner gelegt werden. Die Handhabung ist umständlich.

Für das Scannen von Büchern werden sog. 3D-Scanner eingesetzt, die im Allgemeinen als Buchscanner bezeichnet werden. Dabei werden die aufgeschlagenen Seiten des Buches von oben sichtbar auf eine ebene Fläche gelegt. Die Kamera ist darüber aufgehängt.

Kameras, die während der Aufnahme eine CCD-Zeile mit 5000 Pixeln über das Aufnahmeformat bewegen, bringen es auf eine Auflösung von 300 dpi bei einem Format von A2 (Zeutschel 1999). Beispiele für am Markt verfügbare Systeme sind der Omniscan 6000 Color der Firma Zeutschel, Tübingen/Hirschau.

Eine höhere Auflösung bei kleinerem Format wird erreicht, wenn die Kamera in der Höhe verstellbar ist und dem Format angepaßt werden kann.

High-End-Geräte, wie sie z.B. für die Digitalisierung von Faksimiles eingesetzt werden, haben einen CCD-Flächensensor mit 8000x9700 Pixel (Liebetruth 1999), sogar schon 10500x12600 Pixel (PhaseOne 1999).

Weiterhin wird je nach Verwendungszweck unterschieden, ob die Kamera für schwarz/weiß, Grauwerte oder für Farbaufnahmen ausgelegt ist.

Bei allen Buchscannern, die auf dem Markt sind, müssen die Bücher von Hand umgeblättert werden. Die technische Entwicklung bei diesen Buchscannern geht zu immer größerer Auflösung und schnellerer Datenverarbeitung, aber eine Automatisierung des Umblätterns ist bisher nicht bekannt. Deshalb wird die Leistung durch das Handling der Bücher begrenzt sein. Der entscheidende Nachteil dieser Buchscanner ist, dass immer eine Arbeitskraft während des Digitalisierens kontinuierlich beschäftigt ist. Diese Arbeit ist sehr eintönig und erfordert dennoch höchste Konzentration damit eine fehlerfreie Datei entsteht.

Um diese Handarbeit zu umgehen wird für die Digitalisierung von Büchern zur Zeit eine andere Methode praktiziert, bei der die Bücher aufgetrennt und als Einzelblätter dem Scanner zugeführt werden. Für wertvolle Bücher, die nicht zerstört werden sollen, ist diese Methode nicht akzeptabel.

Patente von Umblättervorrichtungen

In der Patentliteratur finden sich viele Patente von Umblättervorrichtungen, jedoch für andere Anwendungen und nicht für einen Buchscanner. Einige der neuesten Patente dieses Gebietes sollen genannt werden. Eine Gruppe von patentierten Lösungen eignet sich als Hilfe für Behinderte und für Notenpulte. Meist stehen hierbei die Bücher annähernd senkrecht, leicht nach hinten geneigt und die Betätigung erfolgt in der Regel durch den Fuß. Es werden verschiedenartige Elemente zum Erfassen und Umblättern der Seiten vorgeschlagen: sich drehende Trommeln mit Taschen, in die Einzelblätter eingelegt werden (Moritz, Adolf; 28.01.96), (Moritz, Adolf; 20.02.98), eine Trommel mit waagerechter Achse, bei der Einzelblätter nach Gebrauch in eine darunter liegende Tasche fallen (Strauß, Gerhard; 18.01.96), ein Schwenkarm mit Klemmgreifer, der sich um eine annähernd senkrechte Achse dreht und die zu wendende Buchseite umblättert (Heise, Rudolf; 05.12.94), (Trauschke, Siegfried; 16.03.94).

Für das Eindrucken in Pässen oder ähnliche kleinformatige dünne Hefte werden die Seiten durch eine Reibrolle verschoben und die sich bildende Schlaufe wird umgeschlagen (Maekawa, Hideki; 04.12.96), (Trauschke, Siegfried; 16.03.94).

Für dickere Bücher wird die Seite etwas angehoben und läuft in einen Schlitz. Beim Passieren der Buchmitte wird die Seite umgeschlagen und läuft aus dem Schlitz wieder heraus (Maekawa, Hideki; 04.12.96), (Fujoka, Tetsuya u.a.; 01.03.94).

Senkrecht sich bewegende Sauger heben die umzublätternde Seite an. Das Buch wird in Richtung Sauger bewegt und die Seite legt sich um. (Masaaki, Horikawa; 23.04.92).

Für den Zweck des Umblätterns zum Digitalisieren läßt sich keine der vorgeschlagenen Lösungen verwenden. Die Gründe sind folgende:

Eine Umblättervorrichtung für Buchscanner, d.h. Digitalisierungsgeräte mit oben hängender Kamera wurde in der Patentliteratur bisher nicht gefunden.

2. Lösungsansatz

Der übliche Funktionsablauf der Datenaufnahme eines Buchscanners ist in Abb.1 dargestellt.

Abb. 1: Buchhandling und Datenaufnahme in einem Buchscanner

Dieser Funktionsablauf trifft für Buchscanner zu, bei denen von Hand umgeblättert wird. Nach jedem Umblättern der Buchseite wird der Scanvorgang von Hand ausgelöst.

Für einen Bookreader mit automatischer Umblättervorrichtung ist der Funktionsablauf prinzipiell der gleiche. Der Unterschied liegt in der Steuerung. Vom Rechner, der die Datenaufnahme und Datenverarbeitung abarbeitet, wird ein Befehl an die Steuerung der Umblättervorrichtung gegeben, die wiederum nach erfolgter Funktion den Befehl zur Datenaufnahme zurückgibt.

Der Vorteil des Bookreaders mit automatischem Umblättern ist der Wegfall des manuellen Umblätterns der Bücher beim Digitalisieren. Die Aufmerksamkeit dient nun der Überwachung und Qualitätskontrolle von mehreren gleichzeitig arbeitenden Bookreadern. Auf diese Weise wird die Arbeit beim Digitalisieren auf eine höhere Ebene gestellt.

Das Handling der Bücher durch die Umblättervorrichtung kann auf die jeweilige Papierqualität eingestellt werden, bleibt während des gesamten Jobs konstant, ist verschleißfrei und ist nicht mehr den Fehlerquellen durch unkonzentrierte Arbeit infolge Eintönigkeit unterworfen.

Die Motivation für die Arbeit des Digitalisierens von Büchern und die Produktivität steigt.

Die Forderungen, die an ein solches Gerät gestellt werden müssen, sind folgende:

Daraus ergeben sich für den Prototyp eines solchen Gerätes bestimmte Festlegungen, die sich aus der Analyse und Kritik systematischer Betrachtungen ergeben haben.

3. Eingrenzung der Systemparameter

Die Systemparameter für die Datenaufnahme liegen im System der Kamera und bei der Datenverarbeitung im Rechner. Diese Problematik ist nicht Inhalt des Forschungsprojektes.

Für den Prototyp des Bookreaders wird ein Kameratyp eingesetzt, bei dem der Scankopf mit einer CCD-Zeile mit 5000 Pixel und einer Steuerelektronik ausgerüstet ist, die während der Aufnahme die CCD-Zeile über das Aufzeichnungsformat in der Kamera bewegt. Die Scandauer beträgt ca. 5 Sek., bei einer maximalen Auflösung von 300 dpi bezogen auf das Format von A2. Die Kamera ist höhenverstellbar. So kann bei wechselnden Aufnahmeformaten immer die maximale Auflösung genutzt werden. (Zeutschel, 1999)

Zur Festlegung der Grenzen bezüglich der Buchformate sind Untersuchungen im Lesesaal der Uni-Bibliothek Chemnitz angestellt worden.

Abb. 2: Erfassung der Buchgrößen von 3009 Büchern aus der Uni-Bibliothek Chemnitz; Fachgebiete: Biologie, Mathematik, Technik, Physik, Chemie/Phar-mazie, Wirtschaftswissenschaften, Rechtswissenschaften, Pädagogik, Kunstge-schichte, Anglistik/Amerikanistik, Geschichte, allgemeine bibliographische Nachschlagewerke, Germanistik, Philosophie, Musikwissenschaften, Politologie

Für die Konzipierung eines Prototyps des Bookreaders wurden bewußt extreme Buchformate beispielsweise aus der Geographie nicht mit einbezogen.

Daraus ergibt sich eine mit den nachfolgenden Formatgrenzen gewählte Auslegung:

kleinstes Buchformat 10 x 15 cm und (etwa 4" x 6")

größtes Buchformat 30 x 45 cm. (etwa 12" x 18")

Die maximale Buchdicke darf 10 cm betragen. (etwa 4")

Damit können etwa 96 % aller Bücher erfasst werden.

4. Realisierung

Aus den Forderungen an einen automatisch arbeitenden Bookreader mit Umblätterfunktion sind nach systematischen Betrachtungen folgende Lösungen ausgewählt und detailliert worden. Die Umblättervorrichtung wird ein Prototyp sein, an dem die optimalen Bedingungen für das Umblättern bei verschiedenen Buchformaten und Papierqualitäten untersucht werden können. Darum ist ein weiter Verstellbereich für prozessrelevante Kenngrößen vorgesehen.

Vorstellung von Details und Erläuterung der Funktion des Prototyps der Umblättervorrichtung

 

Abb. 3: Darstellung der angehobenen Buchseite und Funktion des Wenders

Funktionsablauf:

  1. Das Buch ist durch Klammern auf der Buchunterlage befestigt.
  2. Die digitale Aufnahme der beiden offenen Seiten durch die Kamera ist beendet.
  3. Der Rechner gibt den Befehl an die Steuerung der Umblättervorrichtung zum Start.
  4. Der Hebel mit den Saugern schwenkt über die umzublätternde Seite und senkt sich auf die Buchseite.
  5. Saugluft an, die Buchseite springt an den Sauger.
  6. Die Sauger kippen und heben die umzublätternde Seite an. (siehe Abb. 3)
  7. Der Wender dreht sich um eine senkrechte Achse unter die angehobene Seite.
  8. Die Sauger geben die Seite frei.
  9. Der Wender schlägt die Seite um.
  10. Nach dem Umblättern dreht sich der Hebel mit den Saugern um eine senk-rechte Achse nach rechts aus der Aufnahmeebene heraus (siehe Abb. 5).
  11. Das Timing für das Absenken der geteilten Glasplatte verhindert ein Zurückfallen der umgeblätterten Seite.

Abb. 4: Absenken der geteilten Glasplatte auf das Buch

  1. Die in der Mitte geteilte Glasplatte senkt sich auf das Buch.
  2. Die beiden inneren Kanten der geteilten Glasplatte legen sich auf den Bundsteg des Buches.
  3. Beim weiteren Absenken rollen die beiden Teile der Glasplatte die Seiten

eben.

Abb. 5: Darstellung während der Aufnahme

  1. In der untersten Stellung bilden die beiden Teile der Glasplatte die Aufnahmeebene für die Aufnahmekamera.
  2. Die Steuerung für die Umblättervorrichtung gibt ein Signal an den Scanner, dass die Umblättervorrichtung zur digitalen Aufnahme der nächsten beiden Seiten bereit ist.
  3. Es erfolgt die Aufnahme.
  4. Nach Abschluß der Aufnahme werden beide Teile der Glasplatte angehoben, der Hebel mit den Saugern schwenkt zurück über die nächste Seite, kippt und hebt die nächste Seite an.

Begründung der Detaillösungen

1. Die für die rechte und linke Hälfte des Buches geteilte Buchauflage (Buchwippe) ist so gestaltet, dass das aufgeschlagene Buch nach oben offen liegt. Die Kamera ist darüber aufgehängt. Diese Anordnung hat folgende Vorteile:

2. Der Unterdruck im Sauger wird durch Bauelemente, die nach dem Ejektorprinzip arbeiten, durch Blasluft erzeugt. Vorteile:

3. Die Bewegung der Sauger geschieht durch gekoppelte pneumatische Dreh- und Hubzylinder. Vorteile:

4. Das Anheben und das Wenden der Buchseite wird durch getrennte Bauelemente verwirklicht. Vorteile:

5. Um eine plane Aufnahmeebene zu erzeugen, senkt sich nach dem Umblättern eine in der Mitte geteilte Glasplatte auf das Buch. Vorteile:

6. Die Bauelemente zum Bewegen der Sauger, des Wenders und der geteilten Glasplatten sind hinter dem geöffneten Buch angeordnet. Vorteile:

5. Versuche zur Bestimmung relevanter Papiereigenschaften

Für Vorversuche besonders für das Trennen und Anheben der einzelnen Buchseiten wurden 8 unterschiedliche Papiersorten untersucht, wie sie in Bücher verarbeitet werden.

Wenn die Buchseite von der nächsten darunterliegenden durch einen Sauger erfasst, getrennt und angehoben wird, besteht die Gefahr, dass nicht nur eine, sondern eventuell zwei oder mehrere Seiten erfasst werden. Die Gründe hierfür sind folgende:

Dies ist ein kritischer Fall und muss vermieden werden. Eine Möglichkeit des Lösens der zweiten angesaugten Seite besteht im Ankippen des Saugers. Durch die elastische Biegesteifigkeit des Papieres springt sie ab, wenn die Biegekraft größer ist als die Saugkraft. Um diese Bedingungen näher untersuchen zu können, werden von den 8 unterschiedlichen Papiersorten, die aus Büchern herausgetrennt wurden, die Luftdurchlässigkeit und Biegesteifigkeit ermittelt.

Da besonders die Biegesteifigkeit von Papier stark von der Luftfeuchtigkeit abhängig ist, wurden die klimatischen Bedingungen während der Messungen festgehalten.

Sie betrugen: Raumtemperatur: 20...22°C, rel. Luftfeuchtigkeit: 38...40%

Relevante Kenngrößen der untersuchten Papiere sind:

bei 10 N/cm²

Unterdruck 100 mm Wassersäule

berechnet nach

wobei

Q in [g] die Eigenmasse des einseitig eingespannten Papierstreifens,

l in [cm] die freie Einspannlänge des Papierstreifens,

I in [cm4 ] das Flächenmoment 2. Grades und

f in [cm] die Durchbiegung sind. [3]

 

Die untersuchten Papiersorten sind:

Sorte 1: Telefonbuchpapier, holzhaltig, leicht satiniert

Sorte 2: Tiefdruckpapier aus einer Broschüre, holzhaltig, satiniert

Sorte 3: Offsetdruckpapier aus einem Fachbuch, holzhaltig, Naturpapier

Sorte 4: Offsetdruckpapier aus einer Broschüre, holzfrei, Naturpapier

Sorte 5: Offsetdruckpapier aus einem Fachbuch, schwach holzhaltig,

schwach satiniert

Sorte 6: Kunstdruckpapier aus einem Bildband, beidseitig gestrichen, holzfrei,

matt

Sorte 7: Karton, unbedruckt, weiß, holzfrei, Natur-Oberfläche

Sorte 8: Karton, Gautschbrief, chamois, holzhaltig, satiniert, Natur-Oberfläche

Papiersorte

Flächenmasse

[g/m²]

Dicke

[mm]

Luftdurchläss.

[ml/min]

E-Modul

[N/mm²]

1

37

0,054

400

121 x 10³

2

61

0,066

60

322 x 10³

3

61

0,068

58

108 x 10³

4

80

0,103

833

238 x 10³

5

104

0,133

17

392 x 10³

6

135

0,122

nicht meßbar*)

392 x 10³

7

187

0,215

500

257 x 10³

8

193

0,213

40

339 x 10³

Tabelle 1: Zusammenfassung der Papierkennwerte

*)100 ml/10 min bei 250 mm Unterdruck Wassersäule

Abb. 6: Messwerte der Luftdurchlässigkeit

Abb. 7: Errechnete Werte der Biegesteifigkeit (E-modul)

Abb. 8: Kombination der Luftdurchlässigkeit mit der Biegesteifigkeit

Kommentierung der Meßwerte und Schlußfolgerungen

Für ein sicheres Umblättern der Buchseiten, denn nur so kann eine fehlerfreie Datei garantiert werden, ist die Frage nach den Einflußfaktoren aus den Papiereigenschaften interessant.

Vorteile für ein sicheres Umblättern bringt die Kombination von geringer Luftdurchlässigkeit und hoher Biegesteifigkeit. Beidseitig gestrichene Kunstdruckpapiere gehören dazu. Diese sind auch nach dem Augenschein leicht als solche einzuordnen.

Kritischer ist der Unterschied beispielsweise zwischen dem Offsetpapier

Sorte 4 und dem Offsetpapier Sorte 5. Beide sind Naturpapiere, holzfrei und annähernd holzfrei. In den optischen (Auflicht) und haptischen Eigenschaften sind beide kaum zu unterscheiden. Die Sorte 5 hat eine Luftdurchlässigkeit von 17 ml, während die Sorte 4 830 ml aufweist. Dieser große Unterschied ist ohne Hilfsmittel nicht zu erkennen. Ein hoher Wert der Luftdurchlässigkeit erscheint nachteilig für ein sicheres Umblättern.

Einen deutlichen Unterschied weisen beide Papiersorten jedoch auf. Die Wolkigkeit im Durchlicht, d.h. die Ungleichmäßigkeit in der Papierformation ist bei dem luftdurchlässigen Papier deutlich höher, als bei dem dichten Papier. Weitere Untersuchungen sind notwendig, ob es eine Korrelation zwischen der Wolkigkeit und der Luftdurchlässigkeit gibt. Das wäre eine einfache Lösung, um ohne weitere Hilfsmittel einschätzen zu können, ob es sich um ein Problempapier für das Umblättern handelt oder nicht.

Die Möglichkeiten der Einstellung optimaler Bedingungen zum Umblättern am Bookreader sind

Ziel ist eine optimale Einstellung, mit der eine breite Palette verschiedener Papiersorten sicher umgeblättert werden kann und fundierte Hinweise, wie

Problempapiere behandelt werden können.

6. Stand der Arbeit am Projekt Bookreader und Ausblick

Dieser Bericht ist aus der laufenden Arbeit heraus geschrieben. Am Prototyp werden zur Zeit die optimalen Einstellungen für ein sicheres und buchschonendes Umblättern ermittelt. Die folgenden Bilder zeigen konstruktive Einzelheiten. Die Umblättervorrichtung zum Handling der Bücher mit Steuerung zum Bewegen der Wirkelemente und Software zur Kopplung ist vorerst an einen ausgewählten Buchscanner der Firma Zeutschel, Tübingen angepasst worden. Im Anschluß erfolgt eine Weiterentwicklung zu einem marktgerechten Produkt.

Abb. 9: Gesamtansicht des Prototyps zum Umblättern mit angehobener
Glasplatte

Abb. 10: Aufsetzen der Sauger

Abb. 11: Kippen der Sauger zum Lösen der Seite

Abb. 12: Einschwenken des Wenders

Abb. 13: Umgeblätterte Seite

Abb. 14: Absenken der geteilten Glasplatte mit anschließendem Glattlegen der Buchseiten

Abb. 15: Definierung der optischen Ebene durch die ebene Glasplatte

Verwendete Literatur:

Zeutschel 1999

Prospekt der Firma Zeutschel GmbH, D-72070 Tübingen

Liebetruth 1999

1hochauflösende digitale Kamera "Picture Gate 8000"

http://www.sub.uni-goettingen.de

Anonym 1999

PROFIFOTO Magazin für professionelle Fotografie

http://www.phaseone.com

Lipsmeier 1999

1999 "Friedrich-Tabellenbuch Metall- und Maschinentechnik" Dümmler Verlag Bonn, S 2-20

Auswahl der recherchierten Patente:

Moritz Adolf,

28.01.99, Vorrichtung zum Wenden von Blättern, EP 0937 583 A2

Moritz Adolf,

20.02.98, Vorrichtung zum Wenden von Notenblättern DE 298 02 973 U1

Maekawa, Hideki,

4. 12. 96, Umblättervorrichtung DE 196 50 312 A1

Strauß, Gerhard,

18.1.96, Maschine zum Umblättern loser Seiten, 296 00 791 U1

Heise Rudolf,

15. 12. 94, Vorrichtung zum Umblättern der Seiten eines Buches oder dergleichen, DE 44 43 221 A,

Trauschke Siegfried,

16. 3. 94, Blattwender, DE 94 04 375

Fujioka, Tetsuya u. a.,

01.03. 94, Bilderzeugeeinrichtung mit Buchlese- und Seitenumblätter-Funktionen, DE 44 06 667 A1

Kabushiki Kaisha, Toshiba,

28.07.92 Apparatus for printing images on booklets, 5 183 347,

Masaaki, Horikawa,

23.04.92 Apparatus for turning over Page, 5 - 30 14 87 (A),

Dank

Das Projekt wird mit Mitteln der DFG (Deutsche Forschungsgemeinschaft), Bonn unter den Aktenzeichen III N 2 – 542 81(1) gefördert.

Besonderer Dank gilt dem Referatsleiter, Herrn Dr. Jürgen Bunzel und allen Gutachtern, die die Arbeit am Projekt Bookreader verantwortungsbewusst verfolgen, beurteilen und ermöglichen.

[Zurück zum Seitenanfang]

[Weitere Referate] [Zur Startseite des Digitalisierungszentrums]



BSB München 15.12.2000 MDZ@bsb-muenchen.de