XML-Strukturen in PDF und Voraussetzungen zur Weiterverarbeitung von Dokumenten mit assistiven Technologien

Präsentator: Markus Müller-Trabucchi & Ute Mitschke

Die barrierefreie Aufbereitung von Publikationen beginnt häufig mit der Verfügbarkeit von ungetaggten PDF-Dateien, deren Inhalte extrahiert werden sollen. Statt der bisher häufig angewandten Form, Publikationen mittels OCR-Erkennung zu digitalisieren, kann zwischen diversen Exportformaten aus PDF gewählt werden.
An einem Beispiel soll gezeigt werden, wie XML-Daten aus einem ungetaggten und einem getaggten PDF-Dokument erzeugt werden. Um die Export-Ergebnisse sinnvoll bewerten zu können, wird vorher ein spezieller Anforderungskatalog erstellt, der sich an den Kriterien Lesbarkeit, Verständlichkeit und Handhabung der konkreten Dateninhalte orientiert.
Als Ausblick auf einen mehrkanaligen, multimedialen Publikationsworkflow werden Szenarien zu einer möglichen, vollautomatischen Aufbereitung der Inhalte für ein synthetisches Audiodokument skizziert.

 

Info

Um Aufzeichnungen ansehen zu können, ist ein Login erforderlich.

Bestehende User klicken bitte hier, um sich einzuloggen.

Sollten Sie noch keinen Account haben, können Sie sich hier in wenigen Schritten kostenfrei registrieren.

eSeminar-Termin: 22.01.10, 15:00-16:00