Title: Praxis der
1- Praxis der
- Metadatenerfassung
- Markus Enders
- Goettingen State and University Library
- www.sub.uni-goettingen.de/GDZ
2Retrieval
Navigation
Anzeige
3Elektronisches Inhaltsverzeichnis
im PDF
4Elektronisches Inhaltsverzeichnis im Web
5Elektronisches Inhaltsverzeichnis im Web
Links zu den Seiten
6RDF/XML
Logische Strukturen
eine Start- / Endseite pro log. Struktureinheit
pro Seite nur ein Image
Optional Volltext
7RDF/XML
Logische Strukturen
eine Start- / Endseite pro log. Struktureinheit
pro Seite nur ein Image
Zukünftig METS
technische Metadaten
Physische Struktur
Derivate von Images
8Metadatenerfassung
Aufnahme in den Katalog
Identifier wird während des Workflows zur
eindeutigen Benennung von Ordnern / Dateien
genutzt.
Anschliessend detailliertere Erfassung
9Erfassung vor dem Scannen
Anhand des gedruckten Buches
Erfassung in ein Excel_Sheet
Konvertierung in RDF/XML-Datei
10Paginierungssequenzen
Logische Seitennummern
Aufgedruckt Paginierung
Physische Seitennummern
Eindeutige Benennung der Seiten
11Paginierungssequenzen
Spalten A and C Gezählte Start/Endseiten
logische Seitennummern
Spalten D and E Ungezählte Start- und Endseiten
Spalten M and N Physische Seitennummer
(errechnet)
12Strukturdaten
Spalte B Typ d. Strukturelements
Spalten C und D Startseite des Strukturelements
Spalten H und I Autor und Titel des
Strukturelements
13Strukturdaten
Metadata
Erfassen der Metadaten
Title
Author
14Strukturdaten
Metadata
Erfassen der Metadaten (Autor und
Titelinformation)
Title
Author
15Strukturdaten
Metadata
Erfassen der Metadaten (Autor und
Titelinformation)
OCR der Inhaltsverzeichnisse
Funktioniert nicht bei schlechter Druckqualität
oder Frakturschrift
16Metadatenübernahme
Katalogmetadaten
Übernahme der Metadaten aus dem OPAC
Download mit WiniBW
Java-Programm zum mergen der Katalogdaten mit den
XML-Daten
17Erfassung nach dem Scannen
Images werden zur Metadatenerfassung genutzt
AGORA XML-Editor
Keine Konvertierung notwendig
18AGORA Editor
19docWorks
Software des METAe-projekts
derzeit im Testeinsatz
automatische Generierung der Struktur- und
Metadaten...
20Im TEI/XML Format (mit Wortkoordinaten möglich)
Manuelle Erfassung (Dienstleister)
Automatische Generierung mit AGORA Konverter
(unkorrigierter OCR-Text) mit docWorks
(während Meta- und Strukturdatenerfassung
derzeit noch kein TEI/XML)
21Dokumentenmanagement System
Ein System für alle Projekte
Erweiterung/Updates stehen für alle Projekte zur
Verfügung
Einfache Pflege und Administration
Import
Batch-Import der Meta- und Strukturdaten mit den
Images
Volltexte (TEI/XML) können separat importiert
werden
22AGORA
Java-Servlet
Meta-, Strukturdaten und Volltexte in
relationaler Datenbank
Imagedaten im Dateisystem
Verity-Engine zur Volltextindexierung
Kooperation mit Satz-Rechen-Zentrum
23Administration
24Administration
Derzeit Windows basiert Web-basierte
Administrationsoberfläche in Entwicklung
25Web-Präsentation
WebMacro Templates
Auch XML-Ausgabe realisierbar
Cache-Verwaltung (von HTML-Seiten)
Als JAVA-Servlet realisiert
26Web- Präsentation
27http//gdz.sub.uni-goettingen.de