Praxis der - PowerPoint PPT Presentation

About This Presentation
Title:

Praxis der

Description:

Title: PowerPoint-Pr sentation Author: Colourman Last modified by: SUB99999 Created Date: 3/28/2001 5:59:54 PM Document presentation format: Bildschirmpr sentation – PowerPoint PPT presentation

Number of Views:102
Avg rating:3.0/5.0
Slides: 28
Provided by: Colourman
Category:
Tags: der | praxis | retro

less

Transcript and Presenter's Notes

Title: Praxis der


1
  • Praxis der
  • Metadatenerfassung
  • Markus Enders
  • Goettingen State and University Library
  • www.sub.uni-goettingen.de/GDZ

2
  • Meta- und Strukturdaten

Retrieval
Navigation
Anzeige
3
  • Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis
im PDF
4
  • Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis im Web
5
  • Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis im Web
Links zu den Seiten
6
  • Datenformat

RDF/XML
Logische Strukturen
eine Start- / Endseite pro log. Struktureinheit
pro Seite nur ein Image
Optional Volltext
7
  • Datenformat

RDF/XML
Logische Strukturen
eine Start- / Endseite pro log. Struktureinheit
pro Seite nur ein Image
Zukünftig METS
technische Metadaten
Physische Struktur
Derivate von Images
8
  • Meta- und Strukturdaten

Metadatenerfassung
Aufnahme in den Katalog
Identifier wird während des Workflows zur
eindeutigen Benennung von Ordnern / Dateien
genutzt.
Anschliessend detailliertere Erfassung
9
  • Meta- und Strukturdaten

Erfassung vor dem Scannen
Anhand des gedruckten Buches
Erfassung in ein Excel_Sheet
Konvertierung in RDF/XML-Datei
10
  • Meta- und Strukturdaten

Paginierungssequenzen
Logische Seitennummern
Aufgedruckt Paginierung
Physische Seitennummern
Eindeutige Benennung der Seiten
11
  • Meta- und Strukturdaten

Paginierungssequenzen
Spalten A and C Gezählte Start/Endseiten
logische Seitennummern
Spalten D and E Ungezählte Start- und Endseiten
Spalten M and N Physische Seitennummer
(errechnet)
12
  • Meta- und Strukturdaten

Strukturdaten
Spalte B Typ d. Strukturelements
Spalten C und D Startseite des Strukturelements
Spalten H und I Autor und Titel des
Strukturelements
13
  • Meta- und Strukturdaten

Strukturdaten
Metadata
Erfassen der Metadaten
Title
Author
14
  • Meta- und Strukturdaten

Strukturdaten
Metadata
Erfassen der Metadaten (Autor und
Titelinformation)
Title
Author
15
  • Meta- und Strukturdaten

Strukturdaten
Metadata
Erfassen der Metadaten (Autor und
Titelinformation)
OCR der Inhaltsverzeichnisse
Funktioniert nicht bei schlechter Druckqualität
oder Frakturschrift
16
  • Meta- und Strukturdaten

Metadatenübernahme
Katalogmetadaten
Übernahme der Metadaten aus dem OPAC
Download mit WiniBW
Java-Programm zum mergen der Katalogdaten mit den
XML-Daten
17
  • Meta- und Strukturdaten

Erfassung nach dem Scannen
Images werden zur Metadatenerfassung genutzt
AGORA XML-Editor
Keine Konvertierung notwendig
18
  • Meta- und Strukturdaten

AGORA Editor
19
  • Meta- und Strukturdaten

docWorks
Software des METAe-projekts
derzeit im Testeinsatz
automatische Generierung der Struktur- und
Metadaten...
20
  • Volltext

Im TEI/XML Format (mit Wortkoordinaten möglich)
Manuelle Erfassung (Dienstleister)
Automatische Generierung mit AGORA Konverter
(unkorrigierter OCR-Text) mit docWorks
(während Meta- und Strukturdatenerfassung
derzeit noch kein TEI/XML)
21
  • Management

Dokumentenmanagement System
Ein System für alle Projekte
Erweiterung/Updates stehen für alle Projekte zur
Verfügung
Einfache Pflege und Administration
Import
Batch-Import der Meta- und Strukturdaten mit den
Images
Volltexte (TEI/XML) können separat importiert
werden
22
  • Dokumenten-Management

AGORA
Java-Servlet
Meta-, Strukturdaten und Volltexte in
relationaler Datenbank
Imagedaten im Dateisystem
Verity-Engine zur Volltextindexierung
Kooperation mit Satz-Rechen-Zentrum
23
  • Dokumenten-Management

Administration
24
  • Dokumenten-Management

Administration
Derzeit Windows basiert Web-basierte
Administrationsoberfläche in Entwicklung
25
  • Dokumenten-Management

Web-Präsentation
WebMacro Templates
Auch XML-Ausgabe realisierbar
Cache-Verwaltung (von HTML-Seiten)
Als JAVA-Servlet realisiert
26
  • Dokumenten-Management

Web- Präsentation
27

http//gdz.sub.uni-goettingen.de
Write a Comment
User Comments (0)
About PowerShow.com