Title: Panorama de la edicin digital
1Panorama de la edición digital
- Joseba Abaitua (DELi)
- Jornada La profesión del filólogo
- en la sociedad de la información
- Facultad de Filosofía y Letras
- Universidad de Deusto
- 17 de noviembre de 2003
2Índice
- Libro impreso vs. electrónico
- Qué es digitalizar?
- Ejemplos archivos digitales
- Anotaciones y metadatos XML
- Formato vs. contenido
- Proyectos de biblioteca digital, web semántica,
sindicación de contenidos.
3Libro impreso vs. libro electrónico
4Libro impreso vs. medio electrónico
- Facilidad de uso (ergonomía del papel)
- Transportabilidad
- Disposición tabular del texto
- Lectura
- Ocio, estudio
- Objeto (con valor patrimonial)
- Limitaciones de la pantalla
- Ubicuidad
- Hipertextualidad
- Consulta, navegación
- Investigación, información
- Instrumento, herramienta
5Información, datos cuantitativos
- Cada año se recopila ½ millón de nuevas
bibliotecas (del tamaño de la B. del Congreso) - 5 'exabytes' ? 5 millones de 'terabytes
- 1 'terabyte' ? 1 millón de 'megabytes',
aproximadamente el texto que contienen un millón
de libros (5 billones de libros) - El 92 de toda esta información se almacenó en
medios magnéticos, sobre todo discos duros. - http//cibernauta.elcorreodigital.com/ciberactual/
- Peter Lyman y Hal Varian, Universidad de Berkeley
(California),
6Internet
- 600 millones de personas tienen acceso
- En 2000, entre 20 y 50 'terabytes' de información
- En verano de 2003, 167 'terabytes', sólo de
páginas fijas (167 millones de libros / 5
billones). - El volumen de información que circula por la red
se ha triplicado en menos de dos años. - http//cibernauta.elcorreodigital.com/ciberactual
/
7Consumo de papel
- Crecimiento 36 en el último trienio.
- Son necesarios 786 millones de árboles para
generar el papel que consume el mundo en un año
(según UNESCO). - Un árbol viene a producir unas 80.500 hojas
- Cada habitante de la tierra consume 1.510 hojas
al año (en EEUU 11.916 hojas por hab./año. Europa
7.280). - La mitad de todo ese volumen de papel se emplea
en impresoras y fotocopiadoras de oficina. - http//cibernauta.elcorreodigital.com/ciberactual/
- Papel lujo no sostenible
8(No Transcript)
9Libro impreso vs. medio electrónico
- Facilidad de uso (ergonomía del papel)
- Transportabilidad
- Disposición tabular del texto
- Lectura
- Ocio, estudio
- Objeto (con valor patrimonial)
- Limitaciones de la pantalla
- Ubicuidad
- Hipertextualidad
- Consulta, navegación
- Investigación, información
- Instrumento, herramienta
10Funciones papel vs. soporte digital
- Lujo
- Lectura
- Ocio, estudio
- Objeto (con valor patrimonial)
- Estático queda fijado
- Pasivo no interviene en los procesos cognitivos
- Práctico y económico
- Consulta, navegación
- Investigación, información
- Instrumento, herramienta
- Dinámico actualiza y adapta al perfil del lector
- Inteligente procesa, elabora, selecciona,
traduce, etc.
11Digitalización del papel
- Qué se entiende por digitalizar?
- escanear (convertir a JPEG)?
- informatizar (poner en base de datos)?
- transcribir a texto ASCII (OCR)?
- publicar en Internet (HTML)?
- etiquetar, anotar, añadir metadatos (XML)?
12Digitalización del papel
- Qué se entiende por digitalizar?
- escanear (convertir a JPEG)? sí
- informatizar (poner en base de datos)? sí
- transcribir a texto ASCII (OCR)? sí
- publicar en Internet (HTML)? sí, pero sobre todo
etiquetar, anotar, añadir metadatos (XML)
13(No Transcript)
14(No Transcript)
15(No Transcript)
16(No Transcript)
17(No Transcript)
18(No Transcript)
19Variantes de traducción de OTELO
20(No Transcript)
21Datos bibliográficos formato (ej. Word) vs. HTML
- Robert-Alain de Beaugrande Wolfgang Ulrich
Dressler. 1981. Introduction to Text Linguistics.
Longman. - Vijay K. Bhatia. 1993. Analysing Genre. Language
use in professional settings. Longman. - Douglas Biber. 1989. A Typology of English Texts.
Linguistics 27 3-43. - Douglas Biber y Edward Finegan. 1986. An initial
typology of English text types. Jan Aarts y
Willen Meijs (Eds.) Corpus Linguistics II New
Studies in the Analysis and Exploitation of
Computer Corpora. Rodopi 19-46.
- ltPgtRobert-Alain de Beaugrande amp Wolfgang
Ulrich Dressler. 1981.ltIgt - Introduction to Text Linguisticslt/Igt.
Longman.lt/Pgt - ltPgtltA HREF"http//www.cityu.edu.hk/en/staff/"gtVij
ay K. Bhatialt/Agt. 1993. - ltIgtAnalysing Genre. Language use in professional
settingslt/Igt. Longman.lt/Pgt - ltPgtltA HREF"http//www.nau.edu/english/ling/facult
y/biber.html" - CLASS"inter"gtDouglas Biberlt/Agt. 1989. A Typology
of English Texts. - ltIgtLinguisticslt/Igt 27 3-43.lt/Pgt
22Datos bibliográficos HTML vs. BibTeX
- _at_BOOKBhatia93, author Bhatia, Vija, title
Analysing Genre. Language use in professional
settings, publisher Longman, year 1993,
url http//www.cityu.edu.hk/en/staff - _at_ARTICLEBiber89, author Biber, Douglas,
title Typology of English Texts, journal
Linguistics, year 1989, number 27,
pages 3-43, url http//www.nau.edu/english/
ling/faculty/biber.html
- ltPgtltA HREF"http//www.cityu.edu.hk/en/staff/"gtVij
ay K. Bhatialt/Agt. 1993. - ltIgtAnalysing Genre. Language use in professional
settingslt/Igt. Longman.lt/Pgt - ltPgtltA HREF"http//www.nau.edu/english/ling/facult
y/biber.html" - CLASS"inter"gtDouglas Biberlt/Agt. 1989. A Typology
of English Texts. - ltIgtLinguisticslt/Igt 27 3-43.lt/Pgt
23Datos bibliográficos BibTeX vs. BibTeXML
- _at_ARTICLEBiber89,
- author Biber, Douglas,
- title Typology of English Texts,
- journal Linguistics,
- year 1989,
- number 27,
- pages 3-43,
- url http//www.nau.edu/english/ling/faculty/bib
er -
- ltbibtexentry bibtexidBiber89"gt
- ltbibtexarticlegt
- ltbibtexauthorgtBiber, Douglas
lt/bibtexauthorgt - ltbibtextitlegt Typology of English Texts
- lt/bibtextitlegt
- ltbibtexjournalgt Linguistics
lt/bibtexjournalgt - ltbibtexyeargt1989lt/bibtexyeargt
- ltbibtexnumbergt27lt/bibtexvolumegt
- ltbibtexpagesgt3-43lt/bibtexpagesgt
- ltbibtexurlgt http//www.nau.edu/english/ling/f
aculty/biber lt/bibtexurlgt - lt/bibtexarticlegt
- lt/bibtexentrygt
24Conclusión para alumnos formato (ej. Word) vs.
XML
- Robert-Alain de Beaugrande Wolfgang Ulrich
Dressler. 1981. Introduction to Text Linguistics.
Longman. - Vijay K. Bhatia. 1993. Analysing Genre. Language
use in professional settings. Longman. - Douglas Biber. 1989. A Typology of English Texts.
Linguistics 27 3-43. - Douglas Biber y Edward Finegan. 1986. An initial
typology of English text types. Jan Aarts y
Willen Meijs (Eds.) Corpus Linguistics II New
Studies in the Analysis and Exploitation of
Computer Corpora. Rodopi 19-46.
- ltbibtexentry bibtexidBiber89"gt
- ltbibtexarticlegt
- ltbibtexauthorgtBiber, Douglas
lt/bibtexauthorgt - ltbibtextitlegt Typology of English Texts
- lt/bibtextitlegt
- ltbibtexjournalgt Linguistics
lt/bibtexjournalgt - ltbibtexyeargt1989lt/bibtexyeargt
- ltbibtexnumbergt27lt/bibtexvolumegt
- ltbibtexpagesgt3-43lt/bibtexpagesgt
- ltbibtexurlgt http//www.nau.edu/english/ling/f
aculty/biber lt/bibtexurlgt - lt/bibtexarticlegt
- lt/bibtexentrygt
25Futuro XMLEjemplo de noticia en RDF/XML
- ltitem rdfabout"http//www.sustatu.com/RV_Events/
zzrv1066043383"gt - lttitlegtUnai Elorriaga idazlea Tolosanlt/titlegt
- ltlinkgthttp//www.sustatu.com/RV_Events/zzrv106
6043383lt/linkgt - ltevtypegthitzaldialt/evtypegt
- ltevorganizergtGaltzaundi euskara
elkartealt/evorganizergt - ltevlocationgtTolosa, Kultur etxeko
aretoalt/evlocationgt - ltevstartdategt2003-10-16lt/evstartdategt
- ltevenddategt2003-10-16lt/evenddategt
- ltevsubjectgtliteraturalt/evsubjectgt
- lt/itemgt
26Metadatos internet, archivos, bibliotecas
- Dublin Core Metadata Initiative (DCMI)
http//dublincore.org/ - Web semántica http//www.semanticweb.org
- Digital Library Testbed Metadata
http//dli.grainger.uiuc.edu/ - Open Archives Initiative - Protocol for Metadata
Harvesting (OAI-PMH) http//www.openarchives.or
g/OAI/2.0/openarchivesprotocol.htm - Open Content Syndication (OCS)
http//internetalchemy.org/ocs/
27Open Citation Project
- OpCit funded by the Joint NSF - JISC
International Digital Libraries Research
Programme - Develop products and services that support the
Open Archives Initiative (OAI) - http//opcit.eprints.org/
- Citebase
- http//citebase.eprints.org/
- Similar a Citeseer
- http//citeseer.nj.nec.com/
28(No Transcript)
29(No Transcript)
30Conclusiones
- Funciones distintas libro impreso vs.
electrónico - Digitalizar anotaciones y metadatos
- Formato vs. contenido
- Proyectos de biblioteca digital, web semántica,
sindicación de contenidos - Presente y futuro OAI, OCS, RDF