Title: Le dpt lgal de lInternet
1Le dépôt légal de lInternet
- Clément Oury
- Service du dépôt légal numérique, Bibliothèque
nationale de France - clement(point)oury(at)bnf(point)fr
- Colloque patrimoine, numérisation et accès aux
savoirs - Bordeaux, 22 octobre 2009
2Pourquoi un DL de lInternet ?
?
- Parce que lInternet est devenu lun des
principaux supports de diffusion et dexpression
de la société française - Pour assurer la continuité des collections
- Parce que cest une mission confiée à la BnF par
la loi
3Le DL de lInternet enjeux juridiques,
techniques et scientifiques
4Dans la continuité du dépôt légal
- 1537Â les livres
- 1648Â les estampes, cartes et plans
- 1793Â les partitions musicales
- 1925Â les photographies, arts graphiques de
toute nature - 1938 les phonogrammes
- 1941Â les affiches
- 1975 les vidéogrammes et les documents
multimédias - 1977 les uvres cinématographiques
- 1992Â les documents audiovisuels de la radio
télévision, lédition électronique sur support
(progiciels, bases de données, systèmes experts). - 2006 (la Dadvsi) LInternet
5Le DL de lInternet dans la DADVSI
- Le titre IV de la loi DADVSI votée le 1er août
2006 prévoit lextension du dépôt légal à tous
les signes, signaux, écrits, sons ou messages de
toute nature qui font lobjet dune communication
au public par voie électronique . Les sanctions
pénales pour non respect de cette obligation
nentreront toutefois pas en vigueur avant un
délai de 3 ans. Un décret dapplication viendra
préciser les conditions de sélection et de
consultation des informations collectées. - LInstitut national de lAudiovisuel collectera
les sites du domaine de la communication
audiovisuelle (en particulier ceux de la radio et
de la télévision) et la Bibliothèque nationale de
France tous les autres. - Lobligation de dépôt légal pèse sur les
personnes qui éditent et produisent des sites
Internet sur le territoire français.
Contrairement à ce qui est pratiqué pour les
autres supports, elle nimplique pas de démarche
particulière de leur part - La seule obligation qui incombe aux producteurs
est de fournir les codes et les informations
techniques susceptibles de faciliter larchivage
de leurs sites en cas de difficulté - Le décret devrait autoriser la consultation des
archives de la Toile par des chercheurs dûment
accrédité, dans les seules emprises de la BnF
(salles de recherche), comme pour les autres
collections issues du dépôt légal.
6Une affaire de moissonnage
- Logiciel appelé robot de collecte,
 moissonneur ou  aspirateur de sites - Part d'une liste d'adresses URL  grainesÂ
- Extrait les liens dans le code des pages, les
suit comme un internaute automatique - Copie les éléments quil trouve et qui font
partie du périmètre de la collecte
7Le modèle intégré principes
- Des collectes annuelles à grande échelle
(instantanés), réalisées principalement sur le
.fr, en partenariat avec la fondation Internet
Archive - Des collectes ciblées (courantes ou projets)
pilotées par des bibliothécaires, internalisées
en 2007 - Des dépôts numériques à lunité, organisés avec
les producteurs, dans des cas exceptionnels
-
8Le modèle intégré schéma
NOMBRE DE SITES
PROFONDEUR
Collectes larges
Collectes ciblées
Dépôts
9Le circuit du document
Sélection
Préservation
Accès
Collecte
10Les collections constituées
- Cinq collectes larges du domaine national
français réalisées par Internet Archive une fois
lan de 2004 à 2008 - Des acquisitions rétrospectives 1996-2005
également livrées par Internet Archive - Des collectes ciblées, réalisées en interne par
la BnF collectes électorales, journaux
intimes, développement durableet toutes les
collectes courantes - État des collections début 2009
- 13 milliards de fichiers
- 156 Téraoctets de données
- Objectif dinternalisation complète à la fin de
lannée
11Laccès aux archives
12(No Transcript)
13(No Transcript)
14Capture du site arpel.aquitaine.fr, 3 avril 2004
15(No Transcript)
16(No Transcript)
17Archivage numérique et territoire
18Capture du site www.bordeaux.fr, 4 décembre 2008
19Capture du site contributions.aquitaine.fr, 4 mai
2009
20La collecte des sites électoraux
21Pourquoi les sites électoraux ?
- Un temps fort de la vie politique à léchelle de
la nation et des régions - Un enjeu de continuité des collections
- Des sites très volatils
- Un projet limité dans le temps qui permet de
mobiliser les équipes
22Calendrier du projet
- Octobre-décembre 2006 archivage de la
 pré-campagne - Janvier-mai 2007 archivage des sites de
lélection présidentielle - Janvier 2007 appel à candidature envoyé aux
BDLI - Avril-juillet 2007 archivage des sites des
élections législatives
23Chiffres-clefs
- 39 agents impliqués (dont 15 au sein des BDLI)
- 5 813 sites collectés
- 64 millions de fichiers
- 3.4 téraoctets de données
24Le maillage régional