Title: HAL
1 Les archives ouvertes LArchive HAL
daniel.charnay_at_ccsd.cnrs.fr
2De quoi parle-t-on ?
- Mettre à disposition librement toute la
littérature scientifique - En texte intégral
- (Notices bibliographiques ? )
- Type de littérature
- Publications dans des revues avec ou sans comité
de lecture - Actes de congrès, séminaires,
- Livres, chapitres de livre, ouvrages,
- Brevets
- Thèses, mémoires
- Etc.
- Avec les documents multi médias associés le cas
échéant
3Phrases clés, mots clés
- Libre accès aux résultats de la recherche
- Gratuité
- Accessibilité
- Publications électroniques E-print (preprint
postprint) - Communication scientifique directe (CSD)
- Un circuit court entre les chercheurs pour faire
connaître leur résultats (et prendre date pour
leur recherche) - Auto archivage
- Les chercheurs déposent eux-mêmes leurs articles
sur des bases ouvertes - Interopérabilité
- On met en uvre des moyens pour tenter
linterconnexion des bases darticles
scientifiques
4Définition de larchive ouverte
- Libre accès pour le dépôt
- Identification légère du contributeur
- Niveau scientifique requis, mais pas dévaluation
- Document sous forme numérique dans un format
accessible - Libre accès pour la consultation
- Depuis Internet, sans aucune restriction
- Pré-publications
- Ensemble des versions de larticle dont la
dernière est habituellement celle acceptée par la
revue - Éventuellement article non soumis pour
publication - Post-publication
- Pré-publication à laquelle on a ajouté les
références de publication - Publication dans la forme ultime soumise et
acceptée par la revue
5Les souhaits du chercheur
Des résultats plus visibles sont des résultats
plus cités
- Communiquer rapidement son travail scientifique,
prendre date pour ses travaux - Avoir accès immédiatement à toute lactualité
scientifique depuis un seul portail - Bénéficier dalertes automatiques dans les
domaines scientifiques de son choix - Pouvoir se constituer des collections
scientifiques personnalisées - Conserver les journaux traditionnels et
lévaluation par les pairs - Au passage, se simplifier les tâches
administratives listes de publications, rapports
dactivité, candidatures à des postes, etc.. - Un seul dépôt
6Les laboratoires, les établissements, souhaitent
- Suivre ce qui se fait sur le plan scientifique
dans leurs établissements et exposer leurs
production scientifique. - Communiquer commodément aux collègues étrangers
les mémoires de thèse - Eviter à des secrétariats surchargés de multiples
saisies - Obtenir automatiquement des listes de
publications pour les contrats quadriennaux, les
rapports à un ou deux ans, etc.. - Un laboratoire a souvent beaucoup
détablissements de rattachement (Université,
EPST, grande école, etc.)
7Les archives ouvertes pour linstitution
- La réussite de larchive passe par un compromis
satisfaisant à la fois les chercheurs mais aussi
les institutions - Une archive ne devrait pas être spécifiquement
institutionnelle, mais ... - Lincitation au dépôt doit être institutionnelle
- Les méta données recueillies sont suffisantes
pour ... - Disposer dune vue institutionnelle
- Mesurer la production
- Aider à lévaluation des chercheurs
- Etc.
- Larchive reste ouverte
- A tous les chercheurs quelque soit leur pays ou
leur institution - Larchive reste un instrument scientifique
8Types darchive
- Si, lors dun dépôt ou ultérieurement, on
collecte - Un classement thématique de larticle déposé
- Des informations spécifiques
- Appartenance à un congrès, une revue
électronique, etc. - Une information exhaustive sur les auteurs
- Affiliations (établissement, université, école,
laboratoire, équipe,) - Alors larchive ouverte pourra proposer des vues
- Thématiques ou disciplinaires
- Des collections de journaux, dactes de congrès,
- Institutionnelles à différents niveaux
- Travaux de léquipe xxx
- Publications de luniversité yyy ou de
létablissement zzz
9Recueillir des publications et leurs méta données
- Lacteur principal du système est le chercheur
- Il détient la version électronique de sa
publication - Il est le seul à pouvoir donner un certain nombre
dinformations sur sa publication - Résumé, mots clés, classification,
- Le chercheur
- Nest pas motivé pour remplir de fastidieux
formulaires de méta données - Le choix de méta données restera donc le plus
concis possible et le maximum dinformations sera
issu de listes dautorités - Reste à convaincre de lopportunité de déposer
dans une archive ouverte - Les professionnels de la documentation
- Doivent accompagner le chercheur dans cette
démarche - Aider au dépôt et au besoin intervenir sur les
méta données - Etre soutenus par linstitution, le laboratoire,
10Les devoirs de linstitution
- Si linstitution met en place une archive, elle
doit veiller - A ce que le dépôt darticles, assorti des
références bibliographiques, ne soit demandé
quune seule fois au chercheur - Tout document administratif nécessitant un liste
de publication salimentera automatiquement dans
cette archive - La demande de dépôt doit apparaître
essentiellement comme un acte scientifique - Le chercheur doit ressentir larchive comme un
moyen daccès aux travaux de ses collègues - Linstitution doit se préoccuper
- De larchivage à long terme des documents qui lui
sont confiés - De la disponibilité de larchive et de sa
sécurité - De lindépendance de lopérateur vis-à-vis des
déposants - Horodatage, validation, qualité des dépôts
11ArXiv, le modèle depuis plus de 10 ans
- Initiative de Paul Ginsparg à Los Alamos (xxx)
- 4 000 manuscrits déposés par mois
- 500 000 manuscrits déposés à ce jour
- 300 000 consultations journalières
- Des sites miroirs dans le monde entier
Australie, Brésil, Chine, Allemagne, Inde,
Israël Italie, Japon, Russie, Afrique du Sud,
France Corée du Sud, Espagne, Taiwan, Angleterre,
12Les missions du CCSD
- Une initiative pour des archives scientifiques
ouvertes - Une approche internationale
- Ne pas construire une archive nationale, mais
sintégrer dans le mouvement open archives - Une approche essentiellement chercheur
- Des archives alimentées directement par les
chercheurs avec, comme vocation première, la
réalisation dun outil scientifique offrant
laccès au document intégral - Un outil administratif indirect grâce à la
collecte au passage de méta données
suffisantes - Une mission darchivage à long terme
Un accord cadre est en cours de finalisation
entre les EPST françaises (INRIA, INSERM, INRA,
IRD, etc. et la CPU, la CGE
13Sur une plate-forme unique URLS
- HAL
- http//hal.ccsd.cnrs.fr
- http//tel.ccsd.cnrs.fr
- http//halshs.ccsd.cnrs.fr
- http//democrite.in2p3.fr
- http//archive-edutice.ccsd.cnrs.fr
- http//hal.inria.fr/
- http//hal-inserm.ccsd.cnrs.fr/
- http//artxiker.ccsd.cnrs.fr/
- http//etol.ccsd.cnrs.fr
- http//cel.ccsd.cnrs.fr
- http//nicod.in2p3.fr/
- http//asic.ccsd.cnrs.fr/
- http//hal-ens-lyon.ccsd.cnrs.fr/
- Etc.
14 Larchive ouverte HAL Statistiques 2005
15Répartition par domaines scientifiques des
dépôts avec texte intégral en 2005
16Nombre de dépôts en texte intégral sur
lensemble de larchive
17Nombre de dépôts en texte intégral sur HAL-SHS
18Nombre de dépôts en texte intégral sur
Démocrite_at_HAL (IN2P3)
Une partie des données provient de lancienne
application Démocrite
19Nombre de dépôts en texte intégral sur le serveur
de thèses en lignes TEL.
20Nombre de dépôts en texte intégral surlarchive
Edutice
21Dépôts en texte intégral sur HAL-INRIA
22Ensemble des dépôts, texte intégral et notices
sur lensemble de larchive
23http//www.ccsd.cnrs.fr
Questions ?
Daniel.charnay_at_ccsd.cnrs.fr
24Structure de HAL
25Les objectifs recherchés 1
- Archive multidisciplinaire orientée texte
intégral - Une seule base de données pour lensemble des
disciplines - Dépôt du texte intégral mais aussi de notices et
de rétro dépôts - Orientée chercheurs
- Autoarchivage, mais possibilité denrichissement
des méta données par des professionnels - Centralisée mais
- Multi interfaces
- Préservation de lidentité
- Méta données variables au-delà de la DTD
minimum - Environnements de dépôt et de consultation
personnalisés - Tampons
- Internationale
- Interconnectée avec les autres systèmes de
références - ArXiv en physique / mathématiques / informatique
/ biologie / - PubMed Central en médecine et biologie (2006)
26Les objectifs recherchés 2
- Mesurabilité de la production scientifique
- Des laboratoires, des institutions et plus
globalement, de toutes les tutelles - À disposition des déposants mais aussi des
institutions - Génération des listes de publications dans tous
formats - (XML, TeX, DOC/RTF, PDF, )
- Transferts vers les bases administratives
- Alimentation de CRAC (fiche chercheur CNRS)
- Alimentation de Labintel publications
- Pérennité
- Archivage à long terme
- Stabilité des URLs
27OAI
EXPORTS IMPORTS
haL
Texte intégral
Notice bibliographique
28OAI
EXPORTS IMPORTS
haL
29OAI
EXPORTS IMPORTS
haL
302005
OAI
EXPORTS IMPORTS
haL
Texte intégral
Notice bibliographique
31Dépôt
- Simplification
- 4 étapes
- Méta données
- Auteurs, laboratoires, tutelles et association
- téléchargement du document
- Récapitulation contrôle, dépôt
- Retour en arrière possible
auteurs
métadonnées
récapitulation
fichiers
32Dépôt
- Choix des étapes
- Lordre des étapes peut être paramétré au niveau
dune interface particulière - Par exemple, on peut décider de commencer par le
téléchargement du fichier, afin den extraire
automatiquement - La liste dauteurs
- Le résumé
- Les références bibliographiques
- Etc.
- Ces possibles automatismes dépendent fortement du
niveau de structuration du document source, (donc
de la discipline ?)
33http//ccsd.cnrs.fr
Questions ?
Daniel.Charnay_at_in2p3.fr