Title: Pr
1Ministère de lEducation NationaleSous-direction
des bibliothèques et de la documentation
Etude de la mise en œuvre du dispositif national
de diffusion des thèses par voie électronique
dans les Etablissements denseignement supérieur
et de recherche Bilan de lexistant
2Sommaire
- 1 - Synthèse de lenquête
- 2 Circuits, chaînes et autres projets
- 3 - Diagnostics et pistes proposées
31 Synthèse de lenquête
- Les travaux effectués
- Niveau de mise en œuvre du dispositif
- Actions entreprises pour faciliter la mise en
œuvre - Difficultés rencontrées
- Préconisations des établissements
41-1 Les travaux effectués
- 13 visites et entretiens ABES, ANRT Lille
Lille 2, CCSD (CNRS), CINES, Clermont, Compiègne,
INSA Lyon, Lille 1, Limoges, Lyon 2,
Marne-la-Vallée, Pastel (GE) - Les comptes rendus validés sont disponibles et
seront annexés à létude - Nos études en cours (exemple avec Caen, Paris
6, Paris 7, Orléans) ont également évidemment
alimenté nos réflexions. - Un dépouillement (pour linstant) de 53
questionnaires SCD - A venir un dépouillement de 8 enquêtes grandes
écoles
51-2 Niveau de mise en œuvre
- 53 établissements ont répondu (sur près de 100 au
total ?) fin avril. Des réponses arrivent encore
suite à relance (mise à jour en fin détude). - Quelques chiffres supplémentaires ont été glanés
lors des visites (Lyon 2, Lille 3) - Chiffres clés
- 886 thèses ont été déposées sous forme
électronique depuis 1, 2 ou 3 ans par rapport à
un volume annuel de 5.922 thèses soutenues dans
les établissements étudiés (11.000 thèses
soutenues en France par an au total) - 645 thèses (environ!) sont accessibles en ligne
(soit 11 du volume annuel de thèses soutenues
dans les établissements étudiés). Ce chiffre
inclut - Lyon 2 (261 thèses dans SDX chiffres obtenus
lors de la visite), - lUMLV (41 thèses dans Pelleas)
- Mais aussi
- Lille 1 (150 thèses PDF dans Grisemine)
- Nantes (102 thèses PDF)
- Finalement, le nombre de thèses diffusées suite à
structuration XML est de 360 environ. - Une dizaine détablissements à forte dominante
scientifique ont aujourdhui 1000 thèses
diffusées par le CCSD (en particulier Grenoble 1
600, Lyon 1 140, Paris 11 160)
61-2 Niveau de mise en œuvre
- 15 établissements ont mis en place le dispositif
Clermont, Lille 1, Limoges, Lyon 2, Lyon3,
Nantes, Paris 10, Paris 11, Paris 12, St Etienne,
Strasbourg 1, UMLV, UTC, UTT. Au moins Lille 3 à
rajouter (hors enquête) - Par ailleurs
- 6 établissements sont en cours de lancement (en
2004) - 13 prévoient un lancement à partir de 2005 (au
plus tôt) - 19 ne prévoient rien pour linstant.
- Les mises en œuvre concernent
- Des établissements de taille variable
- Disposant dune équipe de 0,5 à 4,5 ETP ayant des
compétences biblio et informatiques. - Avec des modes de dépôt et de traitement
différents - Des thèses Word en sciences molles , souvent
dans des établissements pluridisciplinaires - 3 établissements (Paris 11, UTT, Lyon 3) ont
déposé des thèses non encore traitées /
diffusées.
71-2 Niveau de mise en œuvre
- Qui fait quoi ?
- En général, le SCD a un rôle pilote formation,
traitement, signalement, stockage, diffusion - Aidé par le CRI pour les aspects techniques
stockage, hébergement et maintenance des serveurs - Les Ecoles Doctorales informent et sensibilisent
les doctorants et peuvent participer à la
formation - Les Centres de Télé-enseignement sont rarement
sollicités, de même que les Presses
Universitaires - Le mode de dépôt est
- Toujours mixte (papier électronique) sauf à La
Réunion (électronique seulement) - Volontaire dans 50 des cas
- En prévision, à 70 obligatoire
- Le dépôt est fait 32 avant soutenance, 48
après, 20 avant et après.
81-2 Niveau de mise en œuvre
- Chaîne(s) de traitement utilisées
91-2 Niveau de mise en œuvre
- La gestion automatisée des dépôts (workflow)
- est mise en place dans 3 établissements
Compiègne, Lyon 2, St Etienne - est prévue dans 6 autres Lille 1, Besançon,
Dijon, Paris 10, Paris 11, Reims - Outils de diffusion utilisés
- Le Site WEB, peu de Portails Locaux (Pelleas,
Grisemine), SDX. - Archivage électronique
- Généralement prévu ou déjà mis en œuvre
- Assuré majoritairement par le SCD (9
établissements) puis par le CINES (4
établissements) et le CRI (3 établissements) - II est cependant à noter quà ce jour le CINES
nhéberge aucune thèse autre que celles stockées
sur le serveur SPARTE
101-3 Actions entreprises pour faciliter le
dispositif
- Information et sensibilisation
- Plus de la moitié des établissements ont
entrepris des actions dinformation - Surtout au travers des ED, lors des rentrées
- Formation des doctorants
- Les mêmes établissements ont également mis en
place des modules de formation incluant les
problématiques de stylage et de rédaction de
documents structurés - Égalité entre formations obligatoires et
volontaires
111-3 Actions entreprises pour faciliter le
dispositif
- Mise à disposition de postes et de licences
- Généralement, celles déjà disponibles dans
létablissement - Parfois, des postes sont réservés aux doctorants
- Mise à disposition de modèles de documents
- Le modèle Word est diffusé dans 20
établissements - Une feuille de style pour LateX est en cours de
contrôle à lUMLV
121-4 Difficultés rencontrées
- Statistiquement
- 3 causes principalement mentionnées
- Linsuffisance de communication
- La difficulté dorganisation du circuit
- La faible motivation des acteurs qui découle des
deux premiers facteurs - 2 autres causes importantes signalées
- Le déficit de formation des doctorants
- Les difficultés techniques et les compétences
informatiques à mettre en oeuvre
131-4 Difficultés rencontrées
- Faible communication sur le projet
- Critique majeure formulée par une majorité
détablissements - Attentes fortes dexplications sur les objectifs
du projet, les procédures à suivre, les
recommandations - Pour pouvoir mieux convaincre et mobiliser les
nombreux acteurs impliqués - Organisation difficile du circuit
- Critique la plus fréquente, en raison
- du nombre et de la variété dacteurs impliqués
- de la difficulté technique du processus et de
létat inachevé des chaînes de traitement
disponibles à ce jour - des ressources humaines nécessaires et souvent
non disponibles
141-4 Difficultés rencontrées
- Faible motivation des acteurs
- Critique fréquente et jugée grave
- Découle des problèmes dinformation et de mise en
œuvre du processus mais aussi de la hiérarchie
"molle" des universités - Lintérêt dune publication en ligne (vs
publication darticle) nest pas acquis par tous
les doctorants, malgré une sensibilisation
croissante. - Déficit de formation des doctorants
- Déficit notable de savoir-faire des doctorants en
matière de stylage des documents - Mais en amélioration sensible grâce aux
formations entreprises - Le problème de la charge de formation subsiste
au début du processus mais aussi après.
151-4 Difficultés rencontrées
- Moyens techniques et compétences informatiques
- Inadéquation des chaînes de traitement aux thèses
scientifiques (LateX) - Chaînes de traitement insuffisamment finalisées
- Difficultés dinstallation
- Durée du traitement dune thèse moyenne souvent
rapportée de 2 à 3 jours - Ressources humaines insuffisantes dans les
établissements produisant beaucoup de thèses - Difficultés diverses
- Problèmes juridiques concernant le droit de
diffusion des images, photos, textes inclus dans
les thèses
161-5 Préconisations des établissements
- Évidemment faire plus et mieux
- plus de formation du doctorant,
- plus de formation des agents,
- plus de communication,
- chaînes mieux éprouvées et plus complètes,
- plus d'outils et de postes...
171-5 Préconisations des établissements
- Mais aussi...
- rendre les formations obligatoires (au minimum
contrôler le niveau de savoir-faire) - imprimer la thèse pour le doctorant (si elle est
structurée et... s'il n'y en a pas trop !) - désigner un pilote du processus dans l'Université
- disposer au niveau national d'un bon support
(hotline, équipe volante) - communiquer en "top down" directeurs de thèses,
de labos, - assouplir les conditions de mise en ligne
(PDF...) - simplifier le circuit de dépôt
- arriver à la "masse critique" !
18Sommaire
- 1 - Synthèse de lenquête
- 2 Circuits, chaînes et autres projets
- 3 - Diagnostics et pistes proposées
192-1 Les circuits de dépôt2.1.1 Le circuit type
(?) du dépôt mixte
- Ce circuit est soumis à de nombreuses variantes
Impression à la demande Base de thèses en ligne ?
ANRT
Paris X (thèses en cours)
6. Envoi Formulaire 1 ex. pour
microformes Envoi Microforme
5. Envoi Formulaire 3 ex. Thèse papier
version électronique auteur
2. Dépôt Formulaire Thèse papier électronique
Scolarité ED
SCD
ABES
Portail Catalogue SUDOC
7. Catalogage SUDOC
Doctorant
1 ou 2 dépôts
4. Validation de la thèse
8. Thèse version électronique
11. Archivage
3. Envoi de la Thèse Soutenance
Jury ED
Acteur SCD ou cellule spécifique
Ressources Traitement
CINES
1. Information Formation
10. Publication WEB GED
9. Thèse version électronique diffusion
archivage
Site WEB Portail / GED
CCSD (CNRS)
Ressources formation
Ressources Impression
Impressions De la thèse
Thèses PDF
CRI
Pastel (GE)
Acteur ED ou cellule de traitement
Acteur très variable
202-1 Les circuits de dépôt2.2.2 Diagnostic
- De multiples éditions de la thèse avec une réelle
difficulté à définir ce quest la thèse
officielle - Le dépôt électronique de la thèse avant
soutenance garantit au moins un dépôt avant que
le docteur ne s'éloigne de l'université mais
nest pas utile pour le traitement car des
modifications sont souvent / parfois demandées - La thèse validée par le jury est la thèse papier
la thèse électronique (au format auteur) au
mieux certifiée comme conforme par lauteur
cest-à-dire que la thèse issue des chaînes de
traitement en aval nest pas certifiée par le
jury (mais souvent simplement vérifiée par le
doctorant) - Cest pourquoi, 2 notices sont créées dans le
SUDOC (et donc dans le SIGB local) 1 pour la
thèse papier 1 pour la version de diffusion
issue de la chaîne de traitement - Perspectives
- Garantir la validation officielle de la thèse
électronique diffusée avec intégration des
corrections (NB exemple de Polytechnique qui
numérise la thèse papier !) - Garantir la conformité de la thèse électronique
diffusée avec la thèse papier finale - Aboutir ainsi à une seule notice ?
212-1 Les circuits de dépôt2.2.2 Diagnostic
- Le rôle moteur quassume aujourdhui un SCD en
matière daide à la rédaction structurée de la
thèse pose question dans le cadre de la
généralisation du dispositif - Il sagit clairement dun métier en tant que tel
(lédition électronique structurée) - Ce métier est nouveau pour les bibliothèques
les compétences à acquérir restent difficiles
avec des moyens actuels insuffisants (en
formation, en information) - L adéquation actuelle entre la charge et les
ressources de traitement est rarement
satisfaisante (1 ETP traite au mieux 70 à 100
thèses bien stylées par an). - Cette compétence est également certainement
nécessaire pour dautres productions de
lUniversité (Presses Universitaires, Articles de
chercheurs, documents pédagogiques,) - Perspectives
- Au minimum, mutualiser / organiser / renforcer
cette compétence au niveau de luniversité - A étudier lappui de lANRT ? lappui de
sociétés extérieures spécialisées dans lédition
structurée ?
222-1 Les circuits de dépôt2.2.2 Diagnostic
- La position des acteurs nationaux dans la chaîne
peut certainement être optimisée pour simplifier
le circuit - Utiliser les métadonnées, conformes à la
recommandation AFNOR, au format XML, saisies dans
un outil local ou dans SPARTE, pour alimenter
automatiquement le catalogue SUDOC - Pour les utilisateurs professionnels du SUDOC,
passer par lABES pour déposer la version
darchivage au CINES, que lon utilise SPARTE ou
non (possibilité de dépôt sans conversion) - Quelle est la version à archiver au CINES ? Quel
rôle peut prendre le CINES concernant larchivage
de la version de diffusion ? Jusquoù doit aller
la mission darchivage du CINES (garantir le
stockage et la lisibilité ?) - Le rôle de lANRT un appui mutualisé au
traitement des thèses pour les établissements qui
nen ont pas les moyens semble possible
232-1 Les circuits de dépôt2.2.2 Diagnostic
- Autres points
- Laide à limpression des thèses pour le
doctorant est assurée de manière variable la
généralisation de la prise en charge de
limpression des thèses par lUniversité est-elle
imaginable ? - Les aspects juridiques
- Finalement assez bien réglés pour le contenu
produit par le doctorant, mais pour les contenus
extérieurs copiés dans le document (articles de
revues, images), cela ne repose que sur une
déclaration du doctorant quil est difficile de
vérifier. - Un besoin général la restriction de la
diffusion en Intranet (à lorigine des réflexions
en 1999 la thèse devait être sur Internet ou pas)
il sagit dun besoin commun à beaucoup
détablissements, mais qui ne concernera quun
faible nombre de thèses à chaque fois.
242-2 Les chaînes de traitement
- Rappel de lhistorique des chaînes de traitement
2000-2001
CYBERTHESES Lyon 2 PUM Pivot SGML
2002 transfert sources
2002 redéveloppement
SPARTE CINES / ABES avec STILO Pivot XML TEI
Lite Licences OmniMark Non duplicable Utilisable
à distance
CYBERDOCS Lyon 2 avec AJLSM Pivot XML TEL
Lite Licence libre GPL Duplicable Utilisable en
local
2003 Mise en oeuvre
252-2 Les chaînes de traitementComparaison des
points sensibles
262-2 Les chaînes de traitementComparaison des
points sensibles
272-2 Les chaînes de traitementComparaison des
points sensibles
282-2 Les chaînes de traitementSPARTE vs.
CYBERDOCS
292- 2 Les chaînes de traitementComment faciliter
le dispositif ?
- Renforcer les dispositifs au niveau de chaque
chaîne pour résoudre effectivement les problèmes
résiduels - Renforcer la formation aux chaînes
- Renforcer lassistance utilisateurs
- Mutualiser sur un portail unique les
informations, documents, formations en ligne
communes aux 2 chaînes (cest lobjectif de
linitiative METATHESE) - Évidemment, poursuivre et renforcer les actions
de formation et de support aux doctorants pour
lutilisation de la feuille de style - La feuille de style pourrait faire lobjet de
quelques modifications, dans un but de
simplification
302-2 Les chaînes de traitementSPARTE ou
CYBERDOCS ?
- Une question de base que se posent les
établissements entre CYBERDOCS et SPARTE que
choisir ? - En effet, comme on la vu sur lanalyse des
macro-fonctionnalités, ces solutions deviennent
de plus en plus complètes et visent à gérer le SI
des thèses (workflow, métadonnées, conversion et
diffusion du doc.) - Ce que lon peut dire de manière certaine
- CYBERDOCS sadresse aux établissements qui ont
comme stratégie de simpliquer dans une
initiative Open Source (avec les moyens
informatiques associés) lassistance restera
mutualisée - SPARTE sadresse aux établissements qui
souhaitent un outil directement utilisable et
sans simpliquer sur sa maintenance
lassistance est centralisée
312-2 Les chaînes de traitement SPARTE ou
CYBERDOCS ?
- Ce qui nest pas encore clair
- Le nombre dutilisateurs et de thèses traitées
permet-il de dire que les chaînes ont été testées
et recettées ? - On peut connaître ce que font les chaînes, mais
on ne connaît pas ce quelles auraient dû faire
(spécifications initiales) ou ce quelles feront
(évolutions) - Les problèmes identifiés ne font pas lobjet dun
plan de correction formel, ce qui ne permet pas
de garantir à ce jour un fonctionnement parfait
des chaînes - Des orientations prises sur le circuit global
découleront de nouvelles exigences pour les
systèmes
322-2 Les chaînes de traitement SPARTE ou
CYBERDOCS ?
- Ces deux systèmes englobent deux sous-ensembles
fonctionnels qui peuvent sans doute être
différenciés dans lanalyse - La chaîne de traitement (Word -gt XML plat -gt XML
TEI -gt HTML PDF) pour laquelle il y a
clairement une forte redondance - Mais est-on certain de la pérennité de ce besoin
? (Word et Open Office permettent aujourdhui
denregistrer en XML à plat ne faut-il pas
plutôt envisager des outils déditions structurée
de type Adobe Frame Maker cf. PUC de Caen
plutôt que des chaînes). - Il est sans doute nécessaire de regarder comment
fonctionnent les éditeurs - Lensemble Workflow / métadonnées pour lequel il
y a peut être une complémentarité système local /
système national à trouver
332-3 Les autres projets
- Enquête menée auprès des grandes écoles
(conférence des grandes écoles) - 8 grandes écoles ont répondu pour linstant
Nantes Véto, INSA Lyon, Grenoble Management, ENST
Paris, ENST Bretagne, ENSMP, ENSAM, Centrale Lyon
342-3 Les autres projets (enquête GE)
- Pour ces 8 GE
- le volume annuel de thèses est de 395
- Le nombre de thèses déposées électroniquement est
de 838 dont 312 sont accessibles en ligne (dont
40 ENST Pastel)
352-3 Les autres projets (enquête GE)
- Mode de mise en œuvre du processus
- Dans tous les cas, diffusion en pdf
- A part Centrale Lyon qui sappuie sur CYBERDOCS,
toutes les autres GE utilisent des chaînes
propres (il est difficile didentifier ce qui
concerne Pastel) - la Direction des études et la Bibliothèque sont
les acteurs majeurs du processus - La moitié des GE a mis en œuvre des actions
dinformation et de formation auprès des
doctorants
362-3 Les autres projets (enquête GE)
- Difficultés rencontrées
- Elles sont assez proches de celles des
universités - Les causes principales de difficultés sont liées
au manque dinformation général, à lorganisation
du circuit et au manque de motivation des acteurs
372-3 Les autres projets
- TEL (CCSD)
- Pastel (CGE)
- Grisemine
- CITHER (INSA Lyon)
382-3 Les autres projetsTEL (CCSD)
- Présentation générale
- Le CCSD est une unité du CNRS qui promeut la
communication scientifique en ligne (bases HAL,
CEL, TEL entre autres). - Lhébergement est assuré sur le Centre de calcul
de l'IN2P3 à Villeurbanne. - Pour la base de thèses en ligne TEL
- Dépôt volontaire par le docteur (après
soutenance) - Vérification rapide du document (lisibilité,
thèse officielle) - Aucun travail éditorial
- Mise en ligne en 1 ou 2 jours environ
- Diffusion en PDF (1 seul fichier) dans 95 des
cas - 2700 thèses en ligne fin avril 2004, 4000
prévues fin 2004, sur le site http//tel.ccsd.cnrs
.fr - Archivage et migration technologique garantis
392-3 Les autres projetsTEL (CCSD)
- Fonctions disponibles
- Chargement en ligne de la thèse
- Diffusion en format PDF
- Recherche par champ, feuilletage ou texte
intégral - Déchargement, impression
- Un workflow simple permet de gérer les dépôts
- Projet de procédure de certification électronique
de la thèse par l'université de soutenance. - Projet d'internationalisation (Allemagne
Europe) - Le CCSD est confiant dans la pérennité du format
PDF (propriétaire mais ouvert)
402-3 Les autres projetsPastel (CGE)
- Présentation générale
- Un des projets de la conférence des grandes
écoles, mené par les responsables des
bibliothèques ou centres documentaires des divers
membres depuis fin 2001 et dont le développement
a été sous-traité - Un serveur E-prints qui publie environ 260 thèses
détat (la production des Grandes écoles
parisiennes est de 420 thèses/an). - Les documents sont déposés après soutenance et
sans conversion particulière dans le format
choisi par le doctorant ( format natif et/ou
dédition) (PDF majoritaire, aussi Word,
Postscript, HTML, ASCII) et gérés par E-prints - Fonctions assurées
- enregistrement du déclarant création dun
compte avec log in / mot de passe. - enregistrement de la notice du document Les
rubriques sont celles du Dublin Core augmentées
de 4 champs thèse - type de thèse, discipline, sujets (nomenclature
INIST), département, école doctorale, mention
dautre dépôt (CCSD systématique), résumé
bilingue, table des matières, données
bibliographiques, etc. - dépôt et validation du dépôt.
- recherche dans la base (par sujet, critère
descriptif, école, année).
412-3 Les autres projetsPastel (CGE)
- Les procédures de dépôt sont variables dune
école à lautre - le dépôt à la bibliothèque ou au laboratoire ou à
lécole doctorale de la thèse papier (3 ex. 2
ex. du bordereau), après soutenance semble être
une règle. - 3 types dacteurs interviennent dans le système
- les doctorants ou les bibliothécaires qui sy
substituent. - les "éditeurs scientifiques" qui valident le
dépôt (les directeurs de thèses, lécole
doctorale, le labo par le biais dune personne
clairement désignée dans chaque école). - ladministrateur
- selon les écoles, les structures intervenantes
dans le processus sont différentes. - le dépôt mixte (version électronique) est
obligatoire à lENST depuis octobre 2003, mais il
ne lest pas à lENSAM - le dépôt, à lENST (45 thèses / an) est fait par
le doctorant, avec validation par "léditeur
scientifique". - le dépôt à lENSAM est fait par la bibliothèque,
après transmission de la disquette par le
doctorant et validé par léditeur scientifique. - Daprès les statistiques, chaque thèse diffusée
est en moyenne téléchargée 4 fois par mois.
422-3 Les autres projetsGrisemine
- Grisemine publie 900 documents en ligne dont 240
thèses (dont 150 de Lille 1 et 30 à 40
initialement en LateX). - Les principes sont les suivants
- saisie de métadonnées des documents dans un
fichier utilisation de la DTD marc et
utilisation des référentiels Dewey, Rameau - numérisation en PDF image texte, ajout de la
table des matières permettant la navigation
(traitement automatique ou manuel). - recherche possible dans Grisemine
- par feuilletage, par champ, par texte intégral
(texte caché du PDF) - impression ou téléchargement.
- Grisemine est serveur OAI (en cours).
432-3 Les autres projetsGrisemine
- Conditions dutilisation
- Dépôt d'un exemplaire papier par le doctorant et
définition des métadonnées avec le SCD - Après soutenance
- Relance éventuelle du doctorant
- Réception du fichier électronique et de
lautorisation de diffusion - Contrôle de cohérence avec limprimé
- Analyse juridique des inserts
- Conversion en PDF, traitement éventuel de la
table des matières - Diffusion dans Grisemine.
- Lille 1 souhaite mettre en œuvre une procédure de
dépôt en ligne de la version de la thèse après
corrections (avec validation du Directeur de
recherche).
442-3 Les autres projetsCITHER (INSA Lyon)
- Le site CITHER publie 175 thèses de l'INSA Lyon,
toutes en format PDF. - Les principes sont les suivants
- 3 dépôts possibles (obligatoire avant soutenance,
après modifs mineures, après modifs majeures) - avec la chaîne DELPHI structuration de la thèse
si nécessaire, réaccrochage des images,
retraitement des dessins, ajout de la table des
matières permettant la navigation. - conversion en PDF chapitre par chapitre
- mise en ligne d'un "pont d'embarquement" HTML,
qui inclut les métadonnées et les liens vers les
fichiers PDF (un par section)
452-3 Les autres projetsCITHER (INSA Lyon)
- Service rendus en ligne
- Recherche par métadonnées
- Recherche en TI avec le moteur DTSearch (sur un
second serveur) - Déchargement et impression possibles,
copier-coller interdit. - Diagnostic
- Charge de traitement moyen 1,5 jh.
- Traitement des formules correct
- Bonne collaboration avec le Service de la
Recherche - Mais...
- Encore trop de problèmes de stylage
- Non traitement de polices exotiques
- 1 ETP pour 100 à 120 thèses/an !
462-3 Les autres projetsTableau comparé
472-3 Les autres projetsTableau comparé
482-3 Les autres projetsTableau comparé
492-3 Les autres projets conclusion
- Ils suivent une logique différente basée sur
- Le volontariat du dépôt en général
- Un circuit peu contraignant mais intégrant ou
allant intégrer un workflow simple - Un objectif prioritaire de diffusion
- Format facile (PDF)
- Protocoles et outils adaptés au monde de la
recherche (OAI, ) - Un risque assumé sur la pérennité du format PDF
comme format d'archivage.
50Sommaire
- 1 - Synthèse de lenquête
- 2 Circuits, chaînes et autres projets
- 3 - Diagnostics et pistes proposées
513-1 Diagnostic général
- Le bilan quantitatif est aujourdhui faible.
- Les acteurs sont nombreux leur rôle pas
toujours clair (ni assumé) et la coordination
floue. - Certains établissements sont "un peu perdus" et
attentistes. - Le circuit complet de dépôt est plutôt complexe.
- La chaîne dédition n'est pas totalement
maîtrisée problèmes d'installation, de support,
de charge, de bugs, LaTeX... - Sur les bases actuelles, traiter la totalité des
thèses est illusoire (pour les 5400 thèses / an
des 45 universités étudiées environ 13500 jh,
à raison de 2 à 3 j par thèse, soit plus de 80
ETP !) - Le bilan des outsiders pose question.
- Cependant la sensibilisation à la publication
électronique croît sensiblement et les thèses
publiées sont consultées !
523-2 Des choix dorganisation implicites à
trancher où à concilier
- Pour généraliser le dispositif, faut-il évoluer
- Plutôt vers une centralisation / mutualisation
des tâches sur les acteurs nationaux (ABES,
CINES, CCSD, PASTEL) ? - Plutôt vers la décentralisation des tâches (au
sein des universités, pour le développement des
outils) ? - Cela dépend évidemment des tâches
- Assistance au doctorant pour la structuration en
amont de sa thèse elle ne peut être assurée
quen local, mais sur la base doutils qui
peuvent (doivent ?) être mutualisés et communs - Traitement de la thèse mutualisable ?
- Signalement Diffusion à la fois au niveau de
lUniversité (les productions de la recherche de
luniversité) et au niveau national (les thèses
françaises)
533-2 Des choix dorganisation implicites à
trancher où à concilier
- Pour réussir la mise en œuvre des chaînes de
traitement, faut-il privilégier - Un développement sur la base du logiciel "libre"
(une communauté dacteurs publics ou privés,
source duplicable et librement modifiable,
gratuit en licence, pas de hotline,) - Un développement national sur la base dun projet
informatique classique (un seul produit, des
relations client public / fournisseur privé ou
public qui peuvent être contractualisées pour le
développement et pour la maintenance,...) - Rien nempêche non plus de contractualiser un
projet autour dune solution Open Source - Pour généraliser le dispositif, est-il préférable
de présenter le dispositif - De manière administrative / imposée / liée avec
le papier - De manière libre / volontaire / électronique
- Faut-il (peut-on) être plus directif envers les
doctorants et leurs directeurs ?
543-2 Le dispositif actuel regroupe implicitement
différents enjeux
- Le dispositif actuel, qui repose en particulier
sur un format pivot XML, superpose en réalité 5
enjeux différents, bien que liés - Lenjeu de la structuration de la thèse (XML est
structuré) - Lenjeu de la large diffusion de la thèse
électronique (HTML et PDF générés à partir du
XML, mais à terme dautres formats de diffusion
seraient possibles) - Lenjeu de la conservation du document (XML est
pérenne) - Lenjeu du signalement de la thèse (par
extraction des métadonnées XML incluses dans le
document) - Lenjeu de lefficacité de lorganisation du
circuit de la thèse (des workflow au dessus de
SPARTE et CYBERDOCS) - Deux conditions sine qua non de ce dispositif 5
en 1 - Une très bonne structuration de la thèse
- Un outil, qui devient de plus en plus complet,
très performant
553-2 Le dispositif actuel regroupe implicitement
différents enjeux
- La réussite de ce dispositif passe donc
obligatoirement - Par la généralisation de la production
structurée, ce qui nécessite - Idéalement, des compétences en matière dédition
à structurer le plus en amont possible dans le
cursus du doctorant il sagit là cependant dun
processus à long terme, qui ne peut débloquer
à lui seul la généralisation du dispositif - Sinon un apport rapide et massif de compétences
sur un nouveau métier induit forcément des
actions centralisées et externalisées - Par la mise en œuvre réussie et rapide des outils
SPARTE et CYBERDOCS, ce qui nécessite
inévitablement une concentration des efforts - sur la réussite complète des 2 chaînes
- sur la mise en œuvre des moyens de support
adéquats (formation, assistance, ) - Les efforts à consentir sur les chaînes de
traitement (sur les aspects conversion Word -gt
XML - gt HTML et PDF) doivent néanmoins tenir
compte de lévolution et de la variété des outils
563-3 Quel dispositif si lon dissociait les
différents enjeux ?
- Enjeu de structuration de la thèse
- La structuration correcte dune thèse participe à
sa qualité et garantit une cohérence dans la
production de lUniversité elle constitue une
aide au doctorant en proposant des modèles de
documents. - Il sagit donc dune question qui concerne le
contenu de la thèse aux écoles doctorales et
aux doctorants de sengager sur ce sujet (ou
pas), de limposer (ou pas) en fonction de
limportance accordée à cet enjeu (cf. les
résistances rencontrées sur la structuration des
thèses de Maths en LateX) - La question de lédition électronique structurée
a vocation à dépasser le cas des thèses comment
le dispositif des thèses pourrait-il profiter de
la dynamique possible concernant la rédaction
structurée darticles de revues (ressources
formations communes ?) - Lédition électronique structurée est un métier
en tant que tel comment procèdent les éditeurs
avec leurs auteurs ? avec quels outils ?
573-3 Quel dispositif si lon dissociait les
différents enjeux ?
- Enjeu de diffusion de la thèse
- Il sagit sans doute de lenjeu perçu par tous
comme le plus urgent / important - De plus, lexpérience montre quil sagit dun
service utile (cf. stats de Pastel) ! - Une version de diffusion en PDF suffirait (format
de diffusion à la fois international et largement
utilisé dans les sites officiels français) - Ce qui nest pas incompatible, loin de là, avec
un stylage minimum (à définir par exemple pour
générer des tables des matières dynamiques,
indispensable pour les documents de grand volume,
images en GIF et JPEG,) Cf. INSA Lyon - Ce qui est lié à lenjeu de signalement les
métadonnées doivent être visibles et indexées par
les moteurs de recherche - Développer la fédération des accès et des
recherches aux bases de thèses (Sudoc TEL
Pastel ) le rôle du portail SUDOC ?
583-3 Quel dispositif si lon dissociait les
différents enjeux ?
- Enjeu de conservation de la thèse
- Lurgence pour aboutir à une version de
conservation nest pas la même que celle de la
version de diffusion ! Lun pourrait ne pas être
sur le chemin critique de lautre. - Il sagit dun enjeu national qui aurait vocation
à être traité de manière mutualisée voire
centralisée voire sous-traitée - Certains considèrent que le format PDF est
pérenne dans la mesure où les sources sont
librement disponibles de fait, il existe
dautres fournisseurs quAdobe et des outils dans
le monde du libre. - Si lon associe pérennité et ouverture des
sources, on pourrait donc considérer les thèses
en LateX et en Open Office comme pérennes ! (NB
même MS Office XP permet denregistrer
aujourdhui en XML à plat ).
593-3 Quel dispositif si lon dissociait les
différents enjeux ?
- Enjeu de signalement de la thèse
- Ce qui est important, cest lexhaustivité du
signalement - Cet enjeu peut être traité par la poursuite des
travaux qui consistent à charger automatiquement
dans des catalogues (ex. Sudoc) des fichiers de
métadonnées - Au format XML
- Compatibles OAI
- Avec des correspondances vers Unimarc
- donc respectant la future recommandation AFNOR
- Enjeu defficacité de lorganisation du circuit
de la thèse - Faut-il regrouper ou dissocier le workflow local
(doctorant, scolarité ED, SCD) et le workflow
national (SCD, ABES, CINES) ?
603 4 Synthèse
- Le scénario enjeux dissociés
- Est-il une alternative complète au scénario
actuel enjeux intégrés ? - Ou en constitue-t-il un scénario dattente
provisoire ? - Dans ce cas, comment garantir que le provisoire
ne deviendra pas définitif ? - Finalement, une question très classique dans le
domaine des systèmes dinformation. Faut-il
privilégier - Les systèmes intégrés de gestion des thèses
(ce que tendent à devenir de fait SPARTE et
CYBERDOCS), qui visent à couvrir tout le circuit,
tous les acteurs et tous les états du document,
avec peut être plusieurs outils complets et
packagés sur le marché que les établissements
devront évaluer et choisir librement ? - Une intégration de systèmes différents
modulaires, communicants (interopérables), autour
de normes standard (métadonnées XML / AFNOR /
OAI, documents XML / TEI ou PDF), avec une forte
coordination densemble ?