Pr - PowerPoint PPT Presentation

1 / 60
About This Presentation
Title:

Pr

Description:

Etude de la mise en uvre du dispositif national de diffusion des th ses par voie ... Acteur : tr s variable. Acteur : SCD ou cellule sp cifique. Impressions ... – PowerPoint PPT presentation

Number of Views:57
Avg rating:3.0/5.0
Slides: 61
Provided by: Clie67
Category:
Tags: acteur | acteurs

less

Transcript and Presenter's Notes

Title: Pr


1
Ministère de lEducation NationaleSous-direction
des bibliothèques et de la documentation
Etude de la mise en œuvre du dispositif national
de diffusion des thèses par voie électronique
dans les Etablissements denseignement supérieur
et de recherche Bilan de lexistant
2
Sommaire
  • 1 - Synthèse de lenquête
  • 2 Circuits, chaînes et autres projets
  • 3 - Diagnostics et pistes proposées

3
1 Synthèse de lenquête
  • Les travaux effectués
  • Niveau de mise en œuvre du dispositif
  • Actions entreprises pour faciliter la mise en
    œuvre
  • Difficultés rencontrées
  • Préconisations des établissements

4
1-1 Les travaux effectués
  • 13 visites et entretiens ABES, ANRT Lille
    Lille 2, CCSD (CNRS), CINES, Clermont, Compiègne,
    INSA Lyon, Lille 1, Limoges, Lyon 2,
    Marne-la-Vallée, Pastel (GE)
  • Les comptes rendus validés sont disponibles et
    seront annexés à létude
  • Nos études en cours (exemple avec Caen, Paris
    6, Paris 7, Orléans) ont également évidemment
    alimenté nos réflexions.
  • Un dépouillement (pour linstant) de 53
    questionnaires SCD
  • A venir un dépouillement de 8 enquêtes grandes
    écoles

5
1-2 Niveau de mise en œuvre
  • 53 établissements ont répondu (sur près de 100 au
    total ?) fin avril. Des réponses arrivent encore
    suite à relance (mise à jour en fin détude).
  • Quelques chiffres supplémentaires ont été glanés
    lors des visites (Lyon 2, Lille 3)
  • Chiffres clés
  • 886 thèses ont été déposées sous forme
    électronique depuis 1, 2 ou 3 ans par rapport à
    un volume annuel de 5.922 thèses soutenues dans
    les établissements étudiés (11.000 thèses
    soutenues en France par an au total)
  • 645 thèses (environ!) sont accessibles en ligne
    (soit 11 du volume annuel de thèses soutenues
    dans les établissements étudiés). Ce chiffre
    inclut
  • Lyon 2 (261 thèses dans SDX chiffres obtenus
    lors de la visite),
  • lUMLV (41 thèses dans Pelleas)
  • Mais aussi
  • Lille 1 (150 thèses PDF dans Grisemine)
  • Nantes (102 thèses PDF)
  • Finalement, le nombre de thèses diffusées suite à
    structuration XML est de 360 environ.
  • Une dizaine détablissements à forte dominante
    scientifique ont aujourdhui 1000 thèses
    diffusées par le CCSD (en particulier Grenoble 1
    600, Lyon 1 140, Paris 11 160)

6
1-2 Niveau de mise en œuvre
  • 15 établissements ont mis en place le dispositif
    Clermont, Lille 1, Limoges, Lyon 2, Lyon3,
    Nantes, Paris 10, Paris 11, Paris 12, St Etienne,
    Strasbourg 1, UMLV, UTC, UTT. Au moins Lille 3 à
    rajouter (hors enquête)
  • Par ailleurs
  • 6 établissements sont en cours de lancement (en
    2004)
  • 13 prévoient un lancement à partir de 2005 (au
    plus tôt)
  • 19 ne prévoient rien pour linstant.
  • Les mises en œuvre concernent
  • Des établissements de taille variable
  • Disposant dune équipe de 0,5 à 4,5 ETP ayant des
    compétences biblio et informatiques.
  • Avec des modes de dépôt et de traitement
    différents
  • Des thèses Word en sciences  molles , souvent
    dans des établissements pluridisciplinaires
  • 3 établissements (Paris 11, UTT, Lyon 3) ont
    déposé des thèses non encore traitées /
    diffusées.

7
1-2 Niveau de mise en œuvre
  • Qui fait quoi ?
  • En général, le SCD a un rôle pilote formation,
    traitement, signalement, stockage, diffusion
  • Aidé par le CRI pour les aspects techniques
    stockage, hébergement et maintenance des serveurs
  • Les Ecoles Doctorales informent et sensibilisent
    les doctorants et peuvent participer à la
    formation
  • Les Centres de Télé-enseignement sont rarement
    sollicités, de même que les Presses
    Universitaires
  • Le mode de dépôt est
  • Toujours mixte (papier électronique) sauf à La
    Réunion (électronique seulement)
  • Volontaire dans 50 des cas
  • En prévision, à 70 obligatoire
  • Le dépôt est fait 32 avant soutenance, 48
    après, 20 avant et après.

8
1-2 Niveau de mise en œuvre
  • Chaîne(s) de traitement utilisées

9
1-2 Niveau de mise en œuvre
  • La gestion automatisée des dépôts (workflow)
  • est mise en place dans 3 établissements
    Compiègne, Lyon 2, St Etienne
  • est prévue dans 6 autres Lille 1, Besançon,
    Dijon, Paris 10, Paris 11, Reims
  • Outils de diffusion utilisés
  • Le Site WEB, peu de Portails Locaux (Pelleas,
    Grisemine), SDX.
  • Archivage électronique
  • Généralement prévu ou déjà mis en œuvre
  • Assuré majoritairement par le SCD (9
    établissements) puis par le CINES (4
    établissements) et le CRI (3 établissements)
  • II est cependant à noter quà ce jour le CINES
    nhéberge aucune thèse autre que celles stockées
    sur le serveur SPARTE

10
1-3 Actions entreprises pour faciliter le
dispositif
  • Information et sensibilisation
  • Plus de la moitié des établissements ont
    entrepris des actions dinformation
  • Surtout au travers des ED, lors des rentrées
  • Formation des doctorants
  • Les mêmes établissements ont également mis en
    place des modules de formation incluant les
    problématiques de stylage et de rédaction de
    documents structurés
  • Égalité entre formations obligatoires et
    volontaires

11
1-3 Actions entreprises pour faciliter le
dispositif
  • Mise à disposition de postes et de licences
  • Généralement, celles déjà disponibles dans
    létablissement
  • Parfois, des postes sont réservés aux doctorants
  • Mise à disposition de modèles de documents
  • Le modèle Word est diffusé dans 20
    établissements
  • Une feuille de style pour LateX est en cours de
     contrôle  à lUMLV

12
1-4 Difficultés rencontrées
  • Statistiquement
  • 3 causes principalement mentionnées
  • Linsuffisance de communication
  • La difficulté dorganisation du circuit
  • La faible motivation des acteurs qui découle des
    deux premiers facteurs
  • 2 autres causes importantes signalées
  • Le déficit de formation des doctorants
  • Les difficultés techniques et les compétences
    informatiques à mettre en oeuvre

13
1-4 Difficultés rencontrées
  • Faible communication sur le projet
  • Critique majeure formulée par une majorité
    détablissements
  • Attentes fortes dexplications sur les objectifs
    du projet, les procédures à suivre, les
    recommandations
  • Pour pouvoir mieux convaincre et mobiliser les
    nombreux acteurs impliqués
  • Organisation difficile du circuit
  • Critique la plus fréquente, en raison
  • du nombre et de la variété dacteurs impliqués
  • de la difficulté technique du processus et de
    létat inachevé des chaînes de traitement
    disponibles à ce jour
  • des ressources humaines nécessaires et souvent
    non disponibles

14
1-4 Difficultés rencontrées
  • Faible motivation des acteurs
  • Critique fréquente et jugée grave
  • Découle des problèmes dinformation et de mise en
    œuvre du processus mais aussi de la hiérarchie
    "molle" des universités
  • Lintérêt dune publication en ligne (vs
    publication darticle) nest pas acquis par tous
    les doctorants, malgré une sensibilisation
    croissante.
  • Déficit de formation des doctorants
  • Déficit notable de savoir-faire des doctorants en
    matière de stylage des documents
  • Mais en amélioration sensible grâce aux
    formations entreprises
  • Le problème de la charge de formation subsiste
    au début du processus mais aussi après.

15
1-4 Difficultés rencontrées
  • Moyens techniques et compétences informatiques
  • Inadéquation des chaînes de traitement aux thèses
    scientifiques (LateX)
  • Chaînes de traitement insuffisamment finalisées
  • Difficultés dinstallation
  • Durée du traitement dune thèse moyenne souvent
    rapportée de 2 à 3 jours
  • Ressources humaines insuffisantes dans les
    établissements produisant beaucoup de thèses
  • Difficultés diverses
  • Problèmes juridiques concernant le droit de
    diffusion des images, photos, textes inclus dans
    les thèses

16
1-5 Préconisations des établissements
  • Évidemment faire plus et mieux
  • plus de formation du doctorant,
  • plus de formation des agents,
  • plus de communication,
  • chaînes mieux éprouvées et plus complètes,
  • plus d'outils et de postes...

17
1-5 Préconisations des établissements
  • Mais aussi...
  • rendre les formations obligatoires (au minimum
    contrôler le niveau de savoir-faire)
  • imprimer la thèse pour le doctorant (si elle est
    structurée et... s'il n'y en a pas trop !)
  • désigner un pilote du processus dans l'Université
  • disposer au niveau national d'un bon support
    (hotline, équipe volante)
  • communiquer en "top down" directeurs de thèses,
    de labos,
  • assouplir les conditions de mise en ligne
    (PDF...)
  • simplifier le circuit de dépôt
  • arriver à la "masse critique" !

18
Sommaire
  • 1 - Synthèse de lenquête
  • 2 Circuits, chaînes et autres projets
  • 3 - Diagnostics et pistes proposées

19
2-1 Les circuits de dépôt2.1.1 Le circuit type
(?) du dépôt mixte
  • Ce circuit est soumis à de nombreuses variantes

Impression à la demande Base de thèses en ligne ?
ANRT
Paris X (thèses en cours)
6. Envoi Formulaire 1 ex. pour
microformes Envoi Microforme
5. Envoi Formulaire 3 ex. Thèse papier
version électronique auteur
2. Dépôt Formulaire Thèse papier électronique
Scolarité ED
SCD
ABES
Portail Catalogue SUDOC
7. Catalogage SUDOC
Doctorant
1 ou 2 dépôts
4. Validation de la thèse
8. Thèse version électronique
11. Archivage
3. Envoi de la Thèse Soutenance
Jury ED
Acteur SCD ou cellule spécifique
Ressources Traitement
CINES
1. Information Formation
10. Publication WEB GED
9. Thèse version électronique diffusion
archivage
Site WEB Portail / GED
CCSD (CNRS)
Ressources formation
Ressources Impression
Impressions De la thèse
Thèses PDF
CRI
Pastel (GE)
Acteur ED ou cellule de traitement
Acteur très variable
20
2-1 Les circuits de dépôt2.2.2 Diagnostic
  • De multiples éditions de la thèse avec une réelle
    difficulté à définir ce quest la thèse
    officielle
  • Le dépôt électronique de la thèse avant
    soutenance garantit au moins un dépôt avant que
    le docteur ne s'éloigne de l'université mais
    nest pas utile pour le traitement car des
    modifications sont souvent / parfois demandées
  • La thèse validée par le jury est la thèse papier
    la thèse électronique (au format auteur) au
    mieux certifiée comme conforme par lauteur
    cest-à-dire que la thèse issue des chaînes de
    traitement en aval nest pas certifiée par le
    jury (mais souvent simplement vérifiée par le
    doctorant)
  • Cest pourquoi, 2 notices sont créées dans le
    SUDOC (et donc dans le SIGB local) 1 pour la
    thèse papier 1 pour la version de diffusion
    issue de la chaîne de traitement
  • Perspectives
  • Garantir la validation officielle de la thèse
    électronique diffusée avec intégration des
    corrections (NB exemple de Polytechnique qui
    numérise la thèse papier !)
  • Garantir la conformité de la thèse électronique
    diffusée avec la thèse papier finale
  • Aboutir ainsi à une seule notice ?

21
2-1 Les circuits de dépôt2.2.2 Diagnostic
  • Le rôle moteur quassume aujourdhui un SCD en
    matière daide à la rédaction structurée de la
    thèse pose question dans le cadre de la
    généralisation du dispositif
  • Il sagit clairement dun métier en tant que tel
    (lédition électronique structurée)
  • Ce métier est nouveau pour les bibliothèques
    les compétences à acquérir restent difficiles
    avec des moyens actuels insuffisants (en
    formation, en information)
  • L adéquation actuelle entre la charge et les
    ressources de traitement est rarement
    satisfaisante (1 ETP traite au mieux 70 à 100
    thèses bien stylées par an).
  • Cette compétence est également certainement
    nécessaire pour dautres productions de
    lUniversité (Presses Universitaires, Articles de
    chercheurs, documents pédagogiques,)
  • Perspectives
  • Au minimum, mutualiser / organiser / renforcer
    cette compétence au niveau de luniversité
  • A étudier lappui de lANRT ? lappui de
    sociétés extérieures spécialisées dans lédition
    structurée ?

22
2-1 Les circuits de dépôt2.2.2 Diagnostic
  • La position des acteurs nationaux dans la chaîne
    peut certainement être optimisée pour simplifier
    le circuit
  • Utiliser les métadonnées, conformes à la
    recommandation AFNOR, au format XML, saisies dans
    un outil local ou dans SPARTE, pour alimenter
    automatiquement le catalogue SUDOC
  • Pour les utilisateurs professionnels du SUDOC,
    passer par lABES pour déposer la version
    darchivage au CINES, que lon utilise SPARTE ou
    non (possibilité de dépôt sans conversion)
  • Quelle est la version à archiver au CINES ? Quel
    rôle peut prendre le CINES concernant larchivage
    de la version de diffusion ? Jusquoù doit aller
    la mission darchivage du CINES (garantir le
    stockage et la lisibilité ?)
  • Le rôle de lANRT un appui mutualisé au
    traitement des thèses pour les établissements qui
    nen ont pas les moyens semble possible

23
2-1 Les circuits de dépôt2.2.2 Diagnostic
  • Autres points
  • Laide à limpression des thèses pour le
    doctorant est assurée de manière variable la
    généralisation de la prise en charge de
    limpression des thèses par lUniversité est-elle
    imaginable ?
  • Les aspects juridiques
  • Finalement assez bien réglés pour le contenu
    produit par le doctorant, mais pour les contenus
    extérieurs copiés dans le document (articles de
    revues, images), cela ne repose que sur une
    déclaration du doctorant quil est difficile de
    vérifier.
  • Un besoin général la restriction de la
    diffusion en Intranet (à lorigine des réflexions
    en 1999 la thèse devait être sur Internet ou pas)
    il sagit dun besoin commun à beaucoup
    détablissements, mais qui ne concernera quun
    faible nombre de thèses à chaque fois.

24
2-2 Les chaînes de traitement
  • Rappel de lhistorique des chaînes de traitement

2000-2001
CYBERTHESES Lyon 2 PUM Pivot SGML
2002 transfert sources
2002 redéveloppement
SPARTE CINES / ABES avec STILO Pivot XML TEI
Lite Licences OmniMark Non duplicable Utilisable
à distance
CYBERDOCS Lyon 2 avec AJLSM Pivot XML TEL
Lite Licence libre GPL Duplicable Utilisable en
local
2003 Mise en oeuvre
25
2-2 Les chaînes de traitementComparaison des
points sensibles
26
2-2 Les chaînes de traitementComparaison des
points sensibles
27
2-2 Les chaînes de traitementComparaison des
points sensibles
28
2-2 Les chaînes de traitementSPARTE vs.
CYBERDOCS
29
2- 2 Les chaînes de traitementComment faciliter
le dispositif ?
  • Renforcer les dispositifs au niveau de chaque
    chaîne pour résoudre effectivement les problèmes
    résiduels
  • Renforcer la formation aux chaînes
  • Renforcer lassistance utilisateurs
  • Mutualiser sur un  portail  unique les
    informations, documents, formations en ligne
    communes aux 2 chaînes (cest lobjectif de
    linitiative METATHESE)
  • Évidemment, poursuivre et renforcer les actions
    de formation et de support aux doctorants pour
    lutilisation de la feuille de style
  • La feuille de style pourrait faire lobjet de
    quelques modifications, dans un but de
    simplification

30
2-2 Les chaînes de traitementSPARTE ou
CYBERDOCS ?
  • Une question de base que se posent les
    établissements entre CYBERDOCS et SPARTE que
    choisir ?
  • En effet, comme on la vu sur lanalyse des
    macro-fonctionnalités, ces solutions deviennent
    de plus en plus complètes et visent à gérer le SI
    des thèses (workflow, métadonnées, conversion et
    diffusion du doc.)
  • Ce que lon peut dire de manière certaine
  • CYBERDOCS sadresse aux établissements qui ont
    comme stratégie de simpliquer dans une
    initiative Open Source (avec les moyens
    informatiques associés) lassistance restera
    mutualisée
  • SPARTE sadresse aux établissements qui
    souhaitent un outil  directement utilisable  et
    sans simpliquer sur sa maintenance
    lassistance est centralisée

31
2-2 Les chaînes de traitement SPARTE ou
CYBERDOCS ?
  • Ce qui nest pas encore clair
  • Le nombre dutilisateurs et de thèses traitées
    permet-il de dire que les chaînes ont été testées
    et recettées ?
  • On peut connaître ce que font les chaînes, mais
    on ne connaît pas ce quelles auraient dû faire
    (spécifications initiales) ou ce quelles feront
    (évolutions)
  • Les problèmes identifiés ne font pas lobjet dun
    plan de correction formel, ce qui ne permet pas
    de garantir à ce jour un fonctionnement parfait
    des chaînes
  • Des orientations prises sur le circuit global
    découleront de nouvelles exigences pour les
    systèmes

32
2-2 Les chaînes de traitement SPARTE ou
CYBERDOCS ?
  • Ces deux systèmes englobent deux sous-ensembles
    fonctionnels qui peuvent sans doute être
    différenciés dans lanalyse
  • La chaîne de traitement (Word -gt XML plat -gt XML
    TEI -gt HTML PDF) pour laquelle il y a
    clairement une forte redondance
  • Mais est-on certain de la pérennité de ce besoin
    ? (Word et Open Office permettent aujourdhui
    denregistrer en XML à plat ne faut-il pas
    plutôt envisager des outils déditions structurée
    de type Adobe Frame Maker cf. PUC de Caen
    plutôt que des chaînes).
  • Il est sans doute nécessaire de regarder comment
    fonctionnent les éditeurs
  • Lensemble Workflow / métadonnées pour lequel il
    y a peut être une complémentarité système local /
    système national à trouver

33
2-3 Les autres projets
  • Enquête menée auprès des grandes écoles
    (conférence des grandes écoles)
  • 8 grandes écoles ont répondu pour linstant
    Nantes Véto, INSA Lyon, Grenoble Management, ENST
    Paris, ENST Bretagne, ENSMP, ENSAM, Centrale Lyon

34
2-3 Les autres projets (enquête GE)
  • Pour ces 8 GE
  • le volume annuel de thèses est de 395
  • Le nombre de thèses déposées électroniquement est
    de 838 dont 312 sont accessibles en ligne (dont
    40 ENST Pastel)

35
2-3 Les autres projets (enquête GE)
  • Mode de mise en œuvre du processus
  • Dans tous les cas, diffusion en pdf
  • A part Centrale Lyon qui sappuie sur CYBERDOCS,
    toutes les autres GE utilisent des chaînes
    propres (il est difficile didentifier ce qui
    concerne Pastel)
  • la Direction des études et la Bibliothèque sont
    les acteurs majeurs du processus
  • La moitié des GE a mis en œuvre des actions
    dinformation et de formation auprès des
    doctorants

36
2-3 Les autres projets (enquête GE)
  • Difficultés rencontrées
  • Elles sont assez proches de celles des
    universités
  • Les causes principales de difficultés sont liées
    au manque dinformation général, à lorganisation
    du circuit et au manque de motivation des acteurs

37
2-3 Les autres projets
  • TEL (CCSD)
  • Pastel (CGE)
  • Grisemine
  • CITHER (INSA Lyon)

38
2-3 Les autres projetsTEL (CCSD)
  • Présentation générale
  • Le CCSD est une unité du CNRS qui promeut la
    communication scientifique en ligne (bases HAL,
    CEL, TEL entre autres).
  • Lhébergement est assuré sur le Centre de calcul
    de l'IN2P3 à Villeurbanne.
  • Pour la base de thèses en ligne TEL
  • Dépôt volontaire par le docteur (après
    soutenance)
  • Vérification rapide du document (lisibilité,
    thèse officielle)
  • Aucun travail éditorial
  • Mise en ligne en 1 ou 2 jours environ
  • Diffusion en PDF (1 seul fichier) dans 95 des
    cas
  • 2700 thèses en ligne fin avril 2004, 4000
    prévues fin 2004, sur le site http//tel.ccsd.cnrs
    .fr
  • Archivage et migration technologique garantis

39
2-3 Les autres projetsTEL (CCSD)
  • Fonctions disponibles
  • Chargement en ligne de la thèse
  • Diffusion en format PDF
  • Recherche par champ, feuilletage ou texte
    intégral
  • Déchargement, impression
  • Un workflow simple permet de gérer les dépôts
  • Projet de procédure de certification électronique
    de la thèse par l'université de soutenance.
  • Projet d'internationalisation (Allemagne
    Europe)
  • Le CCSD est confiant dans la pérennité du format
    PDF (propriétaire mais ouvert)

40
2-3 Les autres projetsPastel (CGE)
  • Présentation générale
  • Un des projets de la conférence des grandes
    écoles, mené par les responsables des
    bibliothèques ou centres documentaires des divers
    membres depuis fin 2001 et dont le développement
    a été sous-traité
  • Un serveur E-prints qui publie environ 260 thèses
    détat (la production des Grandes écoles
    parisiennes est de 420 thèses/an).
  • Les documents sont déposés après soutenance et
    sans conversion particulière dans le format
    choisi par le doctorant ( format natif et/ou
    dédition) (PDF majoritaire, aussi Word,
    Postscript, HTML, ASCII) et gérés par E-prints
  • Fonctions assurées
  • enregistrement du déclarant  création dun
    compte avec log in / mot de passe.
  • enregistrement de la notice du document Les
    rubriques sont celles du Dublin Core augmentées
    de 4 champs thèse
  • type de thèse, discipline, sujets (nomenclature
    INIST), département, école doctorale, mention
    dautre dépôt (CCSD systématique), résumé
    bilingue, table des matières, données
    bibliographiques, etc.
  • dépôt et validation du dépôt.
  • recherche dans la base (par sujet, critère
    descriptif, école, année).

41
2-3 Les autres projetsPastel (CGE)
  • Les procédures de dépôt sont variables dune
    école à lautre 
  • le dépôt à la bibliothèque ou au laboratoire ou à
    lécole doctorale de la thèse papier (3 ex. 2
    ex. du bordereau), après soutenance semble être
    une règle.
  • 3 types dacteurs interviennent dans le système 
  • les doctorants ou les bibliothécaires qui sy
    substituent.
  • les "éditeurs scientifiques" qui valident le
    dépôt (les directeurs de thèses, lécole
    doctorale, le labo par le biais dune personne
    clairement désignée dans chaque école).
  • ladministrateur
  • selon les écoles, les structures intervenantes
    dans le processus sont différentes.
  • le dépôt mixte (version électronique) est
    obligatoire à lENST depuis octobre 2003, mais il
    ne lest pas à lENSAM
  • le dépôt, à lENST (45 thèses / an) est fait par
    le doctorant, avec validation par "léditeur
    scientifique".
  • le dépôt à lENSAM est fait par la bibliothèque,
    après transmission de la disquette par le
    doctorant et validé par léditeur scientifique.
  • Daprès les statistiques, chaque thèse diffusée
    est en moyenne téléchargée 4 fois par mois.

42
2-3 Les autres projetsGrisemine
  • Grisemine publie 900 documents en ligne dont 240
    thèses (dont 150 de Lille 1 et 30 à 40
    initialement en LateX).
  • Les principes sont les suivants 
  • saisie de métadonnées des documents dans un
    fichier utilisation de la DTD marc et
    utilisation des référentiels Dewey, Rameau
  • numérisation en PDF image texte, ajout de la
    table des matières permettant la navigation
    (traitement automatique ou manuel).
  • recherche possible dans Grisemine 
  • par feuilletage, par champ, par texte intégral
    (texte caché du PDF)
  • impression ou téléchargement.
  • Grisemine est serveur OAI (en cours).

43
2-3 Les autres projetsGrisemine
  • Conditions dutilisation
  • Dépôt d'un exemplaire papier par le doctorant et
    définition des métadonnées avec le SCD
  • Après soutenance 
  • Relance éventuelle du doctorant
  • Réception du fichier électronique et de
    lautorisation de diffusion
  • Contrôle de cohérence avec limprimé
  • Analyse juridique des inserts
  • Conversion en PDF, traitement éventuel de la
    table des matières
  • Diffusion dans Grisemine.
  • Lille 1 souhaite mettre en œuvre une procédure de
    dépôt en ligne de la version de la thèse après
    corrections (avec validation du Directeur de
    recherche).

44
2-3 Les autres projetsCITHER (INSA Lyon)
  • Le site CITHER publie 175 thèses de l'INSA Lyon,
    toutes en format PDF.
  • Les principes sont les suivants 
  • 3 dépôts possibles (obligatoire avant soutenance,
    après modifs mineures, après modifs majeures)
  • avec la chaîne DELPHI structuration de la thèse
    si nécessaire, réaccrochage des images,
    retraitement des dessins, ajout de la table des
    matières permettant la navigation.
  • conversion en PDF chapitre par chapitre
  • mise en ligne d'un "pont d'embarquement" HTML,
    qui inclut les métadonnées et les liens vers les
    fichiers PDF (un par section)

45
2-3 Les autres projetsCITHER (INSA Lyon)
  • Service rendus en ligne
  • Recherche par métadonnées
  • Recherche en TI avec le moteur DTSearch (sur un
    second serveur)
  • Déchargement et impression possibles,
    copier-coller interdit.
  • Diagnostic
  • Charge de traitement moyen 1,5 jh.
  • Traitement des formules correct
  • Bonne collaboration avec le Service de la
    Recherche
  • Mais...
  • Encore trop de problèmes de stylage
  • Non traitement de polices exotiques
  • 1 ETP pour 100 à 120 thèses/an !

46
2-3 Les autres projetsTableau comparé
47
2-3 Les autres projetsTableau comparé
48
2-3 Les autres projetsTableau comparé
49
2-3 Les autres projets conclusion
  • Ils suivent une logique différente basée sur
  • Le volontariat du dépôt en général
  • Un circuit peu contraignant mais intégrant ou
    allant intégrer un workflow simple
  • Un objectif prioritaire de diffusion
  •  Format facile  (PDF)
  • Protocoles et outils adaptés au monde de la
    recherche (OAI, )
  • Un risque assumé sur la pérennité du format PDF
    comme format d'archivage.

50
Sommaire
  • 1 - Synthèse de lenquête
  • 2 Circuits, chaînes et autres projets
  • 3 - Diagnostics et pistes proposées

51
3-1 Diagnostic général
  • Le bilan quantitatif est aujourdhui faible.
  • Les acteurs sont nombreux leur rôle pas
    toujours clair (ni assumé) et la coordination
    floue.
  • Certains établissements sont "un peu perdus" et
    attentistes.
  • Le circuit complet de dépôt est plutôt complexe.
  • La chaîne dédition n'est pas totalement
    maîtrisée problèmes d'installation, de support,
    de charge, de bugs, LaTeX...
  • Sur les bases actuelles, traiter la totalité des
    thèses est illusoire (pour les 5400 thèses / an
    des 45 universités étudiées environ 13500 jh,
    à raison de 2 à 3 j par thèse, soit plus de 80
    ETP !)
  • Le bilan des outsiders pose question.
  • Cependant la sensibilisation à la publication
    électronique croît sensiblement et les thèses
    publiées sont consultées !

52
3-2 Des choix dorganisation implicites à
trancher où à concilier
  • Pour généraliser le dispositif, faut-il évoluer
  • Plutôt vers une centralisation / mutualisation
    des tâches sur les acteurs nationaux (ABES,
    CINES, CCSD, PASTEL) ?
  • Plutôt vers la décentralisation des tâches (au
    sein des universités, pour le développement des
    outils) ?
  • Cela dépend évidemment des tâches
  • Assistance au doctorant pour la structuration en
    amont de sa thèse elle ne peut être assurée
    quen local, mais sur la base doutils qui
    peuvent (doivent ?) être mutualisés et communs
  • Traitement de la thèse mutualisable ?
  • Signalement Diffusion à la fois au niveau de
    lUniversité (les productions de la recherche de
    luniversité) et au niveau national (les thèses
    françaises)

53
3-2 Des choix dorganisation implicites à
trancher où à concilier
  • Pour réussir la mise en œuvre des chaînes de
    traitement, faut-il privilégier
  • Un développement sur la base du logiciel "libre"
    (une communauté dacteurs publics ou privés,
    source duplicable et librement modifiable,
    gratuit en licence, pas de hotline,)
  • Un développement national sur la base dun projet
    informatique  classique  (un seul produit, des
    relations client public / fournisseur privé ou
    public qui peuvent être contractualisées pour le
    développement et pour la maintenance,...)
  • Rien nempêche non plus de contractualiser un
    projet autour dune solution Open Source
  • Pour généraliser le dispositif, est-il préférable
    de présenter le dispositif
  • De manière administrative / imposée / liée avec
    le papier
  • De manière libre / volontaire / électronique
  • Faut-il (peut-on) être plus directif envers les
    doctorants et leurs directeurs ?

54
3-2 Le dispositif actuel regroupe implicitement
différents enjeux
  • Le dispositif actuel, qui repose en particulier
    sur un format pivot XML, superpose en réalité 5
    enjeux différents, bien que liés
  • Lenjeu de la structuration de la thèse (XML est
    structuré)
  • Lenjeu de la large diffusion de la thèse
    électronique (HTML et PDF générés à partir du
    XML, mais à terme dautres formats de diffusion
    seraient possibles)
  • Lenjeu de la conservation du document (XML est
    pérenne)
  • Lenjeu du signalement de la thèse (par
    extraction des métadonnées XML incluses dans le
    document)
  • Lenjeu de lefficacité de lorganisation du
    circuit de la thèse (des workflow au dessus de
    SPARTE et CYBERDOCS)
  • Deux conditions sine qua non de ce dispositif  5
    en 1 
  • Une très bonne structuration de la thèse
  • Un outil, qui devient de plus en plus complet,
    très performant

55
3-2 Le dispositif actuel regroupe implicitement
différents enjeux
  • La réussite de ce dispositif passe donc
    obligatoirement
  • Par la généralisation de la production
    structurée, ce qui nécessite
  • Idéalement, des compétences en matière dédition
    à structurer le plus en amont possible dans le
    cursus du doctorant il sagit là cependant dun
    processus à long terme, qui ne peut  débloquer 
    à lui seul la généralisation du dispositif
  • Sinon un apport rapide et massif de compétences
    sur un nouveau métier induit forcément des
    actions centralisées et externalisées
  • Par la mise en œuvre réussie et rapide des outils
    SPARTE et CYBERDOCS, ce qui nécessite
    inévitablement une concentration des efforts
  • sur la réussite complète des 2 chaînes
  • sur la mise en œuvre des moyens de support
    adéquats (formation, assistance, )
  • Les efforts à consentir sur les chaînes de
    traitement (sur les aspects conversion Word -gt
    XML - gt HTML et PDF) doivent néanmoins tenir
    compte de lévolution et de la variété des outils

56
3-3 Quel dispositif si lon dissociait les
différents enjeux ?
  • Enjeu de structuration de la thèse
  • La structuration correcte dune thèse participe à
    sa qualité et garantit une cohérence dans la
    production de lUniversité elle constitue une
    aide au doctorant en proposant des modèles de
    documents.
  • Il sagit donc dune question qui concerne le
    contenu de la thèse aux écoles doctorales et
    aux doctorants de sengager sur ce sujet (ou
    pas), de limposer (ou pas) en fonction de
    limportance accordée à cet enjeu (cf. les
    résistances rencontrées sur la structuration des
    thèses de Maths en LateX)
  • La question de lédition électronique structurée
    a vocation à dépasser le cas des thèses comment
    le dispositif des thèses pourrait-il profiter de
    la dynamique possible concernant la rédaction
    structurée darticles de revues (ressources
    formations communes ?)
  • Lédition électronique structurée est un métier
    en tant que tel comment procèdent les éditeurs
    avec leurs auteurs ? avec quels outils ?

57
3-3 Quel dispositif si lon dissociait les
différents enjeux ?
  • Enjeu de diffusion de la thèse
  • Il sagit sans doute de lenjeu perçu par tous
    comme le plus urgent / important
  • De plus, lexpérience montre quil sagit dun
    service utile (cf. stats de Pastel) !
  • Une version de diffusion en PDF suffirait (format
    de diffusion à la fois international et largement
    utilisé dans les sites officiels français)
  • Ce qui nest pas incompatible, loin de là, avec
    un stylage minimum (à définir par exemple pour
    générer des tables des matières dynamiques,
    indispensable pour les documents de grand volume,
    images en GIF et JPEG,) Cf. INSA Lyon
  • Ce qui est lié à lenjeu de signalement les
    métadonnées doivent être visibles et indexées par
    les moteurs de recherche
  • Développer la fédération des accès et des
    recherches aux bases de thèses (Sudoc TEL
    Pastel ) le rôle du portail SUDOC ?

58
3-3 Quel dispositif si lon dissociait les
différents enjeux ?
  • Enjeu de conservation de la thèse
  • Lurgence pour aboutir à une version de
    conservation nest pas la même que celle de la
    version de diffusion ! Lun pourrait ne pas être
    sur le chemin critique de lautre.
  • Il sagit dun enjeu national qui aurait vocation
    à être traité de manière mutualisée voire
    centralisée voire sous-traitée
  • Certains considèrent que le format PDF est
    pérenne dans la mesure où les sources sont
    librement disponibles de fait, il existe
    dautres fournisseurs quAdobe et des outils dans
    le monde du libre.
  • Si lon associe pérennité et ouverture des
    sources, on pourrait donc considérer les thèses
    en LateX et en Open Office comme pérennes ! (NB
    même MS Office XP permet denregistrer
    aujourdhui en XML  à plat ).

59
3-3 Quel dispositif si lon dissociait les
différents enjeux ?
  • Enjeu de signalement de la thèse
  • Ce qui est important, cest lexhaustivité du
    signalement
  • Cet enjeu peut être traité par la poursuite des
    travaux qui consistent à charger automatiquement
    dans des catalogues (ex. Sudoc) des fichiers de
    métadonnées
  • Au format XML
  • Compatibles OAI
  • Avec des correspondances vers Unimarc
  • donc respectant la future recommandation AFNOR
  • Enjeu defficacité de lorganisation du circuit
    de la thèse
  • Faut-il regrouper ou dissocier le workflow local
    (doctorant, scolarité ED, SCD) et le workflow
    national (SCD, ABES, CINES) ?

60
3 4 Synthèse
  • Le scénario  enjeux dissociés 
  • Est-il une alternative complète au scénario
    actuel  enjeux intégrés  ?
  • Ou en constitue-t-il un scénario dattente
    provisoire ?
  • Dans ce cas, comment garantir que le provisoire
    ne deviendra pas définitif ?
  • Finalement, une question très classique dans le
    domaine des systèmes dinformation. Faut-il
    privilégier
  • Les  systèmes intégrés de gestion des thèses 
    (ce que tendent à devenir de fait SPARTE et
    CYBERDOCS), qui visent à couvrir tout le circuit,
    tous les acteurs et tous les états du document,
    avec peut être plusieurs outils complets et
    packagés sur le  marché  que les établissements
    devront évaluer et choisir librement ?
  • Une intégration de systèmes différents
    modulaires, communicants (interopérables), autour
    de normes standard (métadonnées XML / AFNOR /
    OAI, documents XML / TEI ou PDF), avec une forte
    coordination densemble ?
Write a Comment
User Comments (0)
About PowerShow.com