Atelier r - PowerPoint PPT Presentation

About This Presentation
Title:

Atelier r

Description:

Atelier r gional des Nations Unies sur le traitement des donn es du recensement : ... Possibilit d'erreurs durant la substitution de caract res, affectant la qualit des donn es ... – PowerPoint PPT presentation

Number of Views:40
Avg rating:3.0/5.0
Slides: 23
Provided by: UnitedN
Learn more at: https://unstats.un.org
Category:

less

Transcript and Presenter's Notes

Title: Atelier r


1
  • Saisie des données de recensement vue densemble

2
Sommaire
  • Définition (N-U)
  • Méthodes de saisie de données
  • Différentes Méthodes
  • Avantages et inconvénients
  • Facteurs à considérer lors du choix dune méthode
  • Conclusion

3
Quest-ce que la saisie de données?
  • la saisie de données est le procédé utilisé
    pour convertir les données obtenues lors du
    recensement dans une forme interprétable par un
    ordinateur (traduction libre)
  • Data capture is the system used to convert the
    information obtained in the census to a format
    that can be interpreted by a computer.
  • Source United Nations Principles and
    Recommendations for Population and Housing
    Censuses, Rev. 2, p.68.

4
Méthodes de saisie de données
  1. Saisie au clavier (manuelle)
  2. Reconnaissance optique de marques (OMR)
  3. Reconnaissance optique de caractères (OCR) /
    Reconnaissance intelligente de caractères /ICR)
  4. Assistant Numérique Personnel (PDA)
  5. Internet

5
Saisie au clavier (manuelle)
  • Les réponses obtenues lors du recensement sont
    entrées par le biais du clavier dans un
    ordinateur
  • Peut avoir recours à une assistance par
    ordinateur où lopérateur sélectionne une réponse
    parmi plusieurs options affichées sur écran
  • Lutilisation de cette méthode dépend des
    facteurs délai, coût, installation dune
    infrastructure technologique, etc.
  • Peut nécessiter le traitement des réponses sous
    forme de texte en une classification par catégorie

6
Avantages et inconvénients de la saisie manuelle
  • Advantages
  • Méthode requièrt des logiciels et équipements
    simples
  • Moins coûteuse!
  • Déploiement dun grand nombre de PC pour dautres
    utilisations après le recensement
  • Disadvantages
  • Exige plus de personnel
  • Tâche prend plus de temps que celle de la saisie
    automatique
  • Erreurs potentielles durant la saisie
  • Normalisation des opérations difficle vu que la
    performance dépend des individus

7
Technologies de saisie de données
  • Les techniques dimagerie et de reconnaissances
    optique et intelligente de caractères offrent un
    grand potentiel et des avantages pour la saisie
    des données
  • Lutilisation de la technologie pour la saisie
    des données devrait être pour renforcer leur
    efficacité/efficience et non pour le bien de la
    technologie
  • Sensibilisation pour les longs délais et
    linfrastructure technologique nécessaires pour
    la réussite de la mise en œuvre de la
    reconnaissance intelligente de caractères

8
Reconnaissance Optique de Marques (OMR)
  • LOMR est une méthode de numérisation des
    formulaires ou les réponses sont lues par un
    ordinateur sans le recours à un clavier
  • La technologie OMR lit les réponses à des
    questions de type cases à cocher sur un papier
    spécial
  • La machine ne détecte que la présence ou
    labsence de la marque
  • Les réponses scannées sont transformées en codes
  • Les réponses écrites à la main doivent être
    saisies manuellement ou codées avec lassistance
    dun ordinateur

9
Avantages et inconvénients de lOMR
  • Avantages
  • Amélioration dans la précision des données
  • Plus rapide que celle de la saisie manuelle
  • Equipement relativement pas cher
  • Relativement simple à installer et faire
    fonctionner
  • Technologie testée et utilisée dans plusieurs
    pays
  • Inconvénients
  • Restrictions au niveau du modèle des formulaires,
    les types de papier et encre à utiliser
  • Précision exigée pour le processus dimpression
    et de coupure du papier
  • Les réponses dans des cases doivent être cochées
    par des moyens de marquage visibles par la
    machine (un stylo ou crayon de graphite)
  • Pas de saisie de réponses sous forme de texte

10
Reconnaissance Optique de Caractères (OCR)/
Reconnaissance Intelligente de Caractères (ICR)
  • OCR et ICR combinent les technologies de scannage
    et de reconnaissance de caractères pour numériser
    au complet le formulaire et interpréter les
    réponses
  • LOCR reconnait seulement les caractères
    imprimées à la machine
  • LICR lit à la fois les réponses imprimées à la
    machine et celles écrites à la main dans des
    places bien spécifiques du formulaire et
    convertit les réponses en codes
  • Pour lOCR, les réponses écrites à la main
    doivent être saisies manuellement ou codées avec
    lassistance par ordinateur

11
Principes de fonctionnement
  • Scannage optique dune page dont on veut
    récupérer le texte (image numérique)
  • Image contrastée pour que le programme discerne
    facilement les caractères
  • Le programme lit le document et, se basant sur
    des bibliothèques de formes, détecte les
    caractères afin den faire correspondre la forme
    au caractère attendu
  • Des dictionnaires permettent de recupérer
    certaines erreurs puisque le logiciel se basera
    alors sur des mots existants pour faire ses
    comparaisons

12
Advantages of OCR/ICR
  • La conception du formulaire nest pas aussi
    stricte que pour lOMR
  • Le délai de traitement peut être réduit en raison
    de la nature automatisée du processus
  • Permet le dépôt sous forme numérique des
    questionnaires, améliorant l'efficacité de
    stockage et de récupération des questionnaires
    pour un usage futur
  • Certains réponses manuscrites peuvent être
    automatiquement codées améliorant ainsi la
    qualité des données

13
Inconvénients de OCR/ICR
  • Augmentation du coût des équipements (matériel
    sophistiqué / logiciel requis)
  • Personnel (IT ) de haut niveau, nécessaire pour
    appuyer le système
  • L écriture manuelle sur les formulaires de
    recensement doit être aussi proche que possible
    du modèle de l'écriture pour éviter les erreurs
    de reconnaissance
  • Possibilité derreurs durant la substitution de
    caractères, affectant la qualité des données
  • Le réglage du moteur de reconnaissance est
    critique, avec un compromis sur la qualité et le
    coût

14
Assistant Numérique Personnel (PDA)
  • Un PDA (Personal Digital Assistant, littéralement
    assistant numérique personnel, aussi appelé
    organiseur) est un ordinateur de poche composé
    d'un processeur, de mémoire vive, d'un écran
    tactile et de fonctionnalités réseau dans un
    boîtier compact d'extrêmement petite taille.

15
Fonctionnement du PDA
  • Le contenu du formulaire de recensement est
    enregistré sur le PDA afin que les questions
    apparaissent successivement sur l'écran
  • Les données sont entrées dans un ordinateur de
    poche au lieu du papier du formulaire de
    recensement
  • Les données sont ensuite transmises par voie
    électronique à la base de données de loffice
    national de la statistique pour un traitement
    ultérieur

16
Avantages et inconvénients de lutilisation du PDA
  • Advantages
  • La saisie instantanée des données au point de
    collecte, permet de réduire les erreurs de saisie
    manuelle
  • Validation immédiate des données, réduction des
    re-vérifications ultérieures
  • Délai plus efficace avec les régles de validation
    logique, réduisant les erreurs logiques
  • Traitement plus rapide de l information du
    recensement menant à la dispposition à temps des
    résultats
  • Inconvénients
  • Mise en place du système peut prendre beaucoup de
    temps car il nécessite de nombreux essais
  • Exige que les agents recenseurs aient la capacité
    d'utiliser le dispositif qui nécessiterait la
    conduite d'un test
  • Nécessite une formation intensive des enquêteurs
    sur l'usage de dispositif (formation plus
    compliquée)
  • Besoin de recharger la batterie qui pourrait se
    décharger durant le recensement
  • Possibilité de défaillance de l'équipement

17
Collecte par Internet
  • Internet est de plus en plus utilisé pour la
    collecte des données du recensement
  • Toutefois, la méthode est toujours utilisée en
    complément avec d'autres méthodes plus établies
  • Le formulaire en ligne n'est pas une version
    téléchargeable de la version papier
  • Un mot de passe, pour accéder et remplir le
    formulaire, est requis
  • Le développement du système de collecte de
    données par Internet est généralement sous-traité
    pour manque d'expertise interne

18
Internet avantages/inconvénients
  • Avantages
  • Réduction des ressources nécessaires à la gestion
    des formulaires et la saisie des données
  • Meilleure opportunité pour atteindre les zones
    géographiques difficiles et recenser certains
    groupes de population
  • Filtrage automatique de la pertinence des
    questions
  • Des données de meilleure qualité en raison du
    mécanisme de vérification interactif, intégré à
    la machine
  • Disponibilité plus rapide des résultats du
    recensement, due a un processus de saisie et
    correction de données plus simplifié
  • Inconvénients
  • Exige que les répondants aient un ordinateur avec
    accès Internet
  • Gestion des réponses peut être problématique, par
    exemple, que les ménages ont répondu une et une
    seule fois
  • Exige un haut niveau de système de sécurité pour
    assurer la sécurité du transfert et la
    confidentialité des données
  • Nécessité de mettre en place du système de
    traitement parallèle vu que tout le monde ne va
    utiliser l'Internet
  • Nécessite dun mécanisme pour vérifier les
    omissions et communications
  • Est coûteux et nécessite beaucoup de ressources
    pour la mise en place de manière adéquate et
    tester le système

19
Facteurs à considérer lorsdu choix dune méthode
  • Choix de la méthode devrait faire partie de
    l'objectif stratégique global du recensement de
    la population en termes de délai, de précision et
    de coût
  • Choix de système de traitement et de la
    technologie à utiliser doivent être mis en place
    au début du processus de recensement
  • Suffisamment de temps est nécessaire pour
    expérimenter et mettre en œuvre le système
  • Lorsque la technologie de l'imagerie est utilisée
    pour la saisie des données, des tests sont
    nécessaires bien avant le recensement
  • Possibilité de sous-traiter quand l'expertise
    requise n'est pas disponible

20
Facteurs à considérer (cont.)
  • Des tests extensifs du système sont également
    critiques quant la collecte de données est
    effectuée soit par PDA soit via Internet
  • Conception et qualité du papier de recensement
    devraient être liées à la méthode de saisie des
    données
  • Lorsque on décide dutiliser la technologie de
    l'imagerie, une formation adéquate des agents
    recenseurs sur la façon de bien remplir les
    formulaires est cruciale

21
Conclusion
  • Le choix dune méthode appropriée dépend de la
    situation particulière de chaque pays
  • Chaque méthode a ses avantages et ses
    inconvénients, ses coûts et impacts sur les
    équipments logiciel et matériel au niveau de la
    saisie de données mais aussi au niveau des étapes
    ultérieures
  • Dans un recensement, la saisie de données peut
    impliquer une combinaison de plus dune des
    méthodes présentées

22
  • Merci
Write a Comment
User Comments (0)
About PowerShow.com