Title: Conception dun plan dchantillonnage et analyse de puissance
1Conception dun plan déchantillonnage etanalyse
de puissance
Journées scientifiques nationales du
RESE Penticton (Colombie-Britannique) 2005
- Dan Kehler
- Écologiste de la surveillance, Parcs Canada
- Centre de services de lAtlantique
- dan.kehler_at_pc.gc.ca
2Sommaire
- Conception dun plan déchantillonnage où
échantillonner? - Pourquoi le site déchantillonnage est-il
important? - Stratégies déchantillonnage
- Analyse de puissance combien de parcelles
sont-elles nécessaires? - Quelle est la démarche?
- Pourquoi est-ce utile pour la surveillance?
- Quelles sont les limites à utiliser?
3Partie I Conception dun plan déchantillonnage
où échantillonner?
4Conception dun plan déchantillonnage où
échantillonner?
- Pourquoi le site déchantillonnage est-il
important? - Objectifs de la surveillance ? site
déchantillonnage ? conclusions pouvant être
tirées des résultats de la surveillance - Ainsi, la conception dun plan déchantillonnage
est une étape cruciale de la surveillance - Première question désirons-nous appliquer les
résultats de la surveillance à des endroits à
lextérieur du site déchantillonnage?
5Plan déchantillonnage cas où ilnest pas
requis
- Quand il ny a pas dextrapolation/dincertitude
- Statistiquement, cela arrive quand nous
échantillonnons la population dintérêt en entier
6Surveillance sans extrapolation
surveillance du chlore au point de rejet
centraleélectrique
cours deau
Nous sommes seulement intéressés à connaître les
valeurs du chlore provenant de cette centrale
électrique en particulier, au point de rejet, au
moment où nous prenons les mesures.
7Surveillance avec extrapolation
- Mais si nous étions intéressés à connaître les
teneurs en chlore provenant dautres centrales
électriques? Ou celles dans dautres tronçons du
cours deau? Ou à dautres moments? - Le nombre de sites à surveiller ou leur
superficie deviennent rapidement des facteurs
prohibitifs en termes de coûts et de temps. - En général, nous devons échantillonner une
portion de la superficie qui nous intéresse ou au
moment qui nous intéresse, puis extrapoler les
résultats à des endroits et à des moments non
échantillonnés - cest-à-dire que nous voulons que les résultats
de la surveillance dune centrale électrique
donnée nous informent sur dautres centrales
électriques, qui nont pas été échantillonnées.
8Comment extrapoler les résultats?
- Deux approches déchantillonnage
Fondée sur des modèles
Fondée sur un plan
- Enregistre dimportantes covariables en plus de
la variable dintérêt - Génère un modèle prédictif fondé sur les
covariables - Utilise les prévisions du modèle pour appliquer
des résultats aux sites non échantillonnés - Hypothèses nombreuses
- Compliquée, mais souple
- Définit une zone détude a priori
- Extrapole les résultats aux sites dont la
probabilité dêtre échantillonnés était non nulle - Peu dhypothèses
- Simple, mais rigide
9Échantillonnage fondée sur un plan
- Le plan déchantillonnage est primordial
- Le plan déchantillonnage dicte les inférences
- Première étape Définir la zone dintérêt du
programme de surveillance
10Forêts de Nouvelle-Écosse
11Forêts du parc provincial Blomidon
Blomidon Provincial Park Parc provincial
Blomidon Minas Basin Bassin Minas
12Forêts de feuillus du parc provincial Blomidon
13Sites déchantillonnage potentiels
- Définir la zone dintérêt signifie délimiter la
zone que nous pouvons échantillonner - Maintenant, nous devons choisir un site parmi
tous les sites déchantillonnage potentiels.
Comment faire?
14Comment choisir les sites Stratégies
déchantillonnage
- Échantillonnage représentatif
- Échantillonnage systématique
- Échantillonnage aléatoire
- Échantillonnage stratifié
- Échantillonnage aléatoire stratifié par
tessellation
15Comment choisir les sites 1. Échantillonnage
représentatif
- Sélection des sites en fonction dune impression
subjective de ce qui semble un site bon ou
typique . Aussi appelé échantillonnage
dirigé . - p. ex. choisir des cours deau à débit élevé en
zone boisée où vous avez déjà pêché à la mouche,
cest-à-dire des cours deau que vous savez être
de bons habitats pour la truite. - Ces sites ne sont pas nécessairement
représentatifs des cours deau en général en
termes de fermeture du couvert, de distance par
rapport aux routes, de type de forêt, de vitesse
de courant, etc. - Vivement déconseillé Léchantillonnage
représentatif mène (souvent) à des biais
inconscients et peut nuire à la capacité
dextrapoler les résultats à des endroits non
échantillonnés.
16Comment choisir les sites 2. Échantillonnage
systématique
zone dintérêt
17Comment choisir les sites 2. Échantillonnage
systématique
- Avantages
- Bonne couverture spatiale
- Permet déviter lagglutination des points (de
suréchantillonner certaines zones) - Désavantages
- Difficile dajouter ou de remplacer des sites
- Ne permet pas léchantillonnage proportionnel
- Pas réellement aléatoire
18Exemple
Programme desurveillance de la biodiversité de
lAlberta
French Equivalents for the Legend Légende Région
naturelle forêt boréale bouclier
canadien contreforts pâturages tremblaie-parc Roch
euses cours deau lacs agglomérations sites de
lABMP kilomètres
19Comment choisir les sites 3. Échantillonnage
aléatoire
- Échantillonnage aléatoire simple le type
déchantillonnage le plus courant - Définir la zone dintérêt
- Choisir des coordonnées (x,y) aléatoires pour
chacun des points déchantillonnage - Conserver les points déchantillonnage qui se
trouvent dans la zone dintérêt - Les points sont aléatoirement placés dans la zone
dintérêt
20Comment choisir les sites 3. Échantillonnage
aléatoire
16 points aléatoires
zone dintérêt
21Comment choisir les sites 3. Échantillonnage
aléatoire
- Avantages
- En théorie, on peut extrapoler les résultatset
les appliquer à la zone entière - Il est facile dajouter de nouveaux points
- Désavantages
- Les sites peuvent être agglutinés
- Il nest pas garanti que la couverturespatiale
soit bonne
22Comment choisir les sites
- Quarrive-t-il si la zone dintérêt nest pas
homogène? - p. ex. la zone dintérêt peut être une forêt,
mais cette forêt peut être composée dune section
sèche de feuillus (hautes terres), dune section
humide de conifères (basses terres) et dune zone
intermédiaire de forêt mixte. - Si nous voulons être en mesure dextrapoler les
résultats de notre surveillance et de les
appliquer à la zone dintérêt entière, nous
devons nous assurer que nous avons des points
déchantillonnage dans chacune des trois
sections. Chaque section constitue une strate.
23Zone non homogène
Léchantillonnage aléatoire simple peut être
inadéquat
3 strates
24Zone non homogène
Léchantillonnage systématique peut normalement
surmonter cet obstacle
25Comment choisir les sites 4. Échantillonnage
stratifié
Une autre type déchantillonnage consiste à
intégrer les strates directement dans le plan
déchantillonnage Échantillonnage aléatoire
stratifié Dans chaque strate, choisir un nombre
égal de points placés aléatoirement
26Conception dun plan déchantillonnagealéatoire
stratifié
- 5 sitesdéchantillonnagepar strate
- meilleurecouverture spatiale
27Exemple dun échantillonnage en milieu aquatique
Lhabitat est linéaire
- Systématique
- échantillonnage tous les 50 mètres
- Aléatoire simple
- transformer le réseau en ligne droite, puis
choisir des endroits aléatoires le long de la
ligne - Aléatoire stratifié
- Ordres du cours deau 1er, 2e, 3e
- Habitats du cours deau fosses et rapides
réseau du cours deau
28Comment choisir les sites 4. Échantillonnage
stratifié
- Les plans stratifiés sont les plus couramment
utilisés en surveillance - Il est toujours possible de trouver de multiples
façons de stratifier la zone que lon
échantillonne - Toutefois, chaque stratification complique le
plan et, peut-être, lanalyse - Mise en garde Il ne faut stratifier quen
fonction des variables qui, selon vous, exercent
une grande incidence sur les éléments faisant
lobjet de votre surveillance
29Comment choisir les sites4. Échantillonnage
stratifié
- Avantages
- Léchantillonnage est équilibré en fonction des
principales strates - Il est facile dajouter de nouveaux points
- Désavantages
- Souvent, plus il y a de strates, plus il faut
déchantillons - Il nest pas garanti que cest la bonne
strate qui soit utilisée.
30Comment choisir les sites 5. Échantillonnage
aléatoire stratifié par tessellation
Superposer un réseau de formes reliées (p. ex des
carrés)
À lintérieur de chaque forme, choisir un lieuau
hasard
31Comment choisir les sites 5. Échantillonnage
aléatoire stratifié par tessellation
- Avantages
- Plan spatialement équilibré
- Sites aléatoirement sélectionnés
- Désavantages
- Il est difficile dajouter denouveaux points
(maisléchantillonnage aléatoiregénéralisée par
tessellationrésout ce problème).
32Autres sujets
- Contraintes
- Plans complexes
- Autocorrélation spatiale
33Accessibilité (et autres contraintes)
- Souvent, il faut considérer les contraintes
logistiques - Compromis entre représentativité et faisabilité
-
p.ex., accessibilité accepter la contrainte,
mais tenter de maximiser la représentativité
zone à 2 kmdune route
34Plans complexes
- Dans certains cas, les plans détude simples ne
conviennent pas. - Souvent, cela se produit quandla zone dintérêt
a unestructure spatiale pluscomplexe.
35Plans complexes
Consultez votre statisticien
36Autocorrélation spatialeDans quels cas les sites
sont-ils indépendants?
Hypothèse Les points déchantillonnage sont
indépendants. En dautres mots, lobservation
dune valeur à un site donné ne dépend pas des
valeurs observées à dautres sites. En
écologie, nous savons que des points voisins se
ressemblent plus que des points éloignés puisque
la distribution des organismes nest pas
uniforme. Cette notion sappelle
lautocorrélation spatiale.
37Autocorrélation spatialeDans quels cas les sites
sont-ils indépendants?
Échantillon par grappes les points
déchantillonnage peuvent ne pas être indépendants
38Autocorrélation spatialeDans quels cas les sites
sont-ils indépendants?
Nous pouvons mesurer lautocorrélation spatiale
(après le fait) Lautocorrélation est définie
entre 1 (corrélation positive parfaite) et 1
(corrélation négative parfaite) Un diagramme
dautocorrélation permet de définir la distance à
partir de laquelle les points sont considérés
comme indépendants
Autocorrelation Autocorrélation Distance
between points Distance entre les points
39Autocorrélation spatiale Quand lautocorrélation
est-elle importante?
Quand les points déchantillonnage sont
agglutinés (pas bien répartis spatialement) dans
la zone dintérêt Conséquence il est possible
de sous-estimer la réelle variabilité des
données Par conséquent, les plans spatialement
équilibrés, quil sagisse de plans
déchantillonnage systématique, stratifié ou
aléatoire par tessellation, sont privilégiés
40La conception dun plan déchantillonnage peut
être un art
- Équilibrer les compromis
- Accessibilité versus représentativité
- Stochasticité versus représentativité
- Peu de plans déchantillonnage sont parfaits la
plupart doivent légèrement contourner les règles
(p. ex., indépendance des sites) - Le truc, cest de sassurer de réduire le plus
possible le non-respect des hypothèses
41Étapes de la conception dun plan
déchantillonnage
- Définir la question à laquelle doit répondre
votre surveillance! Quelle est la variable
dintérêt? - Recueillir les meilleures données spatiales
possibles pour représenter la zone dintérêt
(p. ex., SIG, cartes). Les utiliser pour définir
les strates (dans le cas dun échantillonnage
stratifié). - Choisir un plan déchantillonnage qui tient
compte de la stochasticité et de léquilibre
spatial. - Générer les emplacements des parcelles (p. ex.,
SIG, générateurs de nombres aléatoires). Générer
plus demplacements que ce qui est nécessaire. - Vérifier les emplacements des parcelles et
sassurer quils représentent les conditions
visées (les données du SIG peuvent comporter des
erreurs). - Accepter le résultat. Ne pas jouer avec les
emplacements. Si ces derniers ne sont pas
adéquats, élaborer un système de règles pour
changer les emplacements à lavance (p. ex., 50 m
N/E/S/W).
42Partie II Analyse de puissance combien de
parcelles sont-elles nécessaires?
43Quest-ce quune analyse de puissance?
Statistique 101 puissance versus confiance
Réalité
Conclusion
44Quest-ce quune analyse de puissance?
Statistique 101 puissance versus confiance
Réalité
Conclusion
45Quest-ce quune analyse de puissance?
Statistique 101 puissance versus confiance
Réalité
Conclusion
46Quest-ce quune analyse de puissance?
Statistique 101 puissance versus confiance
Réalité
Conclusion
47Quest-ce quune analyse de puissance?
Statistique 101 puissance versus confiance
Réalité
Conclusion
48Quest-ce quune analyse de puissance?
- Puissance statistique
- Probabilité de correctement définir une tendance
- (Avoir raison daffirmer quil y a une
tendance) - Confiance statistique
- Probabilité de ne pas définir une fausse tendance
(fausse alarme) - (Avoir raison daffirmer quil ny a pas de
tendance)
49Pourquoi lanalyse de puissance est-elle utile en
surveillance?
- La surveillance consiste principalement à
détecter les tendances importantes dans le temps. - Lanalyse de puissance répond à la question
suivante
Quelle est la probabilité que le programme de
surveillance détecte des tendances importantes?
50Pourquoi lanalyse de puissance est-elle utile en
surveillance?
- Lanalyse de puissance est loutil pour
- Évaluer les projets de surveillance en vigueur
(coûts/avantages) - Élaborer des plansdéchantillonnageappropriés
pour denouveaux projetsde surveillance
51Comment réalise-t-on une analyse de puissance?
- Il faut choisir
- un plan déchantillonnage approprié
- p. ex., 10 stations déchantillonnage observées
tous les deux ans - un test statistique approprié pour détecter les
changements temporels - p. ex., régression test F
- une taille de leffet (changement minimal
décelable) - la plus faible tendance que vous voulez être en
mesure de détecter (p. ex., 8 changement/an) - un horizon prévisionnel
- p. ex., cinq ans déchantillonnage
- un niveau de confiance (normalement 80-95 )
Puissance (0100 )
52Résultats dune analyse de puissance
Une analyse de puissance peut donner un énoncé
comme suit Probabilité que le programme
déchantillonnage détecte une augmentation ou un
déclin annuel de 8 après cinq ans de
surveillance tous les deux ans, daprès un niveau
de confiance de 90
53Éléments dune analyse de puissance
Variabilité (bruit dans les données) Abondance
(la rareté rend la surveillance
difficile) Taille de léchantillon (information
cumulative) horizon prévisionnel fréquence
déchantillonnage parmi les années répétitions au
cours dune année (Note tous les échantillons
nontpas la même taille) Niveau de
confiance/test statistique
Éléments hors de notre contrôle
Éléments pouvant être contrôlés
54Considérer la variabilité
- La variabilité est souvent un cauchemar en
surveillance - Lobjectif est souvent de réduire le plus
possible la variabilité - Choisir des variables avec un rapport
signal/bruit élevé - Mise en garde ces variable peuvent être moins
sensibles au changement - Échantillonner avec moins de variabilité spatiale
- Mise en garde moins de variabilité spatiale
signifie que nous limitons les inférences
possibles. Nous aurions des résultats très
fiables qui ne seraient toutefois pas pertinentes
sur le plan écologique
55Mesure de la variabilité
Souvent, le coefficient de variation (CV) est
recommandé et utilisé comme un indicateur de la
puissance statistique
Mise en garde le CV peut être sans intérêt sil
y a une tendance dans les données
56Résultats dune analyse de puissance
57Courbe de puissance
utilisation optimale des ressources
100
utilisation efficace mais inefficiente des
ressources
Sample Power Puissance de léchantillon Sample
Size Taille de léchantillon small
petit large grand
faible rendement de linvestissement
0
58Limites dune analyse de puissance
- Lefficacité de lanalyse de puissance dépend de
la qualité des données fournies - Quelle est la pertinence du test statistique?
- Quelle est la justesse des estimations de la
variabilité et de labondance? - Lanalyse de puissancene peut répondre
auxquestions suivantes - Quel est le degré de puissance suffisant?
- Quest-ce quun changement pertinent?
59Quel est le degré de puissance suffisant?
- Aucune norme universelle
- Quest-ce qui est plus important?
- Ne pas rater une tendance?
- Puissance gt Confiance
- Signaler une fausse tendance?
- Confiance gt Puissance
- Intervalle de confiance et de puissance habituel
80-95
60Quest-ce quun changement pertinent?
Power Puissance Annual Rate of Decline Taux
annuel de déclin
taille de leffet
61Que signifie un déclin annuel de 17 ?
Comme des intérêts composés
62Quest-ce quun changement pertinent?
- Un déclin de 17 par année est évidemment
significatif - Quelle est la pertinence des déclins plus
faibles? - Pas nécessairement une décision scientifique.
Cela dépendra des objectifs de surveillance, du
budget, etc.
63Exemples danalyse de puissance
- Comparer les horizons de surveillance
- Quel changement puis-je détecter après 5 ans? 10
ans? - Comparer les stratégies de rééchantillonnage
- Fréquence déchantillonnage
- Puis-je atteindre mes objectifs en
échantillonnant tous les ans? Tous les deux ans?
Tous les cinq ans? - Formule du panel versus échantillonnage non
décalé - Devrais-je échantillonner certains sites chaque
année ou bien échantillonner tous les sites au
cours des mêmes années?
64Un nombre infini de scénarios peuvent être étudiés
Power Puissance Annual rate of change Taux
annuel de changement
65Outils pour réaliser uneanalyse de puissance
Logiciels
66Monitor
67Monitor
- http//www.mbr-pwrc.usgs.gov/software/monitor.html
- Régression linéaire.
- Spécialement conçu pour les programmes de
surveillance. - MS-DOS.
- Gratuit.
- Produit par la USGS.
68Power Calculator
69Power Calculator
- http//calculators.stat.ucla.edu/powercalc/
- 16 tests différents.
- Calculatrice en ligne.
- Gratuit.
- Simple.
- UCLA.
70GPower
71GPower
- http//www.psycho.uni-duesseldorf.de/aap/projects/
gpower/ - Test t de Student, test F, test du khi carré.
- MS-DOS.
- Gratuit.
72Systat
73Systat
- http//www.systat.com/
- Systat.
- 12 tests danalyse de puissance.
- Autres fonctionnalités incluses.
- Dans lensemble, un bon choix.
- 2 000 .
74PASS 2005
75PASS 2005
- http//www.ncss.com/
- PASS 2005.
- Intégré à NCSS.
- 98 tests danalyse de puissance!
- Facile à utiliser.
- Multiples scénarios simultanés.
- Bon format de données de sortie.
- 700 .
- Puissant en combinaison avec dautres progiciels
(p. ex., SPSS, SAS). - Bon rapport qualité/prix.
76R
77R
- http//www.r-project.org/
- Gratuit!!
- Progiciel statistique extrêmement polyvalent.
- Quelques fonctions de puissance préprogrammées.
- Capacité de programmer toutes les analyses de
puissance (analytique ou fondée sur les
simulations). - Courbe dapprentissage prononcée.
- Seul programme suffisamment polyvalent pour
effectuer des analyses complexes.
78Survol de lanalyse de puissance
- Lanalyse de puissance est un outil servant à
déterminer les exigences liées à la taille des
échantillons Combien déchantillons sont requis
chaque année? À quelle fréquence
léchantillonnage doit-il se faire? - Grand besoin de données Il faut beaucoup
dinformations pour pouvoir obtenir des résultats
utiles à partir dune analyse de puissance - variabilité dans les données
- valeurs prévues que vous observerez
- niveau de confiance
- test statistique
- taille de leffet
79À retenir
80À retenir
Largent est toujours limité
- Il faut bien examiner la conception du plan
déchantillonnage avant dinvestir dans la
surveillance. - Aucun tour de passe-passe statistique ne peut
transformer les données recueillies avec un
mauvais plan déchantillonnage en information
utile. - La plupart des problèmes de conception sont
communs dans lensemble du pays. Si vous
rencontrez un problème, il est probable que
quelquun dautre a déjà trouvé la solution.
81À retenir
Soyez critique et faites examiner votre plan de
surveillance
- Quelle est la question précise à laquelle doit
répondre la surveillance (définit la zone
dintérêt)? - Quel est le test statistique approprié à
réaliser pour répondre à ma question? - Quelle est la direction et lampleur de la
tendance que nous étudions? - Quel est le niveau derreur acceptable
(puissance et confiance)? - Comment les tailles des échantillons nécessaires
sont-ils liés à mon budget? - Nombre de ces questions relèvent de la gestion et
non de la science! Il ny a pas une seule bonne
réponse, alors vous devez trouver la solution
vous-même. Aucun guide, protocole ou cours de
formation ne vous donnera toutes les réponses.
Vous devez demander de laide.
82À retenir
Répéter et simplifier les résultats de lanalyse
- Les écosystèmes sont complexes, ouverts et
dynamiques. Nous ne pouvons jamais créer une
étude parfaitement contrôlée, exempte de biais. - Lincertitude entourant les données écologiques
(et de surveillance) est souvent vaste et
inconnue. - La meilleure façon de surmonter cette
incertitude est de répéter, répéter, répéter,
puis de simplifier vos données. - (Les données plus brutes sont moins précises,
mais plus justes!)
83À retenir
Les protocoles tiennent compte des erreurs de
mesure, mais un plan déchantillonnage de qualité
tient aussi compte des erreurs déchantillonnage
Le stade le plus critique de la mise en uvre et
de la réalisation dune étude de surveillance
nest pas la collecte, la présentation ou
linterprétation des données, mais bien la
conception du plan déchantillonnage. Un plan
rigoureux augmente lefficacité, réduit les coûts
et améliore linterprétation. (Tiré de Jones,
K.B. 1986. The Inventory and Monitoring Process.
pp. 1-10 in A.Y. Cooperrider, R.J. Boyd et H.R.
Stuart (dir. de publ.). Inventory and Monitoring
of Wildlife Habitat.)
84Remerciements
Paul Zorn Écologiste de la surveillance,
Biorégion des Grands Lacs Parcs Canada. Centre de
services de lOntario
Quelques ouvrages utiles Pollock, K.H., Nichols,
J.D., Simons, T.R., Farnsworth, G.L., Bailey,
L.L, et J.R Sauer. 2002. Large scale wildlife
monitoring studies statistical methods for
design and analysis. Environmetrics. 13
105-119. Elzinga, C.L., Salzer, D.W., Willoughby,
J.W, et J.P. Gibbs. 2001. Monitoring plant and
animal populations. Blackwell Science. Malden,
Massachusetts. Stevens, D.L. 1994. Implementation
of a national monitoring program. J. Env. Manag.
42 1-29. Stevens, D.L. 1997. Variable density
grid-based sampling designs for continuous
spatial populations. Environmetrics 8 167-195.