Title: Essais Randomiss en Clusters ERC Place grandissante en Biostatistique
1Essais Randomisés en Clusters(ERC)Place
grandissante en BiostatistiqueÂ
http//www.valdorel.fnclcc.fr/
- Bruno Pereira
- CRLC Val dAurelle Unité de Biostatistiques
- bruno.pereira_at_valdorel.fnclcc.fr
2Sommaire (1)
- Introduction
- Exemple
- Pourquoi considérer des essais randomisés en
clusters? - Place grandissante en Biostatistique et
Epidémiologie - Avantages et inconvénients
- Stratégie Expérimentale
- Ethique et biais
- ICC et calcul du nombre de sujets nécessaires
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
3Sommaire (2)
- Analyse Statistique Cas où la variable réponse
est binaire - Unité danalyse
- Analyse au niveau individuel
- Modèles mixtes
- Modèles marginaux
- En pratique
- Travaux méthodologiques et questions en suspens
- MG Tabac LR ERC longitudinal
- Lorsque les clusters sont peu nombreux ou petits
- Analyse Statistique Mesure des changements de
scores - Les autres problématiques dactualité
- Workshop Cluster Randomised Prevention Trials in
Cancer Research
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
4INTRODUCTION
http//www.valdorel.fnclcc.fr/
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
5MG Tabac LR Contexte
- Mise en place dactions de santé publique dans
le but de réduire efficacement le tabagisme ? Une
des activités majeures proposées par lOMS - En France
- 1 décès sur 10 est dû au tabac ? Problème majeur
de santé publique - Plus de 58 des fumeurs disent vouloir arrêter
de fumer - Rôle des médecins généralistes
- Relation particulière médecin - patient
- Opportunité de jouer un rôle essentiel dans
laide à larrêt du tabac.
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
6MG Tabac LR Objectifs
- Médicaux
- Montrer quun programme de santé publique, basé
sur une formation continue adaptée des médecins
généralistes (MG) peut - Modifier leurs pratiques daide à larrêt
- Augmenter les taux de sevrage tabagique de leurs
patients - Obtenir des facteurs prédictifs de larrêt du
tabac à 12 mois - Statistiques
- Quel est la meilleure stratégie expérimentale
pour cet essai? - Les essais randomisés en clusters au cur du
problème? - Quelles méthodes choisir pour lanalyse
statistique?
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
7MG Tabac LRProcédure de recrutement
Groupe dintervention
Groupe Contrôle
M Fumeurs inclus
Randomisation individuelle
8MG Tabac LRProcédure de recrutement
9MG Tabac LRProcédure de recrutement
10MG Tabac LRProcédure de recrutement
11MG Tabac LRProcédure dinclusion
12ERC Définitions
- Définition
- Essai randomisé dans lequel les unités sociales
sont assignées aléatoirement à différents groupes
dintervention - Intérêt
- Mesurer la capacité de changement de santé
pendant lintervention - Lien avec les études longitudinales
- Plusieurs observations proviennent dun même
sujet ? Structure de groupe apparaît Ã
lintérieur de léchantillon et donc une
corrélation entre les mesures - Prise en compte de leffet cluster ? Tendance Ã
la similarité à lintérieur des clusters
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
13Pourquoi considérer des essais randomisés en
clusters?
- Lintervention doit être faite naturellement au
niveau du cluster - Faisabilité et acceptabilité, facilités
administratives - Considérations éthiques
- Obtenir la coopération  dinvestigateursÂ
- Agir sur ces investigateurs
- Peut-être plus facile et moins coûteux Ã
organiser - Minimisation du biais de contamination
- Mais manque de puissance (comparé aux essais
randomisés classiques)
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
14Place grandissante en Biostatistiques et
Epidémiologie
Bland JM. Cluster randomised trials in the
medical literature two bibliometric surveys. BMC
Med Res Methodol 2004
15Place grandissante en Biostatistiques et
Epidémiologie
- Etudes multicentriques
- Lors de la planification dun essai, la
randomisation est stratifiée par centre - ? Importance pour le calcul du nombre de sujets
nécessaire - Lors de lanalyse des données, les différences
entre centres sont prises en compte dans
lestimation de leffet du traitement - Utilisation de modèles mixtes Estimation peut
savérer complexe - De nombreuses questions restent en suspens
- Intérêt important pour la mise en place dessais
dintervention réalisés à grande échelle
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
16Avantages et Inconvénients
Cornfield (1978) Randomization by cluster
accompanied by an analysis appropriate to
randomization by individual is an exercise in
self deception, however, and should be
discouraged. Susser (1995) ...we should not
abandon community trials but should gather the
knowledge necessary to refine them.
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
17STRATEGIE EXPERIMENTALE
http//www.valdorel.fnclcc.fr/
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
18Ethique et Biais
Contrairement aux essais où lon randomise chaque
sujet individuellement, la randomisation par
clusters conduit de façon quasi systématique Ã
une situation où la randomisation est antérieure
à linclusion des sujets. En pratique, on
commence par randomiser les clusters, charge
ensuite à chaque responsable de cluster dinclure
les sujets. Linclusion des sujets se fait
alors en ayant connaissance du bras
dintervention dans lequel ils seront inclus.
Cette situation est potentiellement source de
biais et la comparaison a posteriori des groupes
issus de la randomisation est alors dautant plus
délicate.
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
19MG Tabac LRCaractéristiques des 1075 sujets
20Nombre de sujets nécessairesContre-exemple
- Supposons que ? et ? soient fixés respectivement
à 0.05 et 0.20 - Taux de bonnes réponses 65
- Taux espéré (en fin daction) 75
- Considérons que nj 25 sujets par cluster
- Essai randomisé individuellement donne n 700
- 700/25 28 clusters
- FAUX!
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
21Coefficient ICC
- Coefficient de corrélation intra-cluster estimé
par - Mesure le degré de similarité (homogénéité)
intra-cluster ? Effet cluster - La valeur de lICC est généralement importante
pour des petits clusters - Pour un ICC relativement petit, leffet cluster
peut tout de même être important si un grand
nombre de sujets est inclus
Variance inter-cluster
Variance intra-cluster
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
22Nombre de sujets nécessaires
- La taille (totale) de léchantillon requise pour
un essai randomisé en clusters est obtenue en
multipliant - La taille (totale) dans le cas dun essai
randomisé individuellement et - Leffet design (IF) ou facteur dinflation de la
variance (1965) - Avec n la taille (moyenne) de chaque cluster
- On suppose donc que les clusters ont la même
taille ce qui nest pas le cas dans la réalité
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
23Nombre de sujets NécessairesExemple Proportions
- H0 ?e ? ?s
- H1 ?e gt ?s
- Probabilité de succès
- ?s traitement standard
- ?e traitement expérimental
- Le nombre de patients dans chaque groupe de
traitement est donné par - ns(Z1-?/2 Z1-? )² (?s (1-?s) ?e (1-?e)) /
?s - ?e²
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
24Nombre de sujets nécessairesContre-exemple
- Supposons que ? et ? sont fixés respectivement Ã
0.05 et 0.20 - Taux de bonnes réponses 65
- Taux espéré 75
- nj 25 sujets par cluster
- Essai randomisé individuellement donne n 7000
- 700/25 28 clusters
- FAUX!
- En fait, il faut inclure 70 clusters et 1750
sujets
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
25ANALYSE STATISTIQUECas où la variable réponse
est binaire
http//www.valdorel.fnclcc.fr/
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
26Réduction du tabagisme
- Données obtenues dans une étude évaluant leffet
dune intervention en milieu scolaire dans la
réduction du tabagisme (Murray et al., 1989) - 48 écoles réparties dans 3 bras dintervention
et 1 contrôle - Smoke Free Generation (SFG) vs Existing
Curriculum (EC) - Proportion denfants qui admettent fumer
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
27Réduction du tabagisme
28Réduction du tabagisme
A-t-on un effet de lintervention?
- SFG 58/1341 0.043
- EC 91/1479 0.062
- Test du Chi 2 ? p 0.03 (OR0.69)
- Méthode invalide car ignore un éventuel effet
cluster - p0.18 avec Test du Chi 2 adapté aux ERC
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
29Unité danalyse
- Lanalyse doit tenir compte de la corrélation
intra-cluster - Analyse au niveau du cluster
- Approche la plus simple car unité de
randomisation est la même que lunité de
lanalyse - Techniques habituelles (Test de Student pour
échantillons indépendants, approches non
paramétriques comme Man-Whitney) - Analyse pondérée si taille des clusters très
variable - Analyses moins puissantes
- Analyse au niveau individuel
- Nécessite un nombre élevé de clusters
- Statiques descriptives adaptées (Test du Chi2
adapté notamment) - Modèles marginaux et Modèles mixtes (GLMM)
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
30Analyse au niveau individuelAnalyse Statistique
- Modèles marginaux
- Modèles Linéaires Généralisés Mixtes Modèles Ã
effets aléatoires
Où
Et
Avec
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
31Estimation Modèles Marginaux (1)
- Approche GEE
- Méthode semi-paramétrique qui ne fait intervenir
que les lois marginales ou les deux premiers
moments marginaux des variables - Extension de la quasi-vraisemblance aux données
corrélées - Approche par Quasi-Vraisemblance
- La log-quasi-vraisemblance
- où
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
32EstimationModèles Marginaux (2)
- Estimation par quasi-vraisemblance
- Où et
- Généralisation proposée par Liang et Zeger
- où
- où
33Estimation Modèles à Effets Aléatoires
- Quadrature de Gauss-Hermitte
- Quadrature Adaptative
- Quasi-vraisemblance pénalisée
- Autres Alternatives Algorithme MC-EM par
exemple - Approches conditionnelles
- Approches par linéarisation méthodes de Schall,
GAR, EK - Approches fondées sur les approximations de
Laplace
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
34Méthodes destimation Comparaison
35EN PRATIQUE
http//www.valdorel.fnclcc.fr/
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
36Logiciels et quelques procédures
- Excel
- STATA (sampsi)
- Sampsize (Université dAberdeen)
- http//www.abdn.ac.uk/hsru/epp/cluster.shtml
-
- Macros (S-Plus) dans le cas de clusters de
tailles différentes
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
37Logiciels et quelques procédures
- STATA (Commandes xt et package GLLAMM)
- xtgee xtmixed, xtlogit, xtreg,
- SAS
- genmod glimmix, mixed, nlmixed
- S-Plus
- Package Oswald nlme
-
- Logiciels de Hedeker (http//tigger.uic.edu/7Ehe
deker/more.html) - MIXREG, MIXOR, MIXNO
- ? SUDAAN, MLwiN, HLM5, Winbugs, Acluster
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
38TRAVAUX METHODOLOGIQUESetQUESTIONS EN SUSPENS
http//www.valdorel.fnclcc.fr/
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
39MG Tabac LR ERC Longitudinal
- Emploi des GLMM
- Utilisation de modèles multi-états
Avec
Et
Petit Fumeur
Fumeur
- 9 visites 4 dossiers
- 13 données longitudinales pour chaque sujet
- Données manquantes!!
Non Fumeur
40Lorsque les clusters sont Peu nombreux Exemple
2 Dépistage du Cancer de la bouche
R. Sankar, Lancet 2005, 3651927-33
41Vivre avec le Soleil
- Objectif
- Montrer quune démarche déducation à la santé
entraîne une progression des connaissances et une
modification des attitudes et des comportements Ã
la fois des élèves et des enseignants en matière
de prévention des risques pour la santé liés aux
surexpositions solaires.
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
42Vivre avec le SoleilProcédure dinclusion
43Mesure de changement de scoresHypothèses
Supposons que les clusters ont tous la même
taille
Variable post-test
Variable pré-test
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
44modèles
5 modèles...
Scores post-test
Changement de scores
Extensions de lanalyse de covariance
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
45Les autres Problématiques dActualité
- Les analyses statistiques développées
peuvent-elles être utilisées aussi naturellement
si lon est face à un jeu de données avec -
- De nombreuses valeurs manquantes
- De nombreux cas de patients dits overlapping
- (patients faisant partie de plusieurs bras
dintervention simultanément) ? - Que faire quand on désire analyser deux
variables réponses en même temps ? - Que se passe-t-il si ces variables sont de
nature différente (discrète et continue) ? - Et si les covariables sont dépendantes du temps ?
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
46WorkshopCluster Randomised Prevention Trials
in Cancer ResearchMontpellier, Mai 2007
http//www.valdorel.fnclcc.fr/
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
47intervenants
- Pr Allan Donner, London, Canada
- Pr Serge Briançon, Vandoeuvre les Nancy, France
- Dr Sandra Eldridge, London, Angleterre
- Dr Bruno Giraudeau, Tours, France
- Dr Lydia Guittet, Caen, France
- Bruno Pereira, Montpellier, France
- Dr Christophe Rogier, Marseille, France
- Dr Rengaswamy Sankaranarayanan, Lyon, France
- Sabrina Tessier, Vandoeuvre les Nancy, France
B Pereira, Unité de Biostatistiques
Angers, 24 Mai 2007
48Références
- Cornfield J (1978) Randomization by group A
formal analysis. American Journal of
Epidemiology, 108(2), 100-102 - Eldridge SM, Ashby D and Kerry S (2006) Sample
size for cluster randomized trials effect of
coefficient of variation of cluster size and
analysis method. International Journal of
Epidemiology - Donner A (1989) Statistical methods in
ophthalmology An adjusted chi-square approach.
Biometrics, 45, 605-611 - Donner A and Klar N (2000) Design and Analysis of
Cluster Randomization Trials in Health Research,
Arnold, London - Klar N and Darlington G (2004) Methods for
modeling change in cluster randomization trials.
Statistics in Medicine, 23, 2341-2357 - Murray D, Hannan P and Zucker D (1989) Analysis
issues in school-based health promotion studies.
Health Education, 73, 13-22 - Rao JN and Scott AJ (1992) A simple method for
the analysis of clustered binary data.
Biometrics, 48, 577-585