Title: Programmes de matrise et de doctorat en dmographie Modles de risque et de dure Cours 8 Sance du 27 m
1Programmes de maîtrise et de doctorat en
démographieModèles de risque et de duréeCours
8Séance du 27 mars 2009
- Benoît Laplante, professeur
2Plan
- Aperçu de quelques lois statistiques utilisées
dans les modèles paramétriques en temps continu - Modèles à risques proportionnels
- modèle exponentiel, de Weibull, de Gompertz.
- Autres modèles
- log-normal, log-logistique, gamma.
- Approximation de la fonction de risque à
variation non monotone au moyen de modèles à
risques proportionnels - le modèle exponentiel par morceaux.
3Aperçu de quelques lois statistiques utilisées
dans les modèles paramétriques en temps continu
4Modèles paramétriques
- Les modèles paramétriques sont des modèles
linéaires ordinaires - Contrairement au modèle semi-paramétrique de Cox,
les modèles paramétriques ont les trois éléments
dun modèle linéaire généralisé - Une composante déterministe (ou systématique)
- Une composante aléatoire représentée par une loi
statistique - Une fonction de liaison (ou de lien)
5Modèles paramétriques
- Composante aléatoire
- Loi exponentielle, de Weibull, de Gompertz,
log-normale, etc. - Composante systématique
- Fonction de liaison
6La loi exponentielle
- La loi exponentielle représente un processus de
changement détat dont le risque est constant. - La loi exponentielle na quun seul paramètre.
- On peut exprimer la loi exponentielle de
différentes manières, notamment - de manière à ce que son paramètre représente le
risque instantané (ou incidence instantanée), que
lon note ? et - de manière à ce que son paramètre représente le
temps moyen passé dans létat dorigine (la
durée moyenne), que lon note µ.
7La loi exponentielle
Dans la loi exponentielle, le temps moyen passé
dans létat dorigine (lespérance de T) est égal
à linverse multiplicatif du risque, qui, par
définition, est constant.
Dans la paramétrisation utilisée par Stata, on a
et
où a est lordonnée à lorigine ( _cons ) de
léquation dans sa version additive.
8Le modèle exponentiel
9La loi de Weibull
- La loi de Weibull représente un processus de
changement détat dont le risque varie de manière
monotone en fonction du temps - Soit il augmente en fonction du temps
- Soit il diminue en fonction du temps
- La loi de Weibull a deux paramètres
- On peut exprimer la loi de Weibull de plusieurs
manières.
10Le modèle de Weibull
Le risque varie en fonction dune constante
élevée à une puissance qui est le temps lui-même
11Le modèle de Weibull
- On peut simuler comme suit un tirage selon une
loi de Weibull de paramètres a et ?, où R
représente un nombre tiré dune loi uniforme sur
0,1. T sera la durée, c.-à-d. le temps passé
dans létat dorigine.
- La procédure de Stata qui estime le modèle de
Weibull utilise une paramétrisation qui ne permet
pas de retrouver directement les paramètres quon
utilise dans la simulation. On retrouve comme
suit les paramètres a et ? de la simulation, c
représentant le paramètre _cons de Stata.
12La loi de Gompertz
- Comme la loi de Weibull, la loi de Gompertz
représente un processus de changement détat dont
le risque varie de manière monotone en fonction
du temps - Soit il augmente en fonction du temps
- Soit il diminue en fonction du temps
- La loi de Gompertz a deux paramètres
- On peut exprimer la loi de Gompertz de plusieurs
manières
13Le modèle de Gompertz
Le risque varie en fonction du temps élevé à une
puissance qui est une constante
14Autres modèles paramétriques
- Certains modèles paramétriques permettent de
représenter des processus de changement détat où
le risque varie de manière non monotone, c.-à-d.
des processus où - le risque augmente puis diminue ou bien
- le risque diminue puis augmente.
- Parmi ces modèles on trouve
- Le modèle log-normal
- Le modèle log-logistique
- Le modèle Gamma
15Autres modèles paramétriques
- Ces modèles utilisent les lois statistiques qui
leur donnent leur nom, comme cest le cas des
autres modèles que nous avons vus. - Ils ont lavantage de permettre de représenter
des risques qui varient de manière non monotone - Ils ont le désavantage de ne pas être
proportionnels au sens où le sont le modèle
de Cox et les autres modèles que nous avons vus.
16Choix du modèle
- Paramétrique ou semi-paramétrique
- Le choix se fait selon limportance que lon
accorde à lestimation du risque lui-même - Si on ne sintéresse quà leffet des variables
indépendantes, le modèles semi-paramétrique est
idéal. - Si on sintéresse aussi au risque lui-même, il
est préférable dutiliser un modèle paramétrique.
17Choix du modèle
- Entre différents modèles paramétriques
- Se fait en tenant compte
- de la connaissance que lon a du processus que
lon étudie - de lajustement
- ou des deux.
- Entre deux ou plusieurs modèles gigognes (ou
emboîtés ) - Les tests fondés sur le khi-deux,
- comme le test de Wald ou
- le test du rapport de vraisemblance, c.-à-d. -2
ln(L) qui suit une loi du khi-deux. - Dans les autres cas
- Le critère dAkaike , - 2 ln(L) - 2k,
- où k est le nombre des paramètres du modèle.
18Le modèle exponentiel par parties
- Le modèle le plus versatile est le modèle
exponentiel par parties - Le modèle exponentiel par parties nest rien
dautre quun usage intelligent du modèle
exponentiel - dans lequel on découpe le temps en intervalles
- de manière à estimer un risque constant dans
chacun de ces intervalles - de sorte que le risque se trouve à pouvoir varier
dun intervalle à lautre.
19Le modèle exponentiel par parties
- Comme lorsquon utilise la régression logistique
pour estimer un modèle de risque en temps
discret, on élimine lordonnée à lorigine et on
place dans léquation une variable muette pour
chacun des intervalles - On obtient ainsi un estimé du risque de base pour
chacun des intervalles. - Selon la valeur du coefficient qui est associé à
chacune, les variables indépendantes augmenteront
ou diminueront le risque dans la même proportion
pour chacun des intervalles.
20Le modèle exponentiel par parties
- Attention!
- Le modèle exponentiel par parties nest pas un
modèle en temps discret, mais bien un modèle en
temps continu. - On peut changer détat à tout instant.
- Les intervalles ne servent quà modéliser la
variation du risque en fonction du temps.