R - PowerPoint PPT Presentation

About This Presentation
Title:

R

Description:

Les graphiques peuvent tre utiles au tout d but d'une analyse afin de nous ... sont des outils qui sont utilis s apr s un ajustement, afin de cerner s'il ... – PowerPoint PPT presentation

Number of Views:36
Avg rating:3.0/5.0
Slides: 16
Provided by: pierred3
Category:
Tags: ajustement

less

Transcript and Presenter's Notes

Title: R


1
Régression linéaire (STT-2400)
  • Section 7
  • Diagnostiques de régression
  • les résidus
  • Version 28 décembre 2007

2
Introduction
  • Les graphiques peuvent être utiles au tout début
    dune analyse afin de nous orienter dans
    lajustement dun modèle de régression.
  • Les diagnostiques de régression sont des outils
    qui sont utilisés après un ajustement, afin de
    cerner sil semble vraisemblable que la fonction
    moyenne et les hypothèses de Gauss-Markov sont
    compatibles avec les données.
  • Les outils de base sont les résidus, que lon a
    déjà définis.
  • Il existe dautres types de résidus (ex les
    résidus standardisés, les résidus studentizés).

3
Observations influentes
  • Une question dimportance concerne linfluence
    dune observation particulière sur lajustement
    (ex estimateurs des coefficients, tests
    dhypothèses).
  • Si une observation particulière peut changer
    significativement les conclusions dune analyse,
    on dira que cette observation est influente.
  • Nous introduirons des mesures de distances et des
    mesures de levier afin de quantifier linfluence
    dune observation.
  • Une question reliée est la recherche de valeurs
    aberrantes.

4
Matrice  chapeau 
  • On considère le modèle (avec b0)
  • Lestimateur OLS est
  • On peut écrire
  • La matrice  chapeau 

5
Matrice  chapeau  (suite)
  • La matrice  chapeau  transforme le vecteur
    correspondant à la variable réponse en le vecteur
    des valeurs prédites .
  • On a déjà vu

6
Quelques propriétés de la matrice  chapeau 
  • La matrice  chapeau  est symétrique,
    idempotente et satisfait les propriétés
    suivantes
  • On rappelle que la matrice  chapeau  est une
    matrice de projection dans lespace colonne de la
    matrice de design.

7
Autres propriétés de la matrice  chapeau 
  • Rappel
  • La matrice de design
  • Ainsi
  • Prenant la trace de H

8
Matrice  chapeau  et leviers
  • On rappelle les deux relations suivantes
  • On déduit que les hii satisfont les relations
  • Remarque Ce ne sont pas les meilleures bornes.
    Il peut être montré que
  • Le nombre r dans la relation précédente est le
    nombre de lignes de la matrice de design
    identiques à xi.

9
Interprétation des hii
  • Si un hii est grand et proche de un, il en
    ressort que la variance du ième résidu sera
    proche de zéro.
  • Si il ressort que le ième résidu est une v.a.
    dégénérée, essentiellement une constante.
  • Or
  • Ainsi si hii approche un, le ième résidu sera
    proche de zéro, quelque soit la valeur de la
    variable réponse pour lobservation i. On dit que
    hii est un levier de lobservation i.

10
Les leviers comme des mesures de distance
  • Il faut retenir quhabituellement, si une
    observation possède un grand hii, alors le
    préviseur xi sera inhabituel. Dans un modèle
    avec ordonnée à lorigine, il peut être montré
    que
  • La matrice Z est celle du modèle centré, et
  • Le second terme du membre de droite de la
    relation précédente est léquation dun
    ellipsoïde centré à

11
Seuils recommandés pour les leviers
  • On rappelle la relation
  • Compte tenu du résultat précédent, Belsey, Kuh
    et Welsch (1980, p.17), suggèrent que chaque
    observation ayant un levier supérieur à 2(p1)/n
    devrait être déclarée influente et examinée
    attentivement.

12
Comportement des résidus lorsque le modèle est
correct
  • Graphique des résidus versus les valeurs
    prédites on devrait retrouver un  graphique
    nul  (moyenne constante de zéro, variance
    constante, pas de points isolés).
  • Graphique des résidus versus les préviseurs (ou
    des combinaisons linéaires des préviseurs) on
    devrait retrouver des  graphiques nuls .
  • Remarques Puisque
    même lorsque le modèle est correct,
    la fonction variance basée sur les résidus nest
    jamais parfaitement constante. De plus, les
    résidus sont corrélés, mais cette corrélation est
    habituellement non importante et non visible dans
    les graphiques de résidus.

13
Comportement des résidus lorsque le modèle nest
pas correct
  • De manière générale, si le modèle ajusté repose
    sur des hypothèses qui ne sont pas justes, on
    sattend à retrouver des graphiques qui ne seront
    pas des  graphiques nuls .
  • En régression linéaire simple, il est facile de
    distinguer les situations où la variance nest
    pas constante des situations où la fonction
    moyenne est mal spécifiée. Il faut rester
    prudent en régression linéaire multiple, car un
    motif dans le graphique des résidus ne correspond
    pas nécessairement à un problème particulier dans
    les hypothèses.
  • Un  graphique non nul  indique quil y a un
    problème, mais ne dit pas nécessairement la
    source du problème.

14
Graphique des résidus en régression linéaire
simple et multiple
  • Les graphiques des résidus dans un contexte de
    régression linéaire multiple peuvent
    sinterpréter comme en régression linéaire simple
    si deux conditions sont satisfaites
  • Les préviseurs doivent être reliés de manière
    linéaire, au moins approximativement
  • Pour une certaine fonction g, la fonction moyenne
    doit être de la forme

15
Diagnostics de régression avec SAS
  • Avec la procédure PROC REG, la ligne de commande
  • MODEL Y X1 X2 Xp / R P INFLUENCE
  • Loption  / R  demande une analyse des résidus.
  • Loption  / P  demande le calcul des valeurs
    prédites.
  • Loption  / INFLUENCE  calcule (entre autres)
    les leviers.
Write a Comment
User Comments (0)
About PowerShow.com