Skip to content

Commit 8d404a3

Browse files
committed
Correction leverage and Cook distance
1 parent f30b6d8 commit 8d404a3

File tree

1 file changed

+27
-2
lines changed

1 file changed

+27
-2
lines changed

inst/tutorials/B01Lb_residuals/B01Lb_residuals.Rmd

Lines changed: 27 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -16,6 +16,31 @@ runtime: shiny_prerendered
1616
```{r setup, include=FALSE}
1717
BioDataScience2::learnr_setup()
1818
SciViews::R("model", lang = "fr")
19+
# Required for RSConnect
20+
# SciViews::R
21+
library(rlang)
22+
library(data.table)
23+
library(ggplot2)
24+
library(tibble)
25+
library(tidyr)
26+
library(dplyr)
27+
library(dtplyr)
28+
library(broom)
29+
library(forcats)
30+
library(collapse)
31+
library(fs)
32+
library(svMisc)
33+
library(svBase)
34+
library(svFlow)
35+
library(data.io)
36+
library(chart)
37+
library(tabularise)
38+
library(SciViews)
39+
# model
40+
library(modelit)
41+
# ... more
42+
library(testthat)
43+
library(equatags)
1944
2045
rice <- read("rice", package = "BioDataScience2")
2146
rice <- labelise(rice,
@@ -227,7 +252,7 @@ Vous avez toujours à disposition l'objet `rice_lm`. Construisez quatre graphiqu
227252
- les résidus par rapport aux valeurs prédites de `area`,
228253
- la distribution des résidus via un graphique quantile-quantile,
229254
- l'échelle et la position position des résidus par rapport à `area` et
230-
- l'a distance de Cook des résidus'effet de levier des observations.
255+
- l'effet de levier des observations.
231256

232257
```{r resid_h2, exercise=TRUE}
233258
# Résidus en fonction des valeurs prédites de area
@@ -276,7 +301,7 @@ question("Sélectionnez parmi les éléments suivants les affirmations vraies.",
276301
answer("Les résidus sont contenus et se répartissent de manière équilibrée et linéaire.", correct = TRUE, message = "**Graphique1** La répartition des résidus sur le premier graphique permet d'observer sur l'axe des ordonnées des valeurs entre - 2000 et +2000 pour les résidus, par rapport à un plage plus élevée pour les valeurs prédites de 10000 à 17000. Les résidus sont donc, comparativement, raisonnables. La répartition des résidus est homogène autour de l'axe horizontal à zéro et il n'y a pas de dérive non linéaire (la courbe de tendance générale en bleu est pratiquement linéaire et reste proche de zéro)."),
277302
answer("Les résidus suivent une distribution Normale.", correct = TRUE, message = "<br/><br/>**Graphique 2** Le graphique quantile-quantile permet de vérifier si la distribution des résidus est Normale. On observe que les résidus les plus faibles et les plus élevés ne s'éloigne de la droite de référence que très légèrement. La distribution des résidus est donc Normale ou proche de la Normale."),
278303
answer("Il y a homoscédasticité des résidus.", correct = TRUE, message = "<br/><br/>**Graphique 3** La position et l'échelle des résidus sur le graphique 3, en représentant leur valeur absolue sur l'axe des ordonnées, superpose les résidus négatifs sur les résidus positifs. Cette représentation est la meilleure pour vérifier l'homoscédasticité, c'est-à-dire, la variance homogène en fonction des valeurs prédites sur l'axe des abscisses. La courbe de tendance en bleu est horizontale, ce qui le confirme. Nous avons bien ici homoscédasticité des résidus."),
279-
answer("Aucune valeur n'influence trop fortement la régression linéaire.", correct = TRUE, message = "<br/><br/>**Graphique 4** La régression linéaire par les moindres carrés est très influencée par les valeurs extrêmes. L'effet de levier quantifie l'impact de chaque observation sur la position de la droite de régression. La distance de Cook (taille des points sur le quatrième graphique) mets en évidence les valeurs extrêmes. Ici, le graphique 4 présente un comportement sain du point de vue des observations potentiellement influentes ou extrêmes."),
304+
answer("Aucune valeur n'influence trop fortement la régression linéaire.", correct = TRUE, message = "<br/><br/>**Graphique 4** La régression linéaire par les moindres carrés est très influencée par les valeurs extrêmes. L'effet de levier compare les distances des points entres eux sur l'axe des abscisses et vérifie q'il n'y en a pas trop éloigné des autres, la distance de Cook (taille des points sur le quatrième graphique) quantifie l'impact de chaque observation sur la position de la droite de régression. Ici, le graphique 4 présente un comportement sain du point de vue des observations potentiellement influentes ou extrêmes."),
280305
correct = "Vous avez sélectionné les affirmations correctes.",
281306
incorrect = "Oups, il semble que vous avez mal interpété les graphiques ci-dessus. Observez bien, relisez la section correspondante du cours et retentez l'exercice.",
282307
allow_retry = TRUE, random_answer_order = FALSE,

0 commit comments

Comments
 (0)