You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
La moyenne est un descripteur très employé pour résumer l'information. Il est très courant de comparer un moyenne à une valeurs de référence ou deux moyennes entre elles. Dans votre carrière scientifique, il est indispensable de maîtriser la moyenne et ses subtilités.
32
+
La moyenne est un descripteur statistique très employé pour résumer l'information. Il est très courant de comparer une moyenne à une valeur de référence ou deux moyennes entre elles. Dans votre future carrière scientifique, il sera indispensable de bien maîtriser les subtilités dans l'utilisation de la moyenne. Ce tutoriel vise à :
33
33
34
-
- Être capable de calculer la moyenne, l'écart-type et la variance
34
+
- Être capable de calculer la moyenne, l'écart-type et la variance dans R
35
+
36
+
- Réaliser un test *t* de Student dans R
35
37
36
38
- Comprendre le test *t* de Student et être capable de l'utiliser pour résoudre des questions pratiques en biologie
37
39
38
-
Vous devez maîtrise le calcul de probabilités ([module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/proba.html)) et avoir compris la logique d'un test d'hypothèse telle que nous l'avons développée dans le module 8](<https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/chi2.html>) relatif au test du Chi^2^. Enfin, vous devez avoir vu la première partie du [module 9](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/moyenne.html) avant d'aborder ces exercices d'auto-évaluation de vos acquis.
40
+
Vous devez maîtriser le calcul de probabilités ([module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2021/proba.html)) et avoir compris la logique d'un test d'hypothèse telle que nous l'avons développée dans le module 8](<https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2021/chi2.html>) relatif au test du Chi^2^. Enfin, vous devez avoir vu la première partie du [module 9](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2021/moyenne.html) avant d'aborder ces exercices d'auto-évaluation de vos acquis.
39
41
40
42
## Moyenne
41
43
42
-
Commençons par revoir les bases. Un échantillon représentatif d'une population peut être décrit par plusieurs descripteurs statistiques comme la moyenne, l'écart-type ou la variance. La moyenne de la variable $y$ se note $\bar{y}$ qui se dit "y barre". Son calcul se fait comme ceci :
44
+
Commençons par revoir les bases. Un échantillon peut être décrit par plusieurs descripteurs statistiques comme la moyenne, l'écart-type ou la variance. La moyenne de la variable $y$ se note $\bar{y}$ (qui se lit "y barre"). Son calcul se fait comme ceci :
43
45
44
46
$$\bar{y} = \sum_{i = 1}^n \frac{{y_i}}{n}$$
45
47
@@ -116,20 +118,20 @@ mean(vec2, na.rm = TRUE)
116
118
```
117
119
118
120
```{r mean2_h3-check}
119
-
grade_code("Retenez que, dans R, pour toute fonction qui propose un argument na.rm (toujours mis à FALSE par défaut), si vous indiquez TRUE, vous souhaitez d'abord éliminer les valeurs manquantes afin d'estimer le résultat sur les données observées restantes.")
121
+
grade_code("Retenez que, dans R, toute fonction qui a un argument na.rm= (toujours mis à FALSE par défaut), si vous indiquez TRUE, vous souhaitez d'abord éliminer les valeurs manquantes afin d'estimer le résultat sur les données observées restantes.")
120
122
```
121
123
122
-
### Ecart-type
124
+
### Écart-type
123
125
124
-
Un second descripteur d'un échantillon est l'écart-type qui est calculé via l'équation suivante :
126
+
Un second descripteur d'un échantillon est l'écart-type $s_y$ qui est calculé via l'équation suivante :
125
127
126
128
$$s_y = \sqrt {s_y^2}$$
127
129
128
130
L'écart-type est la racine carré de la variance $s_y^2$ de la variable $y$ qui est également un descripteur statistique de l'échantillon. La variance de l'échantillon est calculée comme suit :
Il existe également des fonctions spécialisées dans R afin de calculer la variance et l'écart-type. Calculez l'écart-type du vecteur `vec3`
134
+
Il existe également des fonctions spécialisées dans R afin de calculer la variance et l'écart-type. Calculez l'écart-type du vecteur `vec3`.
133
135
134
136
```{r, echo=TRUE}
135
137
vec3 <- c(22, 18, 4, 24, 34, 3, 9)
@@ -153,18 +155,18 @@ sd(vec3)
153
155
```
154
156
155
157
```{r sd1_h2-check}
156
-
grade_code("Écart type se dit \"standard deviation\" en anglais, d'où le nom sd() de la fonction en abbrégé. Pour la variance, il s'agit de la fonction var(). Ces deux fonctions utilisent aussi l'argument na.rm si nécessaire.")
158
+
grade_code("Écart type se dit \"standard deviation\" en anglais, d'où le nom sd() de la fonction en abbrégé. Pour la variance, il s'agit de la fonction var(). Ces deux fonctions utilisent aussi l'argument na.rm= si nécessaire.")
157
159
```
158
160
159
161
### Coefficient de variation
160
162
161
-
Un autre descripteur est le coefficient de variation de l'échantillon qui est calculé via
163
+
Un autre descripteur est le coefficient de variation de l'échantillon qui est calculé via :
162
164
163
165
$$cv_y \ (\%) = \frac{s_y}{\bar y} \times 100$$
164
166
165
-
L'avantage du coefficient de variation est qu'il donne une idée de la dispersion des données de manière *relative*. En effet, la variance et l'écart type seront d'autant plus grands que la moyenne est grande, pour une dispersion relative équivalente. Par contre, le coefficient de variation mets à l'échelle, en quelque sorte l'écart type. Son expression en pourcentage accentue encore cette sensation d'avoir une estimation de la dispersion des données exprimée par rapport à une valeur de référence (ici la moyenne).
167
+
L'avantage du coefficient de variation est qu'il donne une idée de la dispersion des données de manière *relative*. En effet, la variance et l'écart type seront d'autant plus grands que la moyenne est grande, pour une dispersion relative équivalente. Par contre, le coefficient de variation met à l'échelle, en quelque sorte l'écart type. Son expression en pourcentage accentue encore cette sensation d'avoir une estimation de la dispersion des données exprimée par rapport à une valeur de référence (ici la moyenne).
166
168
167
-
Calculez le coefficient de variation du vecteur `vec3` (il n'existe pas de fonction dédiée dans R), combinez les fonctions vues jusqu'ici pour y arriver.
169
+
Calculez le coefficient de variation du vecteur `vec3` (il n'existe pas de fonction dédiée dans R, combinez les fonctions vues jusqu'ici pour y arriver).
168
170
169
171
```{r, echo=TRUE}
170
172
vec3 <- c(22, 18, 4, 24, 34, 3, 9)
@@ -189,12 +191,12 @@ sd(vec3) / mean(vec3) * 100
189
191
190
192
```{r cv1_h2-check}
191
193
grade_result(
192
-
pass_if(~ identical(.result, (sd(vec3)/mean(vec3))*100), "Vous avez judicieusement utilisé la moyenne et l'écart-type pour obtenir le coefficient de variation."),
194
+
pass_if(~ identical(.result, (sd(vec3)/mean(vec3))*100), "Vous avez judicieusement combiné le calcul de la moyenne et de l'écart-type dans une instruction R pour obtenir le coefficient de variation."),
193
195
fail_if(~ TRUE, "Votre calcul n'est pas le bon. Commencez par déterminer la moyenne et l'écart-type de ce vecteur. N'oubliez pas de multiplier votre réponse par 100.")
194
196
)
195
197
```
196
198
197
-
Ces premiers exercices vous ont permis de revoir les principaux descripteurs central (pour la moyenne) et de dispersion des données (pour l'écart type, la variance et le coefficient de dispersion). Sur base de ces descripteurs, nous allons maintenant élaborer un test d'hypothèse qui se focalise sur la moyenne.
199
+
Ces premiers exercices vous ont permis de revoir les principaux descripteurs centraux (pour la moyenne) et de dispersion des données (pour l'écart type, la variance et le coefficient de variation). Sur base de ces descripteurs, nous allons maintenant élaborer un test d'hypothèse qui se focalise sur la moyenne.
198
200
199
201
## Indice de masse corporelle
200
202
@@ -239,18 +241,18 @@ head(biometry)
239
241
```
240
242
241
243
```{r bio_filt_h2-check}
242
-
grade_code("Bien joué ! Vous avez proposé un filtre de votre tableau de données initial.", "Oups, il semble que vous avez mal utilisé vos conditions.")
244
+
grade_code("Bien joué ! Vous avez filtré votre tableau de données initial pour ne conserver que les cas correspondant aux critères choisis.", "Oups, il semble que vous avez mal défini vos conditions pour filtrer le tableau de départ.")
243
245
```
244
246
245
-
Vos supérieurs souhaitent savoir si il y a une différence significative de l'IMC entre les hommes et les femmes. La variable `bmi` est calculée pour vous.
247
+
Vous souhaitez déterminer s'il y a une différence significative de l'IMC entre les hommes et les femmes. La variable `bmi` est calculée pour vous.
grade_code("Vous avez proposé un tableau résumant l'information. Vous avez calculé la moyenne et l'écart-type de l'IMC en fonction du genre. Maintenant, nous voulons déterminer si ces moyennes diffèrent de manière significative ou non en fonction du genre.", "Analysez avec attention le tableau que vous devez obtenir. Quelle est la variable dont vous devez déterminer la moyenne et l'écart-type ?")
285
+
grade_code("Excellent ! Maintenant, nous voulons déterminer si ces moyennes diffèrent de manière significative ou non au seuil alpha de 5% en fonction du genre.", "Votre tableau ne correspond pas. Relisez la question attentivement. Quelle est la variable dont vous devez déterminer la moyenne et l'écart-type ?")
284
286
```
285
287
286
-
Vous devez à présent comparer l'indice de masse corporelle entre les hommes et les femmes. Utilisez un test t de Student bilatéral et de variance similaire. Vous devez fixer votre seuil $\alpha$ à 0.05.
288
+
Vous devez à présent comparer l'indice de masse corporelle entre les hommes et les femmes. Utilisez un test *t* de Student bilatéral pour des sous-populations considérées de variances similaires. Vous devez fixer votre seuil $\alpha$ à 0.05.
287
289
288
290
💬 **Un snippet peut vous aider à réaliser cet exercice `.hmttestindep`.**
grade_code("Vous avez su compléter la fonction t.test(). Notez l'utilisation de conf.level= pour le niveau de confiance du test qui est en réalité 1 - alpha = 0.95. Vous constatez que vous devez maîtriser les deux termes complémentaires alpha et niveau de confiance qui sont parfaitement complémentaires l'un à l'autre. Le test bilatéral se note \"two-sided\" ici.", "Ce n'est pas la bonne réponse. Relisez avec attention l'énoncé et complètez les éléments manquants dans cette fonction.")
310
+
grade_code("Vous avez su compléter la fonction t.test(). Notez l'utilisation de conf.level= pour le niveau de confiance du test qui est en réalité 1 - alpha = 0.95. Vous constatez que vous devez maîtriser les deux termes complémentaires alpha et niveau de confiance. Le test bilatéral se note \"two-sided\" ici.", "Ce n'est pas la bonne réponse. Relisez avec attention l'énoncé et complètez les éléments manquants dans les instructions R.")
309
311
```
310
312
311
313
```{r ttest_quiz}
@@ -314,14 +316,14 @@ quiz(
314
316
answer("oui"),
315
317
answer("non", correct = TRUE),
316
318
allow_retry = TRUE,
317
-
incorrect = "Vous vous êtes trompé. Pour savoir si vous devez rejeter $H_0$, il faut comparer la valeur P au seuil alpha défini avant de réaliser le test.",
319
+
incorrect = "Vous vous êtes trompé. Pour savoir si vous devez rejeter $H_0$, il faut comparer la valeur P au seuil alpha, ce dernier étant choisi avant de réaliser le test.",
318
320
correct = "Bravo, c'est correct. Vous ne rejetez pas $H_0$ au seuil alpha de 0.05 ici."),
319
-
question("Est-ce que l'indice de masse corporelle moyen est différent entre les hommes et les femmes ?",
321
+
question("Est-ce que l'indice de masse corporelle moyen est significativement différent entre les hommes et les femmes au seuil alpha de 5% ?",
320
322
answer("oui"),
321
323
answer("non", correct = TRUE),
322
324
allow_retry = TRUE,
323
-
incorrect = "Ce n'est pas la bonne réponse. Vous devez comparer la valeur de p au seuil alpha défini avant de réaliser le test pour trouver la bonne réponse à cette question.",
324
-
correct = "Bravo, c'est correct. Vous avez bien interprété votre test. Vous direz que vous ne détectez pas de différences significatives entre les moyennes des IMC des hommes et des femmes au seuil alpha de 5% (test de Student bilatéral, t = 1.51, ddl = 163, valeur P = 0.13)")
325
+
incorrect = "Ce n'est pas la bonne réponse. Vous devez comparer la valeur P au seuil alpha pour trouver la bonne réponse à cette question.",
326
+
correct = "Bravo, c'est correct. Vous avez bien interprété votre test. Vous direz que vous ne détectez pas de différence significative entre les moyennes des IMC des hommes et des femmes au seuil alpha de 5% (test de Student bilatéral, t = 1.51, ddl = 163, valeur P = 0.13)")
0 commit comments