Skip to content

Commit 3784f84

Browse files
committed
Learnr of module 10 ready for 2024-2025
1 parent ed6c7c3 commit 3784f84

File tree

5 files changed

+15
-11
lines changed

5 files changed

+15
-11
lines changed

DESCRIPTION

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
Package: BioDataScience1
2-
Version: 2024.9.0
2+
Version: 2024.10.0
33
Title: A Series of Learnr Documents for Biological Data Science 1
44
Description: Interactive documents using learnr and shiny applications for studying biological data science.
55
Authors@R: c(

NEWS.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -1,3 +1,7 @@
1+
# BioDataScience1 2024.10.0
2+
3+
- Learnrs **A10La_anova2**, **A10Lb_anova2mixte** and **A10Lc_syntaxr** revised.
4+
15
# BioDataScience1 2024.9.0
26

37
- Learnrs **A09La_anova**, **A09Lb_kruskal** revised.

inst/tutorials/A10La_anova2/A10La_anova2.Rmd.inactivated renamed to inst/tutorials/A10La_anova2/A10La_anova2.Rmd

Lines changed: 6 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -209,24 +209,24 @@ Si vous souhaitez réaliser une ANOVA à deux facteurs, vous devez respecter les
209209
- distribution **normale** des résidus,
210210
- **homoscédasticité** (même variance intragroupe).
211211

212-
Pour vérifier si l'échantillonnage est représentatif de la population et si les observations sont bien indépendantes les unes des autres, vous devez vous référer au protocole expérimental. Dans le cas de cette étude, vous considérerez, sur base de la discussion du protocole utilisé avec les fermiers (considérez que vous l'avez fait), que les individus ont bien été sélectionnés par un processus aléatoire. Considérez aussi que vous constatez que l'attribution des vaches au niveau de la ration et du type d'alimentation a également été réalisée de manière aléatoire. Vous avez aussi constaté qu'ils n'y a pas de parenté forcée (par ex., les vaches issues de l'insémination par le même taureau qui sont toutes nourries de la même manière).
212+
Pour vérifier si l'échantillonnage est représentatif de la population et si les observations sont bien indépendantes les unes des autres, vous devez vous référer au protocole expérimental. Dans le cas de cette étude, vous considérerez, sur base de la discussion du protocole utilisé avec les fermiers (considérez que vous l'avez fait), que les individus ont bien été sélectionnés par un processus aléatoire. Considérez aussi que vous constatez que l'attribution des vaches au niveau de la ration et du type d'alimentation a également été réalisée de manière aléatoire. Vous avez aussi constaté qu'il n'y a pas de parenté forcée (par ex., les vaches issues de l'insémination par le même taureau qui sont toutes nourries de la même manière).
213213

214-
Le type de variable peut se vérifier en consultant les données, par exemple avec la fonction `str()`, ou en déroulant le contenu de l'objet avec le bouton bleu dans l'onglet "Environnement" de RStudio. Attention de bien vous assurer que les deux variables explicatives que vous utilisez sont de type facteur non ordonné (**factor**) ou facteur ordonné (**ordered**) dans R. C'est le cas ici car la `ration` est un facteur ordonné (**ordered**) et `food` est un facteur non ordonné (**factor**). La variable réponse `milk` est bien numérique (**numeric**).
214+
Le type de variable peut se vérifier en consultant les données, par exemple avec la fonction `str()`, ou en déroulant le contenu de l'objet avec le bouton bleu dans l'onglet "Environnement" de RStudio. Attention de bien vous assurer que les deux variables explicatives que vous utilisez sont de type facteur non ordonné (**factor**) ou facteur ordonné (**ordered**) dans R. C'est le cas ici, car la `ration` est un facteur ordonné (**ordered**) et `food` est un facteur non ordonné (**factor**). La variable réponse `milk` est bien numérique (**numeric**).
215215

216216
```{r, echo=TRUE}
217217
str(milk_production)
218218
```
219219

220-
Vous devez encore vérifier les deux dernières conditions sur votre échantillon. Les données par sous-population étant en nombre suffisant, vous allez pouvoir appliquer un test permettant de vérifier l'homoscédasticité (homogénéité des variances). Vous devrez aussi vérifier que la distribution des résidus est normale. Mais cette étape ne peut se fait que plus tard, après le calcul de l'ANOVA à deux facteurs mais avant son interprétation (les résidus ne peuvent être calculés qu'après le modèle lui-même, puisqu'il s'agit de l'écart entre les observations et les valeurs prédites par le modèle, par définition).
220+
Vous devez encore vérifier les deux dernières conditions sur votre échantillon. Les données par sous-population étant en nombre suffisant, vous allez pouvoir appliquer un test permettant de vérifier l'homoscédasticité (homogénéité des variances). Vous devrez aussi vérifier que la distribution des résidus est normale. Mais cette étape ne peut se fait que plus tard, après le calcul de l'ANOVA à deux facteurs, mais avant son interprétation (les résidus ne peuvent être calculés qu'après le modèle lui-même, puisqu'il s'agit de l'écart entre les observations et les valeurs prédites par le modèle, par définition).
221221

222222
### Test de Bartlett
223223

224224
Pour vérifier l'homoscédasticité de vos données, vous allez utiliser le test de Bartlett. Afin d'interpréter correctement ce test, commencez par poser les hypothèses de départ. Le test de Bartlett doit se faire sur toutes les sous-populations. Pour cela, vous pouvez utiliser la fonction `interaction(FACTEUR1, FACTEUR2)` en lui renseignant les deux variables explicatives. Cette fonction calculera pour vous tous les sous-groupes possibles. Elle peut être utilisée directement dans la formule.
225225

226226
Effectuez maintenant un test de Bartlett sur les données du jeu `milk_production` de la quantité de lait (`milk`) en fonction du type d'alimentation (`food`) et de la ration (`ration`). Pour rappel, nous avons :
227227

228-
- H~0~ : homoscédasticité
229-
- H~1~ : hétéroscédasticité
228+
- H~0~ : homoscédasticité
229+
- H~1~ : hétéroscédasticité
230230

231231
<!-- 💬 **Le code ci-dessous correspond au snippet `.hvbartlett`.** -->
232232

@@ -318,7 +318,7 @@ question("Observez-vous des interactions significatives entre les rations et les
318318
answer("oui"),
319319
answer("non", correct = TRUE),
320320
allow_retry = TRUE,
321-
incorrect = "L'interprétation que vous avez faites n'est pas la bonne. Retournez voir dans le cours comment se prend la décision du rejet ou non de H0 en comparant la valeur P obtenue au seuil alpha 5% pour le terme d'interactions.",
321+
incorrect = "L'interprétation que vous avez faite n'est pas la bonne. Retournez voir dans le cours comment se prend la décision du rejet ou non de H0 en comparant la valeur P obtenue au seuil alpha 5% pour le terme d'interactions.",
322322
correct = "Il n'y a pas d'interactions significatives entre les deux facteurs au seuil alpha de 5%. Avant de continuer l'analyse, vous allez simplifier le modèle en retirant le terme correspondant à ces interactions (notez que vous pouvez aussi parfaitement interpréter les deux facteurs sur le modèle complet si vous préférez, en pratique : la simplification n'est pas obligatoire).")
323323
```
324324

inst/tutorials/A10Lb_anova2mixte/A10Lb_anova2mixte.Rmd.inactivated renamed to inst/tutorials/A10Lb_anova2mixte/A10Lb_anova2mixte.Rmd

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -73,7 +73,7 @@ skimr::skim(zeno)
7373

7474
Le niveau de gris mesuré varie de 0 à 255. Une valeur proche de 0 correspond à une crevette très foncée alors qu'une valeur proche de 255 est une crevette très claire. Le temps depuis lequel la crevette a été éloignée de son hôte est exprimé en minutes. L'`id` correspond au code de la crevette étudiée.
7575

76-
La question posée est la suivante : **observe-t-on une décoloration de l'abdomen (un éclaircissement des individus) au cours du temps ?**
76+
La question posée est la suivante : **observe-t-on une décoloration de l'abdomen (un éclaircissement des individus) au cours du temps ?**
7777

7878
## Facteur fixe et facteur aléatoire
7979

@@ -84,7 +84,7 @@ head(zeno)
8484
La première étape lors de la réalisation de ce type d'expérience est de définir correctement quel(s) facteur(s) sont fixe(s) et quels facteur(s) sont aléatoire(s). Aidez-vous de la description proposée dans la section précédente.
8585

8686
```{r quiz_factor}
87-
question("Parmi les variables du jeu de données `zeno`, sélectionnez le facteur aléatoire parmi les variables suivantes :",
87+
question("Parmi les variables du jeu de données `zeno`, sélectionnez le facteur aléatoire :",
8888
answer("id", correct = TRUE, "Vous avez correctement sélectionné le facteur aléatoire"),
8989
answer("time", message = "Cette variable peut être considérée ici comme un facteur fixe : nous avons choisi un certain nombre de valeurs de temps pour lesquelles nous souhaitons observer les effets de variation de la coloration des crevettes." ),
9090
answer("grey", message = "Cette variable n'est pas un facteur, mais la variable numérique à partir de laquelle nous calculons les moyennes."),

inst/tutorials/A10Lc_syntaxr/A10Lc_syntaxr.Rmd.inactivated renamed to inst/tutorials/A10Lc_syntaxr/A10Lc_syntaxr.Rmd

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -43,14 +43,14 @@ Dans ce tutoriel, deux jeux de données que vous commencez à bien connaitre ser
4343

4444
Le jeu de données sur la biométrie humaine contient sept variables et 395 individus.
4545

46-
```{r}
46+
```{r, warning=FALSE}
4747
biometry <- read("biometry", package = "BioDataScience", lang = "fr")
4848
tabularise$headtail(biometry)
4949
```
5050

5151
Le jeu de données sur les oursins comprend 19 variables et 421 individus. En voici les huit premières variables :
5252

53-
```{r}
53+
```{r, warning=FALSE}
5454
urchin <- read("urchin_bio", package = "data.io", lang = "fr")
5555
tabularise$headtail(urchin[, 1:8])
5656
```

0 commit comments

Comments
 (0)