Learnrs for module 8 updated

phgrosjean · phgrosjean · commit b949eb9361b8 · 2024-02-20T09:06:32.000+01:00
diff --git a/DESCRIPTION b/DESCRIPTION
@@ -1,5 +1,5 @@
 Package: BioDataScience1
-Version: 2023.7.0
+Version: 2023.8.0
 Title: A Series of Learnr Documents for Biological Data Science 1
 Description: Interactive documents using learnr and shiny applications for studying biological data science.
 Authors@R: c(
diff --git a/NEWS.md b/NEWS.md
@@ -1,3 +1,8 @@
+# BioDataScience1 2023.8.0
+
+-   Learnrs **A08La_chi2** and **A08Lb_chi2b** ready.
+
+
 # BioDataScience1 2023.7.0
 
 -   Learnrs **A07La_proba**, **A07Lb_distri** and **A07Lc_distri2** ready.
diff --git a/inst/tutorials/A08La_chi2/A08La_chi2.Rmd b/inst/tutorials/A08La_chi2/A08La_chi2.Rmd
@@ -1,7 +1,7 @@
 ---
-title: "Test Chi2 univarié"
+title: "Test chi2 univarié"
 author: "Guyliann Engels & Philippe Grosjean"
-description: "**SDD I Module 8** Distribution du Chi2, et test Chi2 univarié."
+description: "**SDD I Module 8** Distribution du chi2, et test chi2 univarié."
 tutorial:
   id: "A08La_chi2"
   version: 2.1.1/9
@@ -14,8 +14,7 @@ runtime: shiny_prerendered
 
 ```{r setup, include=FALSE}
 BioDataScience1::learnr_setup()
-SciViews::R("infer")
-library(BioDataScience1)
+SciViews::R("infer", lang = "fr")
 ```
 
 ```{r, echo=FALSE}
@@ -32,15 +31,15 @@ BioDataScience1::learnr_server(input, output, session)
 
 La loi de distribution du $\chi^2$ représente de manière théorique la probabilité de distribution de fréquences entre les niveaux d'une ou plusieurs variables qualitatives. Un test d'hypothèse $\chi^2$ en est dérivé pour comparer un échantillon à des valeurs théoriques sous H~0~. Vos objectifs sont ici de :
 
--   Pouvoir calculer des quantiles ou des probabilités relatifs à la distribution du $\chi^2$
+-   Pouvoir calculer des quantiles ou des probabilités relatifs à la distribution théorique du $\chi^2$
 
 -   Appréhender le test d'hypothèse du $\chi^2$ univarié
 
-Vous devez avoir assimilé la matière du [module 8](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2022/chi2.html) du cours, en particulier la [section 8.2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2022/test-dhypoth%25C3%25A8se.html), et vous devez avoir compris les différentes notions vue au [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2022/proba.html) relatives au calcul de probabilités et aux lois de distribution statistiques. Ce learnr vous sert à auto-évaluer vos acquis relatifs à la distribution $\chi^2$ et au test $\chi^2$ univarié.
+Vous devez avoir assimilé la matière du [module 8](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2023/chi2.html) du cours, en particulier la [section 8.2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2023/test-dhypoth%25C3%25A8se.html), et vous devez avoir compris les différentes notions vue au [module 7](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2023/proba.html) relatives au calcul de probabilités et aux lois de distribution statistiques. Ce learnr vous sert à auto-évaluer vos acquis relatifs à la distribution $\chi^2$ et au test $\chi^2$ univarié.
 
 ## Distribution du $\chi^2$
 
-Représentez graphiquement la densité de probabilité de la distribution du $\chi^2$ à trois degrés de liberté. Utilisez la fonction approriée `dist_*()`.
+Représentez graphiquement la densité de probabilité de la distribution du $\chi^2$ à trois degrés de liberté. Utilisez la fonction appropriée `dist_*()`.
 
 ```{r chi_dist_h1, exercise=TRUE, exercise.lines=4}
 # Distribution de chi2 avec 3 degrés de liberté
@@ -58,10 +57,10 @@ chart(chi)
 ```
 
 ```{r chi_dist_h1-check}
-grade_code("Avec les fonctions `dist_*()`, il est simple de créer un objet représentant la distribution souhaitée. Pour la distribution du Chi^2, il vous suffit d'indiquer les degrés de liberté de la distribution. Il s'agit d'une loi de distribution très asymétrique et qui commence à {0, 0}. Notez que plus le quantile est grand, plus la densité de probabilité est faible.")
+grade_code("Avec les fonctions `dist_*()`, il est simple de créer un objet représentant la distribution souhaitée. Pour la distribution du chi^2, il vous suffit d'indiquer les degrés de liberté de la distribution. Il s'agit d'une loi de distribution très asymétrique et qui commence à {0, 0}. Notez que, passé un maximum, plus le quantile est grand, plus la densité de probabilité est faible.")
 ```
 
-Sur base de cette distribution à trois degrés de liberté, calculez la probabilité d'une valeur de $\chi^2$ supérieure au quantile 15.
+Sur base de cette distribution du $chi^2$ à trois degrés de liberté, calculez la probabilité d'une valeur de $\chi^2$ supérieure au quantile 15, cette fois-ci en utilisant les fonctions de base dans R (`q|p|d|r<dist>()`).
 
 <!-- 💬 **Ce code correspond au snippet `.icproba`.** -->
 
@@ -81,10 +80,10 @@ pchisq(15, df = 3, lower.tail = FALSE)
 ```
 
 ```{r chi1_h2-check}
-grade_code("La fonction `pchisq()` calcule une probabilité à partir d'un quantile selon la distribution Chi^2.")
+grade_code("La fonction `pchisq()` calcule une probabilité à partir d'un quantile selon la distribution chi^2.")
 ```
 
-Toujours sur base de cette distribution à trois degrés de liberté, calculez le quantile qui délimite l'aire à droite dont la probabilité est de 5%.
+Toujours sur base de cette distribution à trois degrés de liberté, calculez le quantile qui délimite l'aire à droite dont la probabilité est de 5% (toujours avec `q|p|d|r<dist>()`).
 
 <!-- 💬 **Ce code correspond au snippet `.icquant`.** -->
 
@@ -104,7 +103,7 @@ qchisq(0.05, df = 3, lower.tail = FALSE)
 ```
 
 ```{r chi2_h2-check}
-grade_code("La fonction `qchisq()` calcule un quantile délimitant une aire qui correspond à une probabilité donnée selon la distribution Chi^2.")
+grade_code("La fonction `qchisq()` calcule un quantile délimitant une aire qui correspond à une probabilité donnée selon la distribution chi^2.")
 ```
 
 ## Calcul du $\chi^2_{obs}$
@@ -148,7 +147,7 @@ question("Valeur du Chi^2 observé.",
   answer("0.067"),
   allow_retry = TRUE, random_answer_order = TRUE,
   incorrect = "Recommencez afin de trouver la bonne réponse",
-  correct = "C'est correct ! Ceci est la valeur du quantile Chi^2 correspondant à notre échantillon.")
+  correct = "C'est correct ! Ceci est la valeur du quantile chi^2 correspondant à notre échantillon.")
 ```
 
 ## Test du $\chi^2$ univarié
@@ -159,12 +158,10 @@ Donc, pour notre expérience de préférences alimentaires des chimpanzés, nous
 knitr::kable(chimp)
 ```
 
-Or, sous H~0~ de non préférences alimentaires, nous nous attendions à observer à peu près le même nombre de premiers choix pour chaque fruit. Ces écart sont-ils révélateurs de préférences marquées, ou peuvent-il être obtenus par le biais du hasard ? Pour le vérifier, nous avions calculé la valeur du $\chi^2_{obs}$ comme étant 7.601.
+Or, sous H~0~ de non préférences alimentaires, nous nous attendions à observer à peu près le même nombre de premiers choix pour chaque fruit. Ces écarts sont-ils révélateurs de préférences marquées, ou peuvent-il être obtenus par le hasard ? Pour le vérifier, nous avions calculé la valeur du $\chi^2_{obs}$ comme étant 7.601.
 
 Cette valeur doit maintenant être confrontée à la distribution théorique du $\chi^2$ à deux degrés de liberté (nombre de niveaux de la variable qualitative `fruit` moins un, donc ici (3 - 1) = 2) représentée ci-dessous.
 
-$ddl = nombre \ de \ niveaux \ de \ la \ variable -1$
-
 ```{r}
 # Chi-square distribution (density probability) with parameter:
 .df <- 2 # Degree of freedom .df
@@ -184,11 +181,13 @@ Déterminez la probabilité qu'un quantile soit supérieur ou égal à $\chi^2_{
 <!-- 💬 **Ce code correspond au snippet `.icproba`.** -->
 
 ```{r chi3_h2, exercise=TRUE}
-pchisq(___, df = ___, lower.tail = ___)
+___(___, df = ___, lower.tail = ___)
 ```
 
 ```{r chi3_h2-hint-1}
-pchisq(___, df = 2, lower.tail = FALSE)
+pchisq(___, df = ___, lower.tail = FALSE)
+
+ #### ATTENTION: Hint suivant = solution !####
 ```
 
 ```{r chi3_h2-solution}
@@ -197,18 +196,18 @@ pchisq(7.601, df = 2, lower.tail = FALSE)
 ```
 
 ```{r chi3_h2-check}
-grade_code("Cette probabilité est appelée valeur p du test d'hypothèse.")
+grade_code("Cette probabilité est appelée valeur P du test d'hypothèse.")
 ```
 
-Pour tirer une conclusion avec le **test d'hypothèse** du $\chi^2$ univarié, vous comparez la valeur *p* ainsi obtenue au seuil $\alpha$ que vous avez fixé préalablement (choix réalisé *avant* de faire le test pour ne pas être influencé par le résultat). Souvent, on prend $\alpha$ = 5% en biologie. Les hypothèse (H~0~ = hypothèse nulle et H~1~ ou H~A~ = hypothèse alternative) du test $\chi^2$ univarié sont :
+Pour tirer une conclusion avec le **test d'hypothèse** du $\chi^2$ univarié, vous comparez la valeur *P* ainsi obtenue au seuil $\alpha$ que vous avez fixé préalablement (choix réalisé *avant* de faire le test pour ne pas être influencé par le résultat). Souvent, on prend $\alpha$ = 5% en biologie. Les hypothèse (H~0~ = hypothèse nulle et H~1~ ou H~A~ = hypothèse alternative) du test $\chi^2$ univarié sont :
 
 -   H~0~ : $a_i = \alpha_i$ pour tout $i$
 -   H~1~ : $a_i \neq \alpha_i$ pour au moins un $i$
 
 Les règles pour décider si nous rejetons ou non H~0~ sont :
 
--   Valeur *p* \< $\alpha$ =\> rejet de H~0~
--   Valeur *p* ≥ $\alpha$ =\> non rejet de H~0~
+-   Valeur *P* \< $\alpha$ =\> rejet de H~0~
+-   Valeur *P* ≥ $\alpha$ =\> non rejet de H~0~
 
 Sur base de tout ceci, tirez des conclusions concernant l'expérience de préférence alimentaire chez le chimpanzé.
 
@@ -217,13 +216,13 @@ question("Que décidez-vous au seuil alpha de 5% ?",
   answer(sprintf("Rejet de $H_{0}$"), correct = TRUE),
   answer(sprintf("Non rejet de $H_{0}$")),
   allow_retry = TRUE, random_answer_order = TRUE,
-  incorrect = "Recommencez afin de trouver la bonne réponse",
-  correct = "C'est correct ! Nous rejetons H0. Le chimpanzé préfère donc certains fruits (banane) à d'autres (orange). Les préférences sont déduites de la comparaison des fréquences observées par rapport aux fréquences théoriques sous H~0~")
+  incorrect = "Recommencez afin de trouver la bonne réponse.",
+  correct = "Effectivement, nous rejetons H0. Le chimpanzé préfère donc certains fruits (banane) à d'autres (orange). Les préférences sont déduites de la comparaison des fréquences observées par rapport aux fréquences théoriques sous H~0~")
 ```
 
 ### Test $\chi^2$ avec `chisq.test()`
 
-Pour réaliser votre test $\chi^2$, vous ne devez heureusement pas passer par tous ces calculs à la main. En effet, R mets à votre disposition une fonction qui le fait pour vous : `chisq.test()`. Utilisez maintenant cette fonction pour faire le même calcul sur l'expérience de préférence alimentaire des chimpanzés.
+Pour réaliser votre test $\chi^2$, vous ne devez heureusement pas passer par tous ces calculs à la main. En effet, R mets à votre disposition une fonction qui les fait pour vous : `chisq.test()`. Utilisez maintenant cette fonction pour faire le même calcul sur l'expérience de préférence alimentaire des chimpanzés.
 
 <!-- 💬 **Ce code correspond (pour la dernière ligne) au snippet `.hcchi2uni`** [`.hc` = `h`ypothesis tests: `c`ontingency]. -->
 
@@ -262,7 +261,7 @@ chisq.test(chimp, p = c(Pomme = 1/3, Banane = 1/3, Orange = 1/3), rescale.p = FA
 grade_code("La fonction `chisq.test()` utilise les probabilités théoriques fournies dans `p =` avec `rescale.p = FALSE`, ou les fréquences théoriques dans `p =`, mais alors il faut indiquer `rescale.p = TRUE`. Vérifiez que ceci donne le même résultat que votre calcul à la main.")
 ```
 
-### Effet de *n*
+### Effet de *N*
 
 Calculez à nouveau un test de $\chi^2$ univarié, mais cette fois-ci avec dix fois plus de chimpanzés, et les mêmes proportions observées.
 
@@ -303,19 +302,19 @@ chisq.test(chimp2, p = c(Pomme = 1/3, Banane = 1/3, Orange = 1/3), rescale.p = F
 ```
 
 ```{r chi_test2_h3-check}
-grade_code("Le valeur du chi^2^ obs est beaucoup plus grande ici et la valeur p est plus petite.")
+grade_code("Le valeur du chi^2^obs est beaucoup plus grande ici et la valeur P est plus petite.")
 ```
 
-Plus l'échantillon a une taille *n* importante, plus nous avons des données à disposition et nous pourrons donc rejeter H~0~ si elle est fausse *même si l'écart entre les* $a_i$ et les $\alpha_i$ est très petit. Par contre, si cet écart est très grand, un petit nombre d'observations suffira pour rejeter H~0~. A cause de cet effet de *n*, nous ne dirons *jamais* que nous **acceptons** H~1~, mais nous dirons que nous **ne rejetons pas H~0~**. Car, dans cette situation, deux cas sont possibles :
+Plus l'échantillon a une taille *N* importante, plus nous avons des données à disposition et nous pourrons donc rejeter H~0~ si elle est fausse même si l'écart entre les $a_i$ et les $\alpha_i$ est très petit. Par contre, si cet écart est très grand, un plus petit nombre d'observations suffira pour rejeter H~0~. A cause de cet effet de *N*, nous ne dirons *jamais* que nous **acceptons** H~1~, mais nous dirons que nous **ne rejetons pas H~0~**. Car, dans cette situation, deux cas sont possibles :
 
 1.  H~0~ est effectivement vraie
-2.  H~0~ est fausse, mais l'écart est faible et *n* est trop petit pour le détecter, ou nous n'avons pas pu le détecter par le hasard de l'échantillonnage
+2.  H~0~ est fausse mais *N* est trop petit pour détecter l'écart entre les fréquences observées et théorique (relativement faible)
 
-A l'inverse, lorsque l'on travaille avec une taille d'échantillon *n* extrêmement grande, on peut être amené à rejeter H~0~ pour des écarts entre $a_i$ et $\alpha_i$ tellement faibles qu'ils ne signifient plus rien, biologiquement parlant. **C'est pour cette raison qu'il faut toujours comparer les fréquences observées et les fréquences théoriques en cas de rejet de H~0~**, afin de se faire une idée de l'amplitude des écarts et des niveaux qu'ils concernent.
+A l'inverse, lorsque l'on travaille avec une taille d'échantillon *N* extrêmement grande, on peut être amené à rejeter H~0~ pour des écarts entre $a_i$ et $\alpha_i$ tellement faibles qu'ils ne signifient plus rien, biologiquement parlant. **C'est pour cette raison qu'il faut toujours comparer les fréquences observées et les fréquences théoriques en cas de rejet de H~0~**, afin de se faire une idée de l'**amplitude des écarts** et des niveaux qu'ils concernent.
 
 ## Conclusion
 
-Ayant maintenant compris la logique et l'utilisation de la distribution du $\chi^2$ et son test d'hypothèse univarié, nous aborderons dans le prochain learnr une autre variante : le test $\chi^2$ d'indépendance.
+Ayant maintenant compris la logique et l'utilisation de la distribution du $\chi^2$ et du test d'hypothèse univarié correspondant, nous aborderons dans le prochain learnr une autre variante : le test $\chi^2$ d'indépendance.
 
 ```{r comm_noscore, echo=FALSE}
 question_text(
diff --git a/inst/tutorials/A08Lb_chi2b/A08Lb_chi2b.Rmd b/inst/tutorials/A08Lb_chi2b/A08Lb_chi2b.Rmd