BioDataScience-Course
diff --git a/‎BioDataScience1.Rproj
Lines changed: 1 addition & 0 deletions b/‎BioDataScience1.Rproj
Lines changed: 1 addition & 0 deletions
diff --git a/‎DESCRIPTION
Lines changed: 1 addition & 1 deletion b/‎DESCRIPTION
Lines changed: 1 addition & 1 deletion
diff --git a/‎NEWS.md
Lines changed: 4 additions & 0 deletions b/‎NEWS.md
Lines changed: 4 additions & 0 deletions
diff --git a/‎inst/tutorials/A06La_proba/A06La_proba.Rmd.inactivated renamed to ‎inst/tutorials/A06La_proba/A06La_proba.Rmd
Lines changed: 18 additions & 18 deletions b/‎inst/tutorials/A06La_proba/A06La_proba.Rmd.inactivated renamed to ‎inst/tutorials/A06La_proba/A06La_proba.Rmd
Lines changed: 18 additions & 18 deletions
diff --git a/‎inst/tutorials/A06Lb_distri/A06Lb_distri.Rmd
Lines changed: 215 additions & 0 deletions b/‎inst/tutorials/A06Lb_distri/A06Lb_distri.Rmd
Lines changed: 215 additions & 0 deletions
@@ -1,4 +1,5 @@
 Version: 1.0
+ProjectId: 44c74280-827c-489c-9f67-e3eba8c995d9
 
 RestoreWorkspace: No
 SaveWorkspace: No
 
@@ -1,5 +1,5 @@
 Package: BioDataScience1
-Version: 2024.5.0
+Version: 2024.6.0
 Title: A Series of Learnr Documents for Biological Data Science 1
 Description: Interactive documents using learnr and shiny applications for studying biological data science.
 Authors@R: c(
 
@@ -1,3 +1,7 @@
+# BioDataScience1 2024.6.0
+
+-   Learnrs **A06La_proba**, **A06Lb_distri** and **A06Lc_correlation** revised.
+
 # BioDataScience1 2024.5.0
 
 -   Learnrs **A05La_recombination** and **A05Lb_multi-table** revised.
 
@@ -4,7 +4,7 @@ author: "Guyliann Engels & Philippe Grosjean"
 description: "**SDD I Module 6** Calculer des probabilités dans R."
 tutorial:
   id: "A06La_proba"
-  version: 2.0.0/10
+  version: 2.1.0/10
 output:
   learnr::tutorial:
     progressive: true
@@ -37,7 +37,7 @@ Le calcul des probabilités et le B-A-BA des statistiques. Il n'est pas toujours
 
 -   Calculer des probabilités sur base d'un tableau de contingence
 
-Avant d'aborder ce tutoriel, assurez-vous d'avoir bien compris le contenu de la [section 6.1](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/probabilit%25C3%25A9s.html) du cours. En effet, ce learnr sert d'auto-évaluation sur cette matière et ne sera utile que dans un contexte où vous la maîtrisez déjà, à des fins de vérification de vos acquis.
+Avant d'aborder ce tutoriel, assurez-vous d'avoir bien compris le contenu de la [section 6.1](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/proba.html) du cours. En effet, ce learnr sert d'auto-évaluation sur cette matière et ne sera utile que dans un contexte où vous la maîtrisez déjà, à des fins de vérification de vos acquis.
 
 ## Lire des probabilités
 
@@ -47,34 +47,34 @@ Le calcul des probabilité est assorti d'un formalisme mathématique qu'il vous
 
 ```{r qu_formalism}
 quiz(
-  question("Comment lire la proposition suivante : Pr{A.B} ?",
+  question("Comment lire la proposition suivante : Pr{A.B} ?",
     answer("Probabilité d'observer A ou B"),
     answer("Probabilité d'observer A et B", correct = TRUE, message = "Probabilité d'évènements successifs indépendants "),
     answer("Probabilité d'observer A si B se produit"),
     allow_retry = TRUE, random_answer_order = TRUE,
     incorrect = "Pas exactement. Recommencez afin de trouver la bonne réponse.",
     correct = "Oui, les deux évènements sont indépendant ici, ce qui signifie que l'occurence de l'un n'a aucune incidence sur la probabilité d'occurence de l'autre."),
-  question("Comment lire la proposition suivante : Pr{A|B} ?",
+  question("Comment lire la proposition suivante : Pr{A|B} ?",
     answer("Probabilité d'observer A ou B"),
     answer("Probabilité d'observer A et B"),
     answer("Probabilité d'observer A si B se produit", correct = TRUE, message = "Ici, nous avons une probabilité conditionnelle que A se produise, sachant que B s'est produit"),
     allow_retry = TRUE, random_answer_order = TRUE,
     incorrect = "Désolé, mais ce n'est pas correct. Recommencez afin de trouver la bonne réponse",
     correct = "Les probabilités conditionnelles ont une dépendance entre elles."),
-  question("Comment lire la proposition suivante : Pr{A+B} ?",
+  question("Comment lire la proposition suivante : Pr{A+B} ?",
     answer("Probabilité d'avoir A ou B", correct = TRUE, message = "En calcul de probabilité, l'addition signifie que l'on considère la probabilité que l'un parmi plusieurs évènements disjoints se produise"),
     answer("Probabilité d'avoir A et B"),
     answer("Probabilité d'avoir A si B se produit"),
     allow_retry = TRUE, random_answer_order = TRUE,
     incorrect = "Concentrez-vous sur ce que l'opérateur '+' signifie en calcul des probabilités. Recommencez afin de trouver la bonne réponse",
     correct = "La probabilité d'observer A ou d'observer B."),
-  question("Comment écrira-t-on la probabilité d'obtenir quatre mâles Pr{M} dans une portée de quatre châtons ?",
+  question("Comment écrira-t-on la probabilité d'obtenir quatre mâles Pr{M} dans une portée de quatre châtons ?",
     answer("Pr{M . M . M . M}", correct = TRUE),
     answer("Pr{M et M et M et M}", correct = TRUE),
     answer("Pr{M + M + M + M}" ),
     answer("Pr{M ou M ou M ou M}"),
     allow_retry = TRUE, random_answer_order = TRUE,
-    incorrect = "Est-ce des évènements successifs indépendants ou des évènements dépendants, réfléchissez. Recommencez afin de trouver la bonne réponse",
+    incorrect = "Est-ce des évènements successifs indépendants ou des évènements dépendants ? Réfléchissez. Recommencez afin de trouver la bonne réponse",
     correct = "Le '.' est synonyme ici de 'et' et concerne des évènements indépendants successifs.")
 )
 ```
@@ -103,38 +103,38 @@ Calculez les probabilités suivantes relatives à cette étude (vous pouvez vous
 
 ```{r qu_calcul}
 quiz(caption = "Stress et revenus",
-  question("Quelle est la probabilité d'être stressé ?",
-    answer("0.15", correct = TRUE , message = "Résultat issu du calcul suivant : 1016/6549, total stressés sur total général"),
+  question("Quelle est la probabilité d'être stressé ?",
+    answer("0.15", correct = TRUE , message = "Résultat issu du calcul suivant : 1016/6549, total stressés sur total général"),
     answer("0.52"),
     answer(" 0.08"),
     answer(" 0.30"),
     allow_retry = TRUE, random_answer_order = TRUE,
     incorrect = "Vous avez fait une erreur. Recommencez afin de trouver la bonne réponse",
-    correct = "C'est correct !"),
-  question("Quelle est la probabilité d'être stressé et d'avoir des revenus moyens ?",
-    answer("0.042", correct = TRUE, message =  "Cette réponse est obtenue comme suit : 274/6549, nombre de stressés à revenus moyens sur le total général"),
+    correct = "C'est correct !"),
+  question("Quelle est la probabilité d'être stressé et d'avoir des revenus moyens ?",
+    answer("0.042", correct = TRUE, message =  "Cette réponse est obtenue comme suit : 274/6549, nombre de stressés à revenus moyens sur le total général"),
     answer("0.52"),
     answer("0.15"),
     answer("0.08"),
     allow_retry = TRUE, random_answer_order = TRUE,
     incorrect = "Concentrez-vous et recommencez afin de trouver la bonne réponse",
-    correct = "C'est correct !"),
+    correct = "C'est correct !"),
   question("Pr{revenus moyens ou stressé} ?",
     answer("0.41", correct = TRUE, message =  "Cette réponse s'obtient en effet comme ceci : (1954/6549) + (1016/6549) - (274/6549), probabilité d'être stressé + probabilité d'avoir des revenus moyens. Mais les stressés à revenus moyens sont ici comptabilisés deux fois... donc on doit les soustraire un fois du calcul"),
     answer("0.042"),
     answer("0.52"),
     answer("0.086"),
     allow_retry = TRUE, random_answer_order = TRUE,
     incorrect = "Pas exactement. Recommencez afin de trouver la bonne réponse",
-    correct = "C'est correct !"),
+    correct = "C'est correct !"),
   question("Pr{revenus faibles | non stressé}",
-    answer("0.35", correct = TRUE, message = "Le calcul est le suivant : 1954/5533, ici, nous considérons uniquement la population de non stressés. Donc on divise les revenus faibles par le total de non stressés et pas par le total général."),
+    answer("0.35", correct = TRUE, message = "Le calcul est le suivant : 1954/5533, ici, nous considérons uniquement la population de non stressés. Donc on divise les revenus faibles par le total de non stressés et pas par le total général."),
     answer("0.41"),
     answer("0.52"),
     answer("0.15"),
     allow_retry = TRUE, random_answer_order = TRUE,
     incorrect = "C'est une probabilité conditionnelle. Elle se traite d'une façon particulière dans un tableau de contingence. Recommencez afin de trouver la bonne réponse",
-    correct = "C'est correct !")
+    correct = "C'est correct !")
 )
 ```
 
@@ -171,8 +171,8 @@ Un nouveau médicament contre une maladie permet de soigner 80% des individus at
 
 ```{r medic1_h3-check}
 grade_result(
-  pass_if(~ identical(.result, 0.5 + (0.2 * 0.5)), "Nous avons deux sous-populations indépendantes : celle qui peut recevoir le médicament et celle qui ne le peut pas à cause d'allergie ou d'intolérance (nous additionnons donc les probabilités respectives). Parmi ceux qui reçoivent le médicament, 20% d'entre eux ne guérissent pas (nous multiplions la probabilité d'appartenir à la sous-population qui peut recevoir le médicament avec la probabilité de ne pas guérir si elle reçoit ce médicament). Vous pouvez aussi tracer un arbre de probabilité pour résoudre ce problème, si vous préférez"),
-  fail_if(~ TRUE, "Votre calcul n'est pas correct. Combien ne peuvent recevoir le médicament ? Combien n'y réagissent pas positivement ? C'est la clé.")
+  pass_if(~ identical(.result, 0.5 + (0.2 * 0.5)), "Nous avons deux sous-populations indépendantes : celle qui peut recevoir le médicament et celle qui ne le peut pas à cause d'allergie ou d'intolérance (nous additionnons donc les probabilités respectives). Parmi ceux qui reçoivent le médicament, 20% d'entre eux ne guérissent pas (nous multiplions la probabilité d'appartenir à la sous-population qui peut recevoir le médicament avec la probabilité de ne pas guérir si elle reçoit ce médicament). Vous pouvez aussi tracer un arbre de probabilité pour résoudre ce problème, si vous préférez"),
+  fail_if(~ TRUE, "Votre calcul n'est pas correct. Combien ne peuvent recevoir le médicament ? Combien n'y réagissent pas positivement ? C'est la clé.")
 )
 ```
 
 
@@ -0,0 +1,215 @@
+---
+title: "Distributions continues"
+author: "Guyliann Engels & Philippe Grosjean"
+description: "**SDD I Module 6** Calculs avec une distributions normale."
+tutorial:
+  id: "A07La_distri"
+  version: 2.1.0/5
+output:
+  learnr::tutorial:
+    progressive: true
+    allow_skip: true
+runtime: shiny_prerendered
+---
+
+```{r setup, include=FALSE}
+BioDataScience1::learnr_setup()
+SciViews::R("infer")
+library(BioDataScience1)
+```
+
+```{r, echo=FALSE}
+BioDataScience1::learnr_banner()
+```
+
+```{r, context="server"}
+BioDataScience1::learnr_server(input, output, session)
+```
+
+------------------------------------------------------------------------
+
+## Objectifs
+
+La loi de distribution normale est centrale en statistiques. Ce tutoriel vous permet d'auto-évaluer vos acquis à son sujet. Vous allez :
+
+-   Vérifier que vous comprenez bien la logique des calculs autour de la distribution normale
+
+-   Pouvoir calculer des quantiles à partir de probabilités
+
+-   Être capable de calculer des probabilités à partir de quantiles
+
+
+Vous devez avoir étudié le contenu du [module 6](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/probacorr.html) du cours SDD I, et en particulier les sections relatives à la [distribution normale](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2024/distribution-normale.html). Assurez-vous également au préalable d'être à l'aise avec le calcul des probabilités (que vous vérifiez avec le learnr `BioDataScience1::run("A06La_proba")`).
+
+## Distribution normale
+
+![](images/para_normal_distribution.jpg)
+
+La distribution normale (ou Gaussienne) est appelée comme cela parce que c'est celle qui se rencontre le plus souvent. Elle s'observe à chaque fois que le résultat est la somme de petits effets aléatoires qui se combinent. Elle a une forme caractéristique, dite "en cloche".
+
+### Graphique
+
+Employez R pour représenter la densité de probabilité de la distribution $Y \sim N(10, 9)$ (attention à la différence entre la variance ici et l'écart type "sigma" qui est utilisé dans la fonction de calcul) !
+
+<!-- 💬 **Ce code correspond au snippet `.indens`** [`.in` = (d)`i`stribution: `n`ormal]. -->
+
+```{r normal1_h2, exercise=TRUE, exercise.lines=5}
+N1 <- dist_normal(mu = ___, sigma = ___)
+___(___) +
+  ___("Densité de probabilité")
+```
+
+```{r normal1_h2-hint-1}
+N1 <- dist_normal(mu = ___, sigma = ___)
+___(___) +
+  ___("Densité de probabilité")
+
+ #### ATTENTION: Hint suivant = solution !####
+```
+
+```{r normal1_h2-solution}
+## Solution ##
+N1 <- dist_normal(mu = 10, sigma = 3)
+chart(N1) +
+  ylab("Densité de probabilité")
+```
+
+```{r normal1_h2-check}
+grade_code("Ceci est plutôt simple à réaliser une fois que l'on se rappelle que l'écart type \"sigma\" est la racine carrée dce la variance. La ligne avec `ylab()` n'est là que pour s'assurer d'avoir le label de l'axe en français.")
+```
+
+Ajoutez maintenant sur le graphique une aire en rouge délimitée entre les quantiles 8 et 12 et annotez-là en son centre avec l'indication "P[8, 12]" en rouge. Pour ajouter une aire colorée sous la courbe, vous utilisez `geom_funfill()` avec l'argument `fun = dfun(...)` pour un graphique de densité de probabilité ou `fun = cdfun(...)` pour un graphique de densité de probabilité cumulée. Enfin pour annoter le graphique avec du texte, vous utilisez `annotate("text", ...)`.
+
+<!-- 💬 **Le code ajouté en dernière ligne après celui qui génère le graphique correspond au snippet `.inllabel`.** -->
+
+```{r normal2_h2, exercise=TRUE, exercise.lines=5}
+N1 <- dist_normal(mu = 10, sigma = 3)
+chart(N1) +
+  ylab("Densité de probabilité") +
+  ___(fun = ___(N1), from = ___, to = ___) +
+  ___("text", x = ___, y = 0.06, label = "P[8, 12]", col = "red")
+```
+
+```{r normal2_h2-hint-1}
+N1 <- dist_normal(mu = 10, sigma = 3)
+chart(N1) +
+  ylab("Densité de probabilité") +
+  geom_funfill(fun = ___(N1), from = ___, to = ___) +
+  annotate("text", x = ___, y = 0.06, label = "P[8, 12]", col = "red")
+
+ #### ATTENTION: Hint suivant = solution !####
+```
+
+```{r normal2_h2-solution}
+## Solution ##
+N1 <- dist_normal(mu = 10, sigma = 3)
+chart(N1) +
+  ylab("Densité de probabilité") +
+  geom_funfill(fun = dfun(N1), from = 8, to = 12) +
+  annotate("text", x = 10, y = 0.06, label = "P[8, 12]", col = "red")
+```
+
+```{r normal2_h2-check}
+grade_code("Si `geom_funfill()` est une function spécifique à `SciViews::R` pour compléter les graphiques des distributions, `annotate(\"text\", ...)` est classique pour les graphiques de type {ggplot2} comme ici et est donc réutilisable pour annoter tous vos graphiques.")
+```
+
+### Calculs avec la loi normale
+
+Comme pour les autres lois de distributions, il est vital de pouvoir calculer des probabilités en fonctions de quantiles et des quantiles à partir de probabilités. Nous nous référerons toujours à la probabilités d'avoir une valeur plus petite (aire à gauche avec `lower.tail = TRUE`) ou plus grande (aide à droite avec `lower.tail = FALSE`) que ce quantile. Une aire comprise entre deux quantiles doit se calculer en deux temps (Pr{Q2} - Pr{Q1}).
+
+![](images/maize.jpg)
+
+Vous étudiez la croissance de plants de maïs. A partir d'un grand nombre de mesures, vous avez pu déterminer que la hauteur de vos plants suit une distribution normale avec une moyenne de 145 cm et une variance de 484 (donc un écart type de 22 cm).
+
+Calculez la probabilités d'avoir un plant de maïs pris au hasard de moins de 100 cm de haut dans votre champ.
+
+<!-- 💬 **Ce code correspond au snippet `.inproba`.** -->
+
+```{r normal3_h3, exercise=TRUE}
+pnorm(___, mean = ___, sd = ___, lower.tail = ___)
+```
+
+```{r normal3_h3-hint-1}
+pnorm(100, mean = ___, sd = ___, lower.tail = ___)
+```
+
+```{r normal3_h3-hint-2}
+pnorm(100, mean = 145, sd = ___, lower.tail = ___)
+
+ #### ATTENTION: Hint suivant = solution !####
+```
+
+```{r normal3_h3-solution}
+## Solution ##
+pnorm(100, mean = 145, sd = 22, lower.tail = TRUE)
+```
+
+```{r normal3_h3-check}
+grade_code("Ici, c'est bien l'aire à gauche du quantile 100 cm qui nous intéresse. Elle correspond à la probabilité qu'un plant soit moins haut que ce quantile et se calcule en spécifiant `lower.tail = FALSE` dans la fonction `pnorm()`.")
+```
+
+Calculez la probabilités d'avoir un plant de maïs prélevé au hasard dont la hauteur est comprise entre 120 et 150 cm en utilisant les aires à gauche des quantiles et toujours la fonction `pnorm()`.
+
+```{r normal4_h3, exercise=TRUE}
+pnorm(___, mean = ___, sd = ___, lower.tail = ___) -
+  ___
+```
+
+```{r normal4_h3-hint-1}
+pnorm(150, mean = ___, sd = ___, lower.tail = ___) -
+  pnorm(___, mean = ___, sd = ___, lower.tail = ___)
+```
+
+```{r normal4_h3-hint-2}
+pnorm(150, mean = ___, sd = ___, lower.tail = ___) -
+  pnorm(120, mean = ___, sd = ___, lower.tail = ___)
+
+ #### ATTENTION: Hint suivant = solution !####
+```
+
+```{r normal4_h3-solution}
+## Solution ##
+pnorm(150, mean = 145, sd = 22, lower.tail = TRUE) -
+  pnorm(120, mean = 145, sd = 22, lower.tail = TRUE)
+```
+
+```{r normal4_h3-check}
+grade_code("Une aire comprise entre deux quantiles se calcule toujours en soustrayant la plus petite de la plus grande (par rapport aux deux quantiles respectifs). Deux calculs sont possibles : via les aires à gauche comme ici, ou via les aires à droite en utilisant `lower.tail = FALSE`.")
+```
+
+En partant de la distribution théorique $Y \sim N(10, 6.25)$, calculez le quantile délimitant une probabilités à droite de 0.1 (10% des plus grandes observations), en utilisant l'une des fonctions p/q/r/d.
+
+<!-- 💬 **Ce code correspond au snippet `.inquant`.** -->
+
+```{r normal5_h2, exercise=TRUE}
+qnorm(___, mean = ___, sd = __, lower.tail = ___)
+```
+
+```{r normal5_h2-hint-1}
+qnorm(0.1, mean = ___, sd = ___, lower.tail = ___)
+
+ #### ATTENTION: Hint suivant = solution !####
+```
+
+```{r normal5_h2-solution}
+## Solution ##
+qnorm(0.1, mean = 10, sd = 2.5, lower.tail = FALSE)
+```
+
+```{r normal5_h2-check}
+grade_code("La fonction `qnorm()` calcule un quantile à partir d'une probabilité, contrairement à `pnorm()` qui calcule une probabilité à partir d'un quantile. Vous auriez aussi pu utiliser `quantile(dist_normal(10, 2.5), 1 - 0.1)`... pourquoi `1 - 0.1` ? Parce que `quantile()` calcule toujours par rapport à l'aire à gauche, donc, l'aire complémentaire à nos 10%, soit 90% ici !")
+```
+
+## Conclusion
+
+Vous rencontrerez très souvent la loi normale dans vos analyses de données biologiques. Être capable de vérifier si un échantillon suit cette distribution ou non sera également très utile. Faites tout de même attention à la **taille de l'échantillon**. Il vous faut plusieurs dizaines d'observations, sinon, vous n'aurez pas suffisamment de données pour l'estimer de manière valable.
+
+```{r comm_noscore, echo=FALSE}
+question_text(
+  "Laissez-nous vos impressions sur cet outil pédagogique",
+  answer("", TRUE, message = "Pas de commentaires... C'est bien aussi."),
+  incorrect = "Vos commentaires sont enregistrés.",
+  placeholder = "Entrez vos commentaires ici...",
+  allow_retry = TRUE
+)
+```
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,5 @@`
`1`	`1`	`Version: 1.0`
	`2`	`+ProjectId: 44c74280-827c-489c-9f67-e3eba8c995d9`
`2`	`3`
`3`	`4`	`RestoreWorkspace: No`
`4`	`5`	`SaveWorkspace: No`