You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: inst/tutorials/A02La_progression/A02La_progression.Rmd
+21-21Lines changed: 21 additions & 21 deletions
Original file line number
Diff line number
Diff line change
@@ -45,7 +45,7 @@ Dans ce tutoriel, nous utiliserons ensemble R pour résoudre une question biolog
45
45
46
46
En partant d'un tableau de données relatif à de la biométrie humaine contenant 395 observations et sept variables :
47
47
48
-
```{r, echo=TRUE}
48
+
```{r, echo=TRUE, warning=FALSE}
49
49
# Chargement de SciViews::R
50
50
SciViews::R(lang = "fr")
51
51
# Importation du jeu de données
@@ -76,7 +76,7 @@ Le point d'interrogation devant notre jeu de données renvoie vers une page d'ai
76
76
77
77
Nous commençons par sélectionner des colonnes d'intérêt du tableau initial `biometry`.
78
78
79
-
```{r, echo = TRUE}
79
+
```{r, echo=TRUE}
80
80
bio <- sselect(biometry, -day_birth, -wrist, -year_measure)
81
81
```
82
82
@@ -86,25 +86,25 @@ Nous réalisons cette sélection avec la fonction `sselect()` en éliminant des
86
86
87
87
Utilisons la fonction `tabularise()` du package {tabularise} maintenant pour présenter les huit premières lignes de notre jeu de données.
88
88
89
-
```{r, echo=TRUE}
89
+
```{r, echo=TRUE, warning=FALSE}
90
90
tabularise(bio, max.rows = 8)
91
91
```
92
92
93
93
**Notez ceci :**
94
94
95
-
Le pipe `%>.%` et le chaînage que nous avons également découvert à la fin du précédent tutoriel sont employés dans les instructions ci-dessus.
95
+
Le "pipe"`%>.%` (prononcez "païpe" comme en anglais) et le chaînage que nous avons également découvert à la fin du précédent tutoriel sont employés dans les instructions ci-dessus.
96
96
97
97
Considérons maintenant uniquement les femmes. On peut filtrer les lignes d'un tableau de données en utilisant comme critère `gender == "W"` (**attention :** notez bien que dans un *test de condition*, l'égalité s'écrit avec **deux** signes égaux dans R). Les autres options sont : `!=` pour différent de, `>` pour plus grand que, `<` pour plus petit que, ainsi que `>=` ou `<=` pour plus grand ou égale et plus petit ou égal.
98
98
99
-
```{r, echo=TRUE}
99
+
```{r, echo=TRUE, warning=FALSE}
100
100
bio %>.%
101
101
sfilter(., gender == "W") %>.%
102
102
tabularise(., max.rows = 8)
103
103
```
104
104
105
105
Continuons à manipuler notre tableau en sélectionnant des colonnes et en filtrant les lignes en une seule opération. Pour sélectionner les femmes `gender == "W"` et retirer la colonne `age`, nous utiliserons :
106
106
107
-
```{r, echo=TRUE}
107
+
```{r, echo=TRUE, warning=FALSE}
108
108
bio %>.%
109
109
sfilter(., gender == "W") %>.% # Sélectionne les femmes
Avez-vous remarqué la ressemblance dans la syntaxe employée pour réaliser un graphique en barres, un histogramme, un graphique en violon ou encore un nuage de points ? Nous utilisons la fonction `chart()` à chaque fois. On commence par lui fournir le tableau de données à employer avec `data =`, puis une "formule", c'est-à-dire une description de type `y ~ x` ... avec le tilde `~` qui caractérise cet objet formule. Si on reprend le nuage de points réalisé, on utilise le tableau `biometry` pour réaliser un graphique de la hauteur en fonction (symbolisé par le tilde `~` donc) de la masse. On spécifie que ce graphique est un nuage de points grâce à `geom_point()`. La formule peut être plus complexe si on souhaite ajouter des éléments en plus (comme différencier le genre des personnes grâce à la couleur). Le `+`permet d'ajouter des couches sur le graphique. En résumé, on aura la structure ci-dessous. La fonction `geom_...()` va varier en fonction du type de graphique à réaliser : `geom_point()` (un nuage de points), `geom_bar()` (un graphique en barres), `geom_histogram()` (un histogramme), `geom_boxplot()` (une boite de dispersion)... Si toute cette terminologie vous est étrangère, n'ayez crainte, nous l'étudierons progressivement. Retenez simplement à ce stade qu'il s'agit de types différents de graphiques. Nous pouvons donc résumer le canevas général comme suit (avec les items en lettres majuscules à replacer selon le contexte) :
158
158
159
-
```{r, echo=TRUE, eval = FALSE}
159
+
```{r, echo=TRUE, eval=FALSE}
160
160
chart(data = DF, FORMULA) +
161
161
geom_TYPE()
162
162
```
@@ -282,7 +282,7 @@ weight_w / height_w^2
282
282
283
283
- Éviter d'utiliser des caractères accentués.
284
284
285
-
- Si possible, utilisez des noms en anglais. Certainement si votre travail sera échangé avec d'autres scientifiques en international, ... mais c'est une bonne habitude à prendre même sur votre propre code. Pour reprendre l'exemple précédent `wrist_circumference`
285
+
- Si possible, utilisez des noms en anglais. Certainement si votre travail sera échangé avec d'autres scientifiques en international... mais c'est une bonne habitude à prendre même sur votre propre code. Pour reprendre l'exemple précédent `wrist_circumference`
286
286
287
287
Réalisez les mêmes opérations sur les individus 8 à 12 qui sont des hommes.
288
288
@@ -381,7 +381,7 @@ man <- dtx(
381
381
weight = ___,
382
382
height = ___
383
383
)
384
-
# Afficher le tableau
384
+
# Afficher le tableau (simplement sans utiliser tabularise)
385
385
___
386
386
```
387
387
@@ -394,7 +394,7 @@ man <- dtx(
394
394
weight = weight_m,
395
395
height = height_m
396
396
)
397
-
# Afficher le tableau
397
+
# Afficher le tableau (simplement sans utiliser tabularise)
Vous pouvez observer que la taille est ici exprimée en centimètres, il faut en tenir compte lors du calcul de l'IMC qui attend la taille exprimée en mètre. Un jeu de données réduit est employé pour expliciter les suites d'instructions `bio_100` qui ne reprends que 100 observations du jeu de données complet `biometry`.
467
+
Vous pouvez observer que la taille est ici exprimée en centimètres, il faut en tenir compte lors du calcul de l'IMC qui attend la taille exprimée en mètre. Un jeu de données réduit est employé pour expliciter les suites d'instructions `bio_100` qui ne reprend que 100 observations du jeu de données complet `biometry`.
468
468
469
469
Pour calculer l'IMC sur le jeu de données `bio_100`, nous employons à nouveau la fonction `smutate()`.
470
470
@@ -502,7 +502,7 @@ head(biometry, n = 5)
502
502
503
503
```{r bio_imc_h2-check}
504
504
grade_code(
505
-
correct = "Vous progressez très rapidement.", incorrect = "Observez comment nous avions fait sur `bio`. N'auriezvous pas oublié quelque chose ?")
505
+
correct = "Vous progressez très rapidement.", incorrect = "Observez comment nous avions fait sur `bio`. N'auriez-vous pas oublié quelque chose ?")
506
506
```
507
507
508
508
## Signification de l'IMC
@@ -532,14 +532,14 @@ Vous avez à votre disposition la fonction `case_when()` qui permet d'attribuer
532
532
Ajoutez une nouvelle variable qui tient compte de l'échelle de l'OMS dans le jeu de données `bio_100` dans la variable `bmi_cat`. Analysez la structuration de la suite d'instructions, les conditions employées, la position des guillemets ...
grade_code("C'est correct. Vous êtes maintenant capable de réaliser des catégories avec `case_when()`.")
580
580
```
581
581
582
-
Votre nouvelle variable contient des chaînes de caractères (du texte). Elle est de classe **character** dans R. Cependant, c'est une variable non numérique. On parle encore de variable qualitative ou variable "facteur" en statistiques. Si nous voulons qu'elle soit comprise comme tel dans R, nous pouvons la convertir en un objet **factor** avec la fonction `factor()`. Avec l'argument `levels =`, nous spécifions l'ordre des différents niveaux de notre variable. Nous utilisons la fonction `smutate()` comme précédemment.
582
+
Votre nouvelle variable contient des chaînes de caractères (du texte). Elle est de classe **character** dans R. Cependant c'est une variable non numérique. On parle encore de variable qualitative ou variable "facteur" en statistiques. Si nous voulons qu'elle soit comprise comme tel dans R, nous pouvons la convertir en un objet **factor** avec la fonction `factor()`. Avec l'argument `levels =`, nous spécifions l'ordre des différents niveaux de notre variable. Nous utilisons la fonction `smutate()` comme précédemment.
583
583
584
584
Pour convertir en **factor** notre nouvelle variable `bmi_cat` dans `bio_100`, nous faisons donc :
0 commit comments