You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: inst/tutorials/02b_decouverte/decouverte.Rmd
+16-16Lines changed: 16 additions & 16 deletions
Original file line number
Diff line number
Diff line change
@@ -56,7 +56,7 @@ Si vous n'avez jamais utilisé de tutoriel "learnr", familiarisez-vous d'abord a
56
56
57
57

58
58
59
-
> Conformément au RGPD ([Règlement Général sur la Protection des Données](https://ec.europa.eu/info/law/law-topic/data-protection/reform/rules-business-and-organisations/principles-gdpr_fr)), nous sommes tenus de vous informer de ce que vos résultats seront collecté afin de suivre votre progression. **Les données seront enregistrées au nom de l'utilisateur apparaissant en haut de cette page. Corrigez si nécessaire !** En utilisant ce tutoriel, vous marquez expressément votre accord pour que ces données puissent être collectées par vos enseignants et utilisées pour vous aider et vous évaluer. Après avoir été anonymisées, ces données pourront également servir à des études globales dans un cadre scientifique et/ou éducatif uniquement.
59
+
> Conformément au RGPD ([Règlement Général sur la Protection des Données](https://ec.europa.eu/info/law/law-topic/data-protection/reform/rules-business-and-organisations/principles-gdpr_fr)), nous sommes tenus de vous informer de ce que vos résultats seront collectés afin de suivre votre progression. **Les données seront enregistrées au nom de l'utilisateur apparaissant en haut de cette page. Corrigez si nécessaire !** En utilisant ce tutoriel, vous marquez expressément votre accord pour que ces données puissent être collectées par vos enseignants et utilisées pour vous aider et vous évaluer. Après avoir été anonymisées, ces données pourront également servir à des études globales dans un cadre scientifique et/ou éducatif uniquement.
60
60
61
61
62
62
## Objectif
@@ -74,7 +74,7 @@ R est un programme **Open Source** qui permet la manipulation, la visualisation
74
74
75
75
### Manipuler
76
76
77
-
En partant d'un tableau de données relatif à de la biométrie humaine contenant 395 observations. Ce jeu de données comprend 7 variables :
77
+
En partant d'un tableau de données relatif à de la biométrie humaine contenant 395 observations et 7 variables :
78
78
79
79
```{r, echo=TRUE}
80
80
# Chargement de SciViews::R
@@ -92,7 +92,7 @@ SciViews::R
92
92
93
93
- Le jeu de données est disponible dans un package R : `BioDataScience`, spécialement préparé pour ce cours.
94
94
95
-
- L'anglais est la langue la plus employé en science des données. Les jeux de données employées seront encodé en anglais.
95
+
- L'anglais est la langue la plus employée en science des données. Les jeux de données employées seront encodés en anglais.
96
96
97
97
Le point d'interrogation devant notre jeu de données renvoit vers une page d'aide.
98
98
@@ -110,9 +110,9 @@ biometry %>.%
110
110
111
111
**Notez ceci :**
112
112
113
-
Nous utilisons ici le chaînage (%>.%) et une sélection en éliminant des colonnes du tableau que nous n’utiliserons pas (la 3ème, la 7èmeet la 8ème).
113
+
Nous utilisons ici le chaînage (%>.%) et une sélection en éliminant des colonnes du tableau que nous n’utiliserons pas (la 3ème, la 7ème et la 8ème).
114
114
115
-
L’assignation du résultat est plus lisible quand elle est réalisée à la fin (-> bio) lorsqu’on utilise un chaînage d’instructions.
115
+
Lorsqu’on utilise un chaînage d’instructions, l’assignation du résultat est plus lisible quand elle est réalisée à la fin (-> bio).
116
116
117
117
118
118
La fonction `kable()` du package `knitr` peut être appelée directement sans charger le package à l'aide de l'instruction `knitr::kable()`. Elle permet de formatter correctement un tableau dans Markdown. Utilisons-là maintenant pour présenter les huit premières lignes de notre jeu de données.
@@ -234,7 +234,7 @@ Rappelez-vous de la formule qui est :
234
234
235
235
$$BMI (kg/m^2) = \frac{weight(kg)}{height(m)^2}$$
236
236
237
-
On peut employer les opérations mathématiques de base avec R. elles respectent l'ordre de priorité des opérateurs mathématiques. Au besoin, il est possible d'indiquer explicitement, ou de modifier les priorités avec des parenthèses comme `3 * (2 + 1)`.
237
+
On peut employer les opérations mathématiques de base avec R. Elles respectent l'ordre de priorité des opérateurs mathématiques. Au besoin, il est possible d'indiquer explicitement, ou de modifier les priorités avec des parenthèses comme `3 * (2 + 1)`.
238
238
239
239
| Opérations de base | Symboles |
240
240
|:-------------------|:--------:|
@@ -250,7 +250,7 @@ La formule mathématique se traduit donc comme suit en une instruction que R peu
250
250
50 / 1.70^2
251
251
```
252
252
253
-
**Notez ceci :** R indique un `[1]` devant la réponse. En fait, R travaille avec des vecteurs (même si ici, le vecteur ne contient qu'un seul élément). Ainsi, le nombre entre crochets devant indique la position dans le vecteur. Ce calcul sur vecteurs nous sera très utile lorsque nous traoterons l'ensemble du tableau. En effet, le même calcul sera _automatiquement distribué_ sur tous les individus !
253
+
**Notez ceci :** R indique un `[1]` devant la réponse. En fait, R travaille avec des vecteurs (même si ici, le vecteur ne contient qu'un seul élément). Ainsi, le nombre entre crochets devant indique la position dans le vecteur. Ce calcul sur vecteurs nous sera très utile lorsque nous traiterons l'ensemble du tableau. En effet, le même calcul sera _automatiquement distribué_ sur tous les individus !
254
254
255
255
L'IMC de cette femme indique qu'elle est en `sous-poids` selon l'échelle de l'OMS.
256
256
@@ -290,7 +290,7 @@ Vous vous retrouvez rapidement avec 5 nouveaux individus femmes et hommes.
290
290
| 6 | W | 66 | 179 |
291
291
| 7 | W | 54 | 168 |
292
292
293
-
Le calcul un à un de l'IMC de chaque individu va très rapidement devenir fastidueux. R permet de créer des vecteurs que l'on peut affecter à des symboles avec la flèche `<-` (constituée du signe plus petit que immédiatemment suivi du signe moins) comme le montre l'exemple ci-dessous. Pour rassembler plusieurs valeurs dans un vecteur on les "concatène"s avec la fonction `c()` :
293
+
Le calcul un à un de l'IMC de chaque individu deviendra très rapidement fastidueux. R permet de créer des vecteurs que l'on peut affecter à des symboles avec la flèche `<-` (constituée du signe plus petit que immédiatemment suivi du signe moins) comme le montre l'exemple ci-dessous. Pour rassembler plusieurs valeurs dans un vecteur on les "concatène"s avec la fonction `c()` :
294
294
295
295
```{r, echo=TRUE}
296
296
# Assignation des valeurs de masses dans un vecteur nommé `weight`
@@ -307,15 +307,15 @@ weight_w / height_w^2
307
307
308
308
- Choisissez bien les noms de vos objets. Ces noms doivent être courts, mais informatifs concernant leur contenu.
309
309
310
-
- Rappelez-vous que noms acceptables commencent par une lettre, et comportent ensuite des lettres, chiffres, le trait souligné `_` ou le point `.`.
310
+
- Rappelez-vous que des noms acceptables commencent par une lettre, et comportent ensuite des lettres, chiffres, le trait souligné `_` ou le point `.`.
311
311
312
312
- Comme il est difficile de mémoriser la casse d'un nom, il est conseillé d'utiliser uniquement des lettres minuscules.
313
313
314
314
- Si le nom est constitué de plusieurs mots, il est préférable de séparer ces mots par un trait souligné. Pour rappel, l'espace n'est pas utilisable. Par exemple, `circomference_poignet`.
315
315
316
316
- Eviter d'utiliser des caractères accentués.
317
317
318
-
- Si possible, utilisez des noms en anglais. Certainement si votre travail sera échangé avec d'autres scientifiques en international, ... mais c'est une bonne habitude à prendre même sur votre propre code. Pour reprendre l'exemple précendet`wrist_circumference`
318
+
- Si possible, utilisez des noms en anglais. Certainement si votre travail sera échangé avec d'autres scientifiques en international, ... mais c'est une bonne habitude à prendre même sur votre propre code. Pour reprendre l'exemple précedent`wrist_circumference`
319
319
320
320
Réalisez les mêmes opérations sur les individus de 8 à 12.
321
321
@@ -358,7 +358,7 @@ weight_m / height_m^2
358
358
359
359
## Encodage d'un tableau de données
360
360
361
-
Il devient rapidement évident qu'il est plus simple que nos observations de terrain soient rassemblées en un jeu de données structuré. Pour cela vous allez créer ce qu'on appelle un **"data frame"** (qui se traduit en français par "tableau de données") dans R. La fonction qui permet de le créer est `data_frame()`. Cette dernière va permettre de combiner vos différents vecteurs colonne par colonne dans un tableau.
361
+
Il devient rapidement évident qu'il est plus simple que nos observations de terrain soient rassemblées en un jeu de données structuré. Pour cela vous allez créer ce qu'on appelle un **"data frame"** (qui se traduit en français par "tableau de données") dans R. La fonction qui permet de le créer est `data_frame()`. Cette dernière permet de combiner vos différents vecteurs colonne par colonne dans un tableau.
362
362
363
363
Dans `data_frame()`, vous entrerez vos différents vecteurs comme autant d'**arguments** de la fonction, séparés par une `,`. De plus, vous pouvez nommer vos colonnes en donnant des noms aux arguments de type `nom = valeur`. Analysez avec attention l'exemple ci-dessous.
364
364
@@ -606,7 +606,7 @@ head(biometry)
606
606
# Not yet...
607
607
```
608
608
609
-
Votre nouvelle variable comprend une succession de lignes complétées par des chaines de caractères. Organisez cette variable de votre tableau de données avec la fonction `factor()`. Observez la nouvelle structuration de la suite d'instructions. Vous observez pour la première fois l'opérateur `$`. Dans l'exemple ci-dessous, lorsque vous utilisez `bio_100$echelle_imc`, vous pouvez l'interprétez comme : "dans le tableau de données `bio_100`, je prend la colonne/variable `echell_imc`. La fonction `factor()` s'applique donc sur cette colonne (dont le vecteur est extrait). Avec l'argument `levels`, vous spécifiez l'ordre des différents niveaux de votre variable à classer.
609
+
Votre nouvelle variable comprend une succession de lignes complétées par des chaines de caractères. Organisez cette variable de votre tableau de données avec la fonction `factor()`. Observez la nouvelle structuration de la suite d'instructions. Vous observez pour la première fois l'opérateur `$`. Dans l'exemple ci-dessous, lorsque vous utilisez `bio_100$echelle_imc`, vous pouvez l'interprétez comme : "dans le tableau de données `bio_100`, je prend la colonne/variable `echelle_imc`. La fonction `factor()` s'applique donc sur cette colonne (dont le vecteur est extrait). Avec l'argument `levels`, vous spécifiez l'ordre des différents niveaux de votre variable à classer.
610
610
611
611
Classer votre nouvelle variable avec le jeu de données `bio_100`.
En apparence, pas grand changement, mais maintenant, nous avons indiqué un ordre logique de progression dans les différents **niveaux** (`levels`) de la variable. Ici, nous pourrions faire encore mieux. Si nous utilisons la fonction `ordered()` à la place de `factor()`, avec les mêmes arguments, nous indiquons à R qu'en plus, les différents niveaux sont classés du plus petit au plus grand (`underweight` < `normal weight`< `overweight`< `obese`). Nous pouvons voir la façon dans les différents niveaux sont encodés à l'aide de la fonction `levels()`.
619
+
En apparence, pas grand changement, mais maintenant, nous avons indiqué un ordre logique de progression dans les différents **niveaux** (`levels`) de la variable. Ici, nous pourrions faire encore mieux. Si nous utilisons la fonction `ordered()` à la place de `factor()`, avec les mêmes arguments, nous indiquons à R qu'en plus, les différents niveaux sont classés du plus petit au plus grand (`underweight` < `normal weight`< `overweight`< `obese`). Nous pouvons voir la façon dont les différents niveaux sont encodés à l'aide de la fonction `levels()`.
620
620
621
-
Classer votre nouvelle variable avec le jeu de données `bio` tout entier, et en utilisant `ordered()` ici.
621
+
Classer votre nouvelle variable avec le jeu de données `bio` tout entier, et en utilisant `ordered()` ici.
Vos résultats concorde t'il avec les valeurs avancées dans les médias ? Représentons la distribution du bmi de nos individus sondés.
722
+
Vos résultats concordent-ils avec les valeurs avancées dans les médias ? Représentons la distribution du bmi de nos individus sondés.
723
723
724
724
```{r, echo = TRUE}
725
725
chart(bio_100, ~ bmi %fill=% gender) +
@@ -763,7 +763,7 @@ Durant cette séance, vous avez appris à :
763
763
- Rassembler des données dans un tableau "data frame"
764
764
- Remanier un tableau de données
765
765
766
-
Laissez nous vos impressions sur cet outil pédagogique ou expérimentez encore dans la zone ci-dessous. Rappelez-vous que pour placer un commentaire dans une zone de code R, vous devez utilisez un dièse (`#`) devant vos phrases.
766
+
Laissez nous vos impressions sur cet outil pédagogique ou expérimentez encore dans la zone ci-dessous. Rappelez-vous que pour placer un commentaire dans une zone de code R, vous devez utiliser un dièse (`#`) devant vos phrases.
0 commit comments