You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: NEWS.md
+6Lines changed: 6 additions & 0 deletions
Original file line number
Diff line number
Diff line change
@@ -1,3 +1,9 @@
1
+
# BioDataScience3 2022.3.0
2
+
3
+
-**C02La_cv** and **C03La_roc** revised.
4
+
5
+
-**C02Lb_ml2** and **C03Lb_ml3** partly revised, but inactivated because they have to be further reworked before being useful (`.inactivated` at the end of the name).
6
+
1
7
# BioDataScience3 2022.2.0
2
8
3
9
-**C00La_rappel** renamed **C00La_refresh** and also totally reworked. Also includes explanations about changes between svbox2021 and svbox2022.
@@ -81,25 +81,25 @@ Le graphique des éboulis est présenté ci-dessous.
81
81
chart$scree(rice_pca)
82
82
```
83
83
84
-
La représentation dans l'espace des variables est proposée ci-dessous
84
+
Voici la représentation dans l'espace des variables pour le premier plan de l'ACP :
85
85
86
86
```{r, echo=TRUE}
87
-
chart(rice_pca, type = "loadings")
87
+
chart$loadings(rice_pca)
88
88
```
89
89
90
-
La représentation dans l'espace des individus est proposée ci-dessous
90
+
... et la représentation dans l'espace des individuspour le premier plan de l'ACP :
91
91
92
92
```{r, echo=TRUE}
93
-
chart(rice_pca, type = "scores", labels = rice$class)
93
+
chart$scores(rice_pca, labels = rice$class)
94
94
```
95
95
96
-
L'exploration des données a été réalisée pour vous. Avant de passer à la section suivante, explorer les tableaux et les graphiques proposés ci-dessus.
96
+
Analysez par vous-même les résultats de l'ACP et estimez si vous penser que l'ADL fonctionnera sur cette base. Ensuite, passez à la section suivante.
97
97
98
98
## Préparation du set d'apprentissage et de test
99
99
100
-
Utilisez les fonctions `initial_split()`, `training()` et `testing()`du package `rsamples`afin de définir votre set d'apprentissage et votre set de test. Votre set d'apprentissage se nomme`rice_train` et votre set de test se nomme`rice_test`. Il vous est demandé de réaliser un set d'entrainement contenant 0.8 des observations. Cet échantillonnage doit être stratifié grâce à la variable `class`.
100
+
Utilisez les fonctions `initial_split()`, `training()` et `testing()` afin de définir votre set d'apprentissage et votre set de test. Votre set d'apprentissage se nommera`rice_train` et votre set de test se nommera`rice_test`. Il vous est demandé de réaliser un set d'entraînement contenant 80% des observations. Cet échantillonnage doit être stratifié pour la variable `class`.
101
101
102
-
```{r rice_split_h2, exercise = TRUE}
102
+
```{r rice_split_h2, exercise=TRUE}
103
103
set.seed(8888) # Fixer le début du générateur de nombres pseudo-aléatoires
grade_code("Parfait ! Vous avez réalisez votre set d'apprentissage et votre set d'évaluation avec les proportions demandées.", "Avezvous bien respectée les consignes ? Il ne faut compléter que les éléments signalés par ___.")
132
+
grade_code("Vous avez réalisé votre set d'apprentissage et votre set de test avec les proportions demandées.", "Avez-vous bien respectée les consignes ? Il ne faut compléter que les champs signalés par ___.")
133
133
```
134
134
135
135
## Création des classifieurs
@@ -138,16 +138,14 @@ grade_code("Parfait ! Vous avez réalisez votre set d'apprentissage et votre set
138
138
139
139
Il vous est demandé de réaliser un classifieur utilisant l'analyse discriminante linéaire. C'est à vous de définir le tableau de données à employer entre `rice`, `rice_train` et `rice_test`.
140
140
141
-
Entrainez un modèle de type analyse discriminant linéaire avec le set d'apprentissage. Votre objectif est de prédire la variable `class` à l'aide des sept variable. Assignez le classifieur n'utilisant pas la validation croisée à `rice_lda` et assignez le classifieur utilisant la validation croisée à rice_cv_lda.
141
+
Entraînez un modèle de type analyse discriminant linéaire avec le set d'apprentissage (utilisez la formule condensée). Votre objectif est de prédire la variable `class` à l'aide des sept autres variables. Assignez le classifieur n'utilisant pas la validation croisée à `rice_lda` et assignez le classifieur utilisant la validation croisée à `rice_lda_cv`.
142
142
143
143
```{r lda_h2, exercise = TRUE}
144
-
set.seed(8888)
145
144
rice_lda <- mlLda(data = ___, ___ ~ ___)
146
145
summary(rice_lda)
147
146
```
148
147
149
148
```{r lda_h2-hint-1}
150
-
set.seed(8888)
151
149
rice_lda <- mlLda(data = rice_train, ___ ~ ___)
152
150
summary(rice_lda)
153
151
@@ -156,27 +154,22 @@ summary(rice_lda)
156
154
157
155
```{r lda_h2-solution}
158
156
## Solution ##
159
-
set.seed(8888)
160
157
rice_lda <- mlLda(data = rice_train, class ~ .)
161
158
summary(rice_lda)
162
159
```
163
160
164
161
```{r lda_h2-check}
165
-
grade_code("Votre LDA est entrainé. Il faut encore mesuré ces performances.", "Avezvous bien proposé la formule écrites sous sa forme condensée ? ")
162
+
grade_code("Votre classifieur LDA est entrainé. Il faut encore en mesurer les performances.", "Avez-vous bien proposé la formule écrite sous sa forme condensée ? ")
166
163
```
167
164
168
-
*La formule doit être écrite sous sa forme condensée*
169
-
170
-
Réalisez à présent votre modèle en utilisant la validation croisée.
165
+
Calculez maintenant votre classifieur afin d'en étudier les performances à l'aide de la validation croisée (toujours en utilisant la formule condensée).
171
166
172
-
```{r lda_cv_h2, exercise = TRUE}
173
-
set.seed(8888)
167
+
```{r lda_cv_h2, exercise=TRUE}
174
168
rice_lda_cv <- mlLda(data = ___, ___ ~ ___)
175
169
summary(rice_lda_cv)
176
170
```
177
171
178
172
```{r lda_cv_h2-hint-1}
179
-
set.seed(8888)
180
173
rice_lda_cv <- mlLda(data = rice, ___ ~ ___)
181
174
summary(rice_lda_cv)
182
175
@@ -185,24 +178,17 @@ summary(rice_lda_cv)
185
178
186
179
```{r lda_cv_h2-solution}
187
180
## Solution ##
188
-
set.seed(8888)
189
181
rice_lda_cv <- mlLda(data = rice, class ~ .)
190
182
summary(rice_lda_cv)
191
183
```
192
184
193
185
```{r lda_cv_h2-check}
194
-
grade_code("Votre LDA avec validation croisée est entrainée. Il faut encore mesuré ces performances.", "Avezvous bien proposé la formule écrites sous sa forme condensée ?")
186
+
grade_code("Si vous souhaitez utiliser la validation croisée pour le test, vous pouvez entraîner votre modèle sur l'ensemble des données dans un premier temps avec {mlearning} que nous utilisons ici. Il faut bien sûr encore mesurer ses performances.", "Avez-vous bien écrit la formule sous sa forme condensée ?")
195
187
```
196
188
197
-
*La formule doit être écrite sous sa forme condensée*
189
+
## Évaluation des performances des classifieurs
198
190
199
-
## Évaluation des classifieurs
200
-
201
-
Vous avez réalisé deux classifieurs `rice_lda` et `rice_lda_cv`. Le premier n'utilise pas la validation croisée alors que le second l'utilise.
202
-
203
-
Les tableaux de données disponibles sont les suivants : `rice`, `rice_train`, `rice_test`
204
-
205
-
Évaluez les performances du premier classifieur `rice_lda`
191
+
Évaluez les performances du premier classifieur `rice_lda` sans validation croisée. Pour rappel, les jeux de données disponibles sont les suivants : `rice`, `rice_train` et `rice_test`
206
192
207
193
```{r pred_lda_h2, exercise = TRUE}
208
194
# prédiction
@@ -231,13 +217,13 @@ summary(rice_conf)
231
217
```
232
218
233
219
```{r pred_lda_h2-check}
234
-
grade_code("Vous venez de calculer les métriques de performances du premier classifieur. Prenez un peu de temps pour analyser votre matrice de confusion et les métriques qui en découlent.")
220
+
grade_code("Vous venez de calculer les métriques de performances du premier classifieur. Prenez un peu de temps pour analyser votre matrice de confusion et les métriques qui en découlent. Combien de données sont utilisées ici ?")
235
221
```
236
222
237
-
Évaluez les performances du second classifieur `rice_lda_cv` à l'aide d'une validation croisée dix fois.
223
+
Évaluez les performances du second classifieur `rice_lda_cv`, cette fois-ci, à l'aide d'une validation croisée dix fois.
grade_code("Vous venez de réaliser les analyses des performances du second classifieur. Prenez un peu de temps pour analyser votre matrice de confusion et les métriques qui en découlent.")
255
+
grade_code("Toute la mécanique de la validation croisée est \"déployée\" à l'intérieur de `cvpredict()`. En réalité, les données sont divisées en 10 sous-unités et 10 classifieurs différents sont entraînées et testés successivement. Aucun n'est identique à `rice_lda_cv`, mais ils en sont tous relativement proches. Prenez un peu de temps pour analyser votre matrice de confusion et les métriques qui en découlent. Combien de données sont utilisées ici ?")
270
256
```
271
257
272
-
Répondez aux questions ci-dessous. Ces questions portent sur l'évaluation des deux classifieurs.
258
+
Répondez aux questions ci-dessous relatives aux deux classifieurs `rice_lda` et `rice_lda_cv`.
273
259
274
260
```{r qu_lda_cv}
275
261
quiz(
@@ -280,7 +266,7 @@ quiz(
280
266
submit_button = "Soumettre une réponse",
281
267
try_again_button = "Resoumettre une réponse",
282
268
incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
283
-
correct = "Bravo, c'est correct !"),
269
+
correct = "C'est le nombre d'observations utilisées en apprentissage qui sont déterminantes ici (plus d'observations mènent potentiellement à un meilleur classifieur)."),
284
270
question("Combien d'items sont employé afin de déterminer les performances du classifieur avec validation croisée ?",
incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
304
-
correct = "Bravo, c'est correct ! Vous avez analysé correctement les résulatats de votre analyse.")
290
+
correct = "Vous avez analysé correctement les résultats obtenus.")
305
291
)
306
292
```
307
293
308
294
## Conclusion
309
295
310
-
Ce tutoriel vous a permis de découvrir la validation croisée appliquée sur une analyse discriminante linéaire. L'avantage de la validation croisée est de pouvoir employer plus de données pour entrainer votre classifieur.
296
+
Ce tutoriel vous a permis de découvrir la validation croisée appliquée sur une analyse discriminante linéaire. L'avantage de la validation croisée est de pouvoir employer plus de données pour entraîner votre classifieur. Il n'est pas nécessaire de séparer les groupes à la main et de calculer *n* fois les performances avant de sommer les *n* matrices de confusion en une seule. La fonction `cvpredict()` se charge de faire tout cela pour vous automatiquement.
0 commit comments