Skip to content

Commit 83db434

Browse files
committed
Revision of B08La_mfa
1 parent 490d978 commit 83db434

File tree

4 files changed

+38
-36
lines changed

4 files changed

+38
-36
lines changed

DESCRIPTION

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
Package: BioDataScience2
2-
Version: 2020.8.2
2+
Version: 2020.9.0
33
Title: A Series of Learnr Documents for Biological Data Science 2
44
Description: Interactive documents using learnr for studying biological data science (second course).
55
Authors@R: c(

NEWS.md

Lines changed: 4 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,10 +1,13 @@
11
# BioDataScience2 News
22

3+
## Changes in version 2020.9.0
4+
5+
- A new tutorial B08La_mfa is added.
6+
37
## Changes in version 2020.8.2
48

59
- In the B07La_pca tutorial, chart$<type>() does not work properly in specific cases. A work-around is introduced.
610

7-
811
## Changes in version 2020.8.1
912

1013
- In the B07La_pca tutorial, chart$<type>() does not work properly in specific cases. This is an attempt to fix it.

devel/tutorials/B08La_mfa/B08La_mfa.Rmd renamed to inst/tutorials/B08La_mfa/B08La_mfa.Rmd

Lines changed: 33 additions & 34 deletions
Original file line numberDiff line numberDiff line change
@@ -4,7 +4,7 @@ author: "Guyliann Engels & Philippe Grosjean"
44
description: "**SDD II Module 8** : Analyse factorielle multiple (AFM)"
55
tutorial:
66
id: "B08La_mfa"
7-
version: 0.0.1/8
7+
version: 2.0.0/8
88
output:
99
learnr::tutorial:
1010
progressive: true
@@ -214,7 +214,7 @@ BioDataScience2::learnr_server(input, output, session)
214214

215215
## Objectif
216216

217-
L'Analyse Factorielle Multiple (AFM) est une méthode statistique exploratoire qui permet de travailler avec plusieurs tableaux de données. Cette méthode permet également de faire le lien entre l'analyse en composantes principales (ACP) et l'Analyse factorielle des correspondances (AFC). La première méthode permet de travailler uniquement sur des variables quantitatives et la seconde uniquement sur des variables qualitatives. L'AFM est capable de traiter les deux types de variables. Cette méthode est par exemple employée en écologie. Sur une station un ensemble de mesures physico-chimiques peuvent être réaliseé ainsi qu'un relevé de la faune et/ou de la flore.
217+
L'Analyse Factorielle Multiple (AFM) est une méthode statistique exploratoire qui permet de travailler avec plusieurs tableaux de données. Cette méthode permet également de faire le lien entre l'analyse en composantes principales (ACP) et l'Analyse factorielle des correspondances (AFC). La première méthode permet de travailler uniquement sur des variables quantitatives et la seconde uniquement sur des variables qualitatives. L'AFM est capable de traiter les deux types de variables simultanément. Cette méthode est par exemple employée en écologie. Sur une station un ensemble de mesures physico-chimiques peuvent être réalisée ainsi qu'un relevé de la faune et/ou de la flore.
218218

219219
Il est donc utile de comprendre la logique et l'usage de cette analyse. Ce tutoriel vous permettra de\ :
220220

@@ -224,15 +224,15 @@ Il est donc utile de comprendre la logique et l'usage de cette analyse. Ce tuto
224224

225225
- Vous préparer à interpréter par vous-même les résultats de vos AFM
226226

227-
Avant toute chose, assurez vous d'avoir bien compris le contenu de la [section 8.1](https://wp.sciviews.org/sdd-umons2/?iframe=wp.sciviews.org/sdd-umons2-2020/analyse-factorielle-multiple-afm.html) du cours de SDDII.
227+
Avant toute chose, assurez vous d'avoir bien compris le contenu de la [section 8.1](https://wp.sciviews.org/sdd-umons2/?iframe=wp.sciviews.org/sdd-umons2-2020/analyse-factorielle-multiple-afm.html) du cours de SDD II.
228228

229-
## Etude de composition floristique
229+
## Étude de composition floristique
230230

231-
Des chercheurs ont étudié la composition floristique et les variables environnementales dans des forêts de pins oligotropes (*Pinus sylvestris*) dans l'est de la Fennoscandie, une région située au nord de l'Europe constituée de la Finlande, de la péninsule Scandinave, de la Carélie et de la péninsule de Kola.
231+
Des chercheurs ont étudié la composition floristique et les variables environnementales dans des forêts de pins sylvestres (*Pinus sylvestris*) dans l'est de la Fennoscandie, une région située au nord de l'Europe constituée de la Finlande, de la péninsule Scandinave, de la Carélie et de la péninsule de Kola.
232232

233-
![Fénoscandie](images/Fennoscandia.jpg)
233+
![Fénoscandie, by [Mapsed](https://fr.wiktionary.org/wiki/Fennoscandie#/media/Fichier:Fennoscandia.jpg), license CC-BY-SA 4.0](images/Fennoscandia.jpg)
234234

235-
Les 24 sites sélectionnés pour cette étude sont situés dans le nord de la Finlande et dans la péninsule de Kola. Quatorze variables environnementales ont été mesurées sur les différents sites d'étude dont onze permettant d'évaluer la quantité de nutriments présentant dans la matière organique (MO). Les différentes variables mesurées sont présentées dans le tableau ci-dessous.
235+
Les 24 sites sélectionnés pour cette étude sont situés dans le nord de la Finlande et dans la péninsule de Kola. Quatorze variables environnementales ont été mesurées sur les différents sites de l'étude, dont onze permettant d'évaluer la quantité de nutriments présentant dans la matière organique (MO). Les différentes variables mesurées sont présentées dans le tableau ci-dessous.
236236

237237
| label | description | unités |
238238
|:------------:|:-------------------------------|:-----------|
@@ -251,23 +251,23 @@ Les 24 sites sélectionnés pour cette étude sont situés dans le nord de la Fi
251251
| **Humdepth** | épaisseur de la couche d'humus | cm |
252252
| **pH** | pH du sol | - |
253253

254-
Ces données sont disponible depuis `"varechem"` dans le package {vegan}
254+
Ces données sont disponible depuis `varechem` dans le package {vegan}.
255255

256256
```{r, echo=TRUE}
257257
read("varechem", package = "vegan") %>.%
258258
rename(., station = rownames) -> envir
259259
head(envir)
260260
```
261261

262-
Les scientifiques ont également réalisé un relevé floristique (en excluant *Pinus sylvestris* du relevé). On y observe une couverture en pourcent pour chaque station de chacune des 44 espèces étudiées. Ces données sont également disponible depuis `"varespec"` dans le package {vegan}.
262+
Les scientifiques ont également réalisé un relevé floristique (en excluant *Pinus sylvestris* du relevé). On y observe une couverture en pourcentage pour chaque station de chacune des 44 espèces étudiées. Ces données sont également disponible depuis `varespec` dans le package {vegan}.
263263

264264
```{r, echo=TRUE}
265265
read("varespec", package = "vegan") %>.%
266266
rename(., station = rownames) -> spec
267267
head(spec)
268268
```
269269

270-
Les données mise à disposition proviennent de l'étude suivante [Väre, H., Ohtonen, R. and Oksanen, J. (1995) Effects of reindeer grazing on understorey vegetation in dry Pinus sylvestris forests. Journal of Vegetation Science 6, 523–530](https://www.researchgate.net/publication/227830523_Effects_of_reindeer_grazing_on_vegetation_in_dry_Pinus_sylvestris_forests).
270+
Les données mises à disposition proviennent de l'étude suivante [Väre, H., Ohtonen, R. and Oksanen, J. (1995) Effects of reindeer grazing on understorey vegetation in dry Pinus sylvestris forests. Journal of Vegetation Science 6, 523–530](https://www.researchgate.net/publication/227830523_Effects_of_reindeer_grazing_on_vegetation_in_dry_Pinus_sylvestris_forests).
271271

272272
## Préparation du tableau de données
273273

@@ -301,7 +301,7 @@ head(vare)
301301
```
302302

303303
```{r join_h2-check}
304-
grade_code("Maintenant que vous avez assemblé vos deux tableaux, vous allez pouvoir réalsier votre MFA. Il reste encore une petite étape avant cela.")
304+
grade_code("Maintenant que vous avez assemblé vos deux tableaux, vous allez pouvoir réaliser votre MFA. Il reste toutefois encore une petite étape avant cela.")
305305
```
306306

307307
Ensuite, convertissez la variable `station` en nom de ligne grâce à la fonction `column_to_rownames()`. Les numéros de stations seront utilisés par la suite sur la représentation dans l'espace de vos stations.
@@ -334,27 +334,27 @@ rownames(vare)
334334
```
335335

336336
```{r rowname_h2-check}
337-
grade_code("Bravo ! Vous venez de convertir la colonne station en nom de lignes. Cette astuce peut être utile dans certain cas. Il y a également la fonction opposée rownames_to_column(). Vous être prêt pour réaliser votre AFM à présent.")
337+
grade_code("Bravo ! Vous venez de convertir la colonne station en nom de lignes. Cette astuce peut être utile dans certain cas. Il y a également la fonction opposée rownames_to_column(). Tout est prêt pour réaliser l'AFM à présent.")
338338
```
339339

340340
## Réalisation de la AFM
341341

342-
L'AFM peut s'obtenir grâce à la fonction `mfa()`. Cette dernière requiert l'utilisation d'une formule avec une syntaxe un peu particulière. Votre formule commence par un `~` puis elle est composé de bloc qui doit contenir 3 élements
342+
L'AFM peut s'obtenir grâce à la fonction `mfa()`. Cette dernière requiert l'utilisation d'une formule avec une syntaxe un peu particulière. Votre formule commence par un `~` puis elle est composée de blocs qui doivent contenir trois éléments\ :
343343

344344
- 1. Le nombre **n** de colonnes constituant le groupe
345-
- 2. Le type des variables qui composent le groupe. Vous avez 4 possibilités :
346-
+ **s** : Ce sont des variables quantitatives que l'on souhaite standardiser et les traiter par une ACP.
347-
+ **c** : Ce sont des variables quantitatives que l'on ne souhaite pas standardiser et les traiter par une ACP.
348-
+ **f** : Ce sont des variables qualitatives associées à des tableaux de contingences qu'on traite par une AFC.
349-
+ **n** : Ce sont des variables qualitatives classiques qu'on traite par une AFC.
350-
- 3. Le nom de groupe de variable
345+
- 2. Le type des variables qui composent le groupe. Vous avez quatre possibilités\ :
346+
+ **s**\ : Ce sont des variables quantitatives que l'on souhaite standardiser et les traiter par une ACP.
347+
+ **c**\ : Ce sont des variables quantitatives continues que l'on ne souhaite pas standardiser et les traiter par une ACP.
348+
+ **f**\ : Ce sont des variables qualitatives facteurs associées à des tableaux de contingences qu'on traite par une AFC.
349+
+ **n**\ : Ce sont des variables qualitatives de type dénombrements qu'on traite par une AFC.
350+
- 3. Le nom à donner au groupe
351351

352-
Le tableau `vare` est composé de 14 variables associées à des mesures physicochimiques et 44 variables liées à des relevés floristiques. Votre formule doit comprendre les éléments suivants :
352+
Le tableau `vare` est composé de quatorze variables associées à des mesures physico-chimiques et 44 variables liées à des relevés floristiques. Votre formule doit comprendre les éléments suivants pour que votre analyse soit la plus proche possible de celle que les auteurs ont réalisée dans la publication\ :
353353

354354
- Le premier bloc doit se nommer **physico**, être traité par une ACP et les variables doivent être standardisées.
355355
- Le second bloc doit se nommer **flore**, être traité par une ACP et les variables ne doivent pas être standardisées.
356356

357-
Réalisez l'AFM demandée en utilisant le tableau `vare` puis affichez un résume de l'objet `vare_mfa` avec la fonction `summary()`
357+
Réalisez l'AFM demandée en utilisant le tableau `vare` puis affichez un résume de l'objet `vare_mfa` obtenu avec la fonction `summary()`
358358

359359
```{r varemfa}
360360
data.io::read("varechem", package = "vegan") %>.%
@@ -389,16 +389,16 @@ summary(vare_mfa)
389389
```
390390

391391
```{r mfa_h3-check}
392-
grade_code("Le résumé de votre analyse est complexe. Intéressez vous tout particulièrement à la part de variance de chaque axe. Ces informations vous seront utile pour répondre à la question suivante.")
392+
grade_code("Le résumé de votre analyse est complexe. Intéressez-vous tout particulièrement à la part de variance de chaque axe. Ces informations vous seront utile pour répondre à la question suivante.")
393393
```
394394

395395
```{r variance_quiz}
396-
question("Quelle est la proportion de la variance cumulée des deux premiers axes de l'AFM ?",
396+
question("Quelle est la proportion de la variance cumulée sur les deux premiers axes de l'AFM ?",
397397
answer("58%", correct = TRUE),
398398
answer("23%"),
399399
answer("34%"),
400-
correct = "Bien joué ! Les deux premiers axes de l'AFM expriment 58% de la variance. Gardez à l'esprit que cette valeur est assez faible. Il serait donc plus intéressant de considérer les 3 premiers axes pour exprimer 68% de la variance.",
401-
incorrect = "Oups, ce n'est pas la bonne réponse. Afin de trouver la bonne réponse, interessez vous au tableau `Eigenvalues`",
400+
correct = "Bien joué ! Les deux premiers axes de l'AFM expriment 58% de la variance. Gardez à l'esprit que cette valeur est assez faible. Il serait aussi intéressant de considérer les trois premiers axes qui expriment 68% de la variance totale.",
401+
incorrect = "Oups, ce n'est pas la bonne réponse. Afin de trouver la bonne réponse, intéressez-vous au tableau `Eigenvalues`",
402402
allow_retry = TRUE
403403
)
404404
```
@@ -434,7 +434,7 @@ chart$scree(vare_mfa)
434434
```
435435

436436
```{r scree_h2-check}
437-
grade_code("Vous venez de réaliser le graphique des éboulis associé à votre AFM. Ce graphique permet de voir la part de variance exprimée par chaque composante principale. Nous voyons bien que le premier axe reprend une très grande part de variance. On observe après un saut p pour le troisième axe est une diminution progressive de la variance exprimée sur les axes suivants.")
437+
grade_code("Ce graphique des éboulis permet de voir la part de variance exprimée sur chaque composante principale. Nous voyons bien que le premier axe reprend une très grande part de variance. On observe après un saut p pour le troisième axe est une diminution progressive de la variance exprimée sur les axes suivants.")
438438
```
439439

440440
### Représentation des variables
@@ -456,7 +456,7 @@ chart$loadings(vare_mfa, choices = c(1, 2))
456456
```
457457

458458
```{r loadings_h2-check}
459-
grade_code("Ce graphique est assez chargé vu qu'il combine les vecteurs du groupe physico et du groupe flore. Ce graphique s'analyse comme pour une ACP. Ce graphique permet de visualiser l'importance des variables intiales dans le plan de l'AFM sous forme de vecteurs. Il est indispensable pour interpréter le graphique suivant qui répartit les observations dans le même plan. La norme (longueur) du vecteur indique si la variable est bien représentée dans ce plan ou non. Plus la norme du vecteur se rapproche de un, matérialisé par le cercle, mieux c'est. Celles aux normes trop faibles ne sont pas considérées dans l'analyse pour ce plan-là en tous cas. Ensuite, les variables qui pointent dans la même direction sont corrélées positivement. Les variables qui pointent dans le sens opposé sont inversément corrélées. Les vecteurs orthogonaux correspondent à des variables non ou très faiblement corrélées entre elles")
459+
grade_code("Ce graphique est assez chargé car il combine les vecteurs du groupe \"physico\" et du groupe \"flore\". Il s'analyse comme pour une ACP via la visualisation de l'importance des variables intiales dans le plan de l'AFM sous forme de vecteurs. Il est indispensable pour interpréter le graphique suivant qui répartit les observations dans le même plan. La norme (longueur) du vecteur indique si la variable est bien représentée dans ce plan ou non. Plus la norme du vecteur se rapproche de un, matérialisé par le cercle, mieux c'est. Celles aux normes trop faibles ne sont pas considérées dans l'analyse, pour ce plan-là en tous cas. Ensuite, les variables qui pointent dans la même direction sont corrélées positivement. Les variables qui pointent dans le sens opposé sont inversément corrélées. Les vecteurs orthogonaux correspondent à des variables non ou très faiblement corrélées entre elles.")
460460
```
461461

462462
### Représentation des plans des ACP
@@ -478,7 +478,7 @@ chart$axes(vare_mfa, choices = c(1, 2))
478478
```
479479

480480
```{r axes_h2-check}
481-
grade_code("Ce graphique est similaire au précédent. Il s'interprète de la même façon. Cependant, on ne s'intéresse plus à la projection de chaque variable initiale mais des plans des ACP pour chaque groupe de variables. La première dimension du groupe flore pointe dans la meme direction que la seconde dimension du groupe physico. Il y a donc un forte corrélation entre ces deux plans. On obtient le même résultat pour le premier axe de physico et du second axe de flore. Les normes des vecteurs sont proche de 1 pour chacune des ACP. Les deux ACP sont représentées correctement au sein de l'AFM.")
481+
grade_code("Ce graphique est similaire au précédent. Il s'interprète de la même façon. Cependant, on ne s'intéresse plus à la projection de chaque variable initiale mais des plans des ACP pour chaque groupe de variables. La première dimension du groupe \"flore\" pointe dans la même direction que la seconde dimension du groupe \"physico\". Il y a donc un forte corrélation entre ces deux plans. On obtient le même résultat pour le premier axe de \"physico\" et du second axe de \"flore\". Les normes des vecteurs sont proche de 1 pour chacune des ACP. Les deux ACP sont représentées correctement dans l'AFM.")
482482
```
483483

484484
### Représentation des individus
@@ -500,12 +500,12 @@ chart$scores(vare_mfa, choices = c(1, 2))
500500
```
501501

502502
```{r scores_h2-check}
503-
grade_code("La forme du nuage de points et surtout des sous-groupes sont à rechercher ici. Nous pouvons voir par exemple un regroupement des stations 5,6 et 7. On retrouve également un groupe particulier composé des stations 2,3,4, 9,10,11,12. Attention, les numéros des stations ne sont pas une indication de la proximité des stations.")
503+
grade_code("La forme du nuage de points et surtout des clusters sont à rechercher ici. Nous pouvons voir par exemple un regroupement des stations 5, 6 et 7. On retrouve également un groupe particulier composé des stations 2, 3, 4, 9, 10, 11 et 12. Attention, les numéros des stations ne sont pas ici une indication de la proximité des stations.")
504504
```
505505

506506
## Interprétation de l'AFM
507507

508-
La représentation des variables ainsi que la représentation de stations sont deux graphiques complémentaires afin d'interpréter l'AFM. Gardez à l'esprit que la part de variance exprimée par les deux premiers axes restent assez faible avec 57%.
508+
La représentation des variables ainsi que la représentation de stations sont deux graphiques complémentaires afin d'interpréter l'AFM. Gardez à l'esprit que la part de variance exprimée par les deux premiers axes reste relativement faible avec 58%.
509509

510510

511511
```{r}
@@ -527,13 +527,13 @@ chart$scores(vare_mfa, choices = c(1, 2))
527527
chart$loadings(vare_mfa, choices = c(1, 2))
528528
```
529529

530-
Les stations 2, 3, 4, 9, 10, 11 et 12 sont des stations particulières qui ne sont pas des zones de pâturages. On retrouve dans ces stations une dominance de *Cladina stellaris* alors que cet espèce est très peu présente dans les zones de pâturages. Les zones de pâturages sont caractérisée par une haute concentration en azote. Les stations 5,6,7 sont des zones de pâturages avec une forte teneur en azote et la forte présence *Cladina arbuscala*.
530+
Les stations 2, 3, 4, 9, 10, 11 et 12 sont des stations particulières qui ne sont pas des zones de pâturages. On retrouve dans ces stations une dominance de *Cladina stellaris* alors que cet espèce est très peu présente dans les zones de pâturages. Les zones de pâturages sont caractérisée par une haute concentration en azote. Les stations 5, 6 et 7 sont des zones de pâturages avec une forte teneur en azote et une présence massive de *Cladina arbuscala*.
531531

532-
Nous n'irons pas plus loins dans l'interpréation de cette AFM et vous laissons la possiblité de lire la publication lié à cette étude. Les scientifiques ont réalisé un NMDS mais les résultats obtenus sont assez proches.
532+
Nous n'irons pas plus loin dans l'interprétation de cette AFM et vous laissons la possibilité de lire la publication liée à cette étude. Les scientifiques ont réalisé une NMDS en fait, pas une AFM, mais les résultats obtenus sont assez proches.
533533

534534
## Conclusion
535535

536-
Cette AFM vous a permis d'analyser 2 tableaux contenant des variables quantitatives en même temps.
536+
Cette AFM vous a permis d'analyser deux tableaux contenant des variables quantitatives, traités différemment (l'un standardisé, l'autre pas) en même temps. L'AFM permet aussi d'y adjoindre des groupes qualitatifs avec des analyses de type AFC. Cette méthode multi-tableaux est donc très polyvalente (mais notez qu'il en existe d'autres aussi).
537537

538538
Maintenant que vous avez compris la logique et que vous êtes capable d'écrire le code permettant de réaliser une AFM, vous pouvez appliquer cette technique par vous-même (assignation GitHub dans le cours).
539539

@@ -546,4 +546,3 @@ question_text(
546546
allow_retry = TRUE
547547
)
548548
```
549-

0 commit comments

Comments
 (0)