You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
L'Analyse Factorielle Multiple (AFM) est une méthode statistique exploratoire qui permet de travailler avec plusieurs tableaux de données. Cette méthode permet également de faire le lien entre l'analyse en composantes principales (ACP) et l'Analyse factorielle des correspondances (AFC). La première méthode permet de travailler uniquement sur des variables quantitatives et la seconde uniquement sur des variables qualitatives. L'AFM est capable de traiter les deux types de variables. Cette méthode est par exemple employée en écologie. Sur une station un ensemble de mesures physico-chimiques peuvent être réalisé ainsi qu'un relevé de la faune et/ou de la flore.
217
+
L'Analyse Factorielle Multiple (AFM) est une méthode statistique exploratoire qui permet de travailler avec plusieurs tableaux de données. Cette méthode permet également de faire le lien entre l'analyse en composantes principales (ACP) et l'Analyse factorielle des correspondances (AFC). La première méthode permet de travailler uniquement sur des variables quantitatives et la seconde uniquement sur des variables qualitatives. L'AFM est capable de traiter les deux types de variables. Cette méthode est par exemple employée en écologie. Sur une station un ensemble de mesures physico-chimiques peuvent être réaliseé ainsi qu'un relevé de la faune et/ou de la flore.
218
218
219
219
Il est donc utile de comprendre la logique et l'usage de cette analyse. Ce tutoriel vous permettra de\ :
Les scientifiques ont également réalisé un relevé floristique (en excluant *Pinus sylvestris* du relevé). On y observe une couverture en pourcent pour chaque station et 44 espèces étudiées. Ces données sont également disponible depuis `"varespec"` dans le package {vegan}.
262
+
Les scientifiques ont également réalisé un relevé floristique (en excluant *Pinus sylvestris* du relevé). On y observe une couverture en pourcent pour chaque station de chacune des 44 espèces étudiées. Ces données sont également disponible depuis `"varespec"` dans le package {vegan}.
263
263
264
264
```{r, echo=TRUE}
265
265
read("varespec", package = "vegan") %>.%
@@ -271,7 +271,7 @@ Les données mise à disposition proviennent de l'étude suivante [Väre, H., Oh
271
271
272
272
## Préparation du tableau de données
273
273
274
-
La première étape consiste dans la réalisation d'un tableau de données unique. Vous allez donc combiner le tableau `envir` avec le tableau `spec` grâce à la colonne similaire entre ces deux tableaux qu'est la variable `station`. Affichez ensuite les premières lignes du tableau `vare` avec la fonction `head()`
274
+
La première étape consiste dans la réalisation d'un tableau de données unique. Vous allez donc combiner le tableau `envir` avec le tableau `spec` grâce à la colonne similaire entre ces deux tableaux qu'est la variable `station`. Affichez ensuite les premières lignes du tableau `vare` avec la fonction `head()`.
275
275
276
276
```{r join}
277
277
data.io::read("varechem", package = "vegan") %>.%
@@ -301,7 +301,7 @@ head(vare)
301
301
```
302
302
303
303
```{r join_h2-check}
304
-
grade_code("Maintenant que vous avez assemblé vos deux tableaux, vous allez pouvoir réalsier votre MFA.")
304
+
grade_code("Maintenant que vous avez assemblé vos deux tableaux, vous allez pouvoir réalsier votre MFA. Il reste encore une petite étape avant cela.")
305
305
```
306
306
307
307
Ensuite, convertissez la variable `station` en nom de ligne grâce à la fonction `column_to_rownames()`. Les numéros de stations seront utilisés par la suite sur la représentation dans l'espace de vos stations.
@@ -334,27 +334,27 @@ rownames(vare)
334
334
```
335
335
336
336
```{r rowname_h2-check}
337
-
grade_code("Bravo ! Vous venez de convertir la colonne station en nom de lignes. Cette astuce peut être utile dans certain cas. Il y a également la fonction opposée rownames_to_column(). Vous allez pouvoir réalsier votre MFA à présent.")
337
+
grade_code("Bravo ! Vous venez de convertir la colonne station en nom de lignes. Cette astuce peut être utile dans certain cas. Il y a également la fonction opposée rownames_to_column(). Vous être prêt pour réaliser votre AFM à présent.")
338
338
```
339
339
340
-
## Réalisation de la MFA
340
+
## Réalisation de la AFM
341
341
342
-
La MFA peut s'obtenir grâce à la fonction `mfa()`. Cette dernière requiert l'utilisation d'une formule avec une syntaxe un peu particulière. Votre formule commence par un `~` puis elle est composé de bloc qui doit contenir 3 élements
342
+
L'AFM peut s'obtenir grâce à la fonction `mfa()`. Cette dernière requiert l'utilisation d'une formule avec une syntaxe un peu particulière. Votre formule commence par un `~` puis elle est composé de bloc qui doit contenir 3 élements
343
343
344
344
-1. Le nombre **n** de colonnes constituant le groupe
345
345
-2. Le type des variables qui composent le groupe. Vous avez 4 possibilités :
346
346
+**s** : Ce sont des variables quantitatives que l'on souhaite standardiser et les traiter par une ACP.
347
347
+**c** : Ce sont des variables quantitatives que l'on ne souhaite pas standardiser et les traiter par une ACP.
348
-
+**f** : Ce sont des variables qualitatives associée à des tableaux de contingences.quantitatives que l'on ne souhaite pas standardiser et les traiter par une AFC.
348
+
+**f** : Ce sont des variables qualitatives associées à des tableaux de contingences qu'on traite par une AFC.
349
349
+**n** : Ce sont des variables qualitatives classiques qu'on traite par une AFC.
350
350
-3. Le nom de groupe de variable
351
351
352
-
Le tableau `vare` est composé de 14 variables associées à des mesures physicochimiques et 44 variables lié à des relevés floristiques. Votre formule doit comprendre les éléments suivants :
352
+
Le tableau `vare` est composé de 14 variables associées à des mesures physicochimiques et 44 variables liées à des relevés floristiques. Votre formule doit comprendre les éléments suivants :
353
353
354
-
- Le premier bloc doit se nommer **physico**, être traité par une ACP et les variable doivent être standardisées.
355
-
- Le second bloc doit se nommer **flore**, être traité par une ACP et les variailes ne doivent pas être standardisées.
354
+
- Le premier bloc doit se nommer **physico**, être traité par une ACP et les variables doivent être standardisées.
355
+
- Le second bloc doit se nommer **flore**, être traité par une ACP et les variables ne doivent pas être standardisées.
356
356
357
-
Réalisez la AFM demandée en utilisant le tableau `vare` puis affichez un résume de l'objet `vare_mfa` avec la fonction `summary()`
357
+
Réalisez l'AFM demandée en utilisant le tableau `vare` puis affichez un résume de l'objet `vare_mfa` avec la fonction `summary()`
358
358
359
359
```{r varemfa}
360
360
data.io::read("varechem", package = "vegan") %>.%
@@ -397,7 +397,7 @@ question("Quelle est la proportion de la variance cumulée des deux premiers axe
397
397
answer("58%", correct = TRUE),
398
398
answer("23%"),
399
399
answer("34%"),
400
-
correct = "Bien joué ! Les deux premiers axes de l'AFM expriment 58% de la variance. Il serait donc plus intéressant de considérer les 3 premiers axes pour exprimer 68% de la variance.",
400
+
correct = "Bien joué ! Les deux premiers axes de l'AFM expriment 58% de la variance. Gardez à l'esprit que cette valeur est assez faible. Il serait donc plus intéressant de considérer les 3 premiers axes pour exprimer 68% de la variance.",
401
401
incorrect = "Oups, ce n'est pas la bonne réponse. Afin de trouver la bonne réponse, interessez vous au tableau `Eigenvalues`",
402
402
allow_retry = TRUE
403
403
)
@@ -434,7 +434,7 @@ chart$scree(vare_mfa)
434
434
```
435
435
436
436
```{r scree_h2-check}
437
-
grade_code("Vous venez de réaliser le graphique des éboulis associé à votre AFM. Ce graphique permet de voir la part de variance exprimée par chaque composante principale. Nous voyons bien que le premier axe reprend une très grande part de variance. On observe après un saut pour pour le troisième axe est une diminution progressive de la variance exprmiée sur les axes suivants.")
437
+
grade_code("Vous venez de réaliser le graphique des éboulis associé à votre AFM. Ce graphique permet de voir la part de variance exprimée par chaque composante principale. Nous voyons bien que le premier axe reprend une très grande part de variance. On observe après un saut p pour le troisième axe est une diminution progressive de la variance exprimée sur les axes suivants.")
grade_code("Ce graphique est assez chargé vu qu'il combine les vecteurs du groupe physico et du groupe flore. CE graphique s'analyse comme avec pour une ACP. Ce graphique permet de visualiser l'importance des variables intiales dans le plan de l'AFM sous forme de vecteurs. Il est indispensable pour interpréter le graphique suivant qui répartit les observations dans le même plan. La norme (longueur) du vecteur indique si la variable est bien représentée dans ce plan ou non. Plus la norme du vecteur se rapproche de un, matérialisé par le cercle, mieux c'est. Celles aux normes trop faibles ne sont pas considérées dans l'analyse pour ce plan-là en tous cas. Ensuite, les variables qui pointent dans la même direction sont corrélées positivement. Les variables qui pointent dans le sens opposé sont inversément corrélées (il n'y en a pas ici). Les vecteurs orthogonaux correspondent à des variables non ou très faiblement corrélées entre elles")
459
+
grade_code("Ce graphique est assez chargé vu qu'il combine les vecteurs du groupe physico et du groupe flore. Ce graphique s'analyse comme pour une ACP. Ce graphique permet de visualiser l'importance des variables intiales dans le plan de l'AFM sous forme de vecteurs. Il est indispensable pour interpréter le graphique suivant qui répartit les observations dans le même plan. La norme (longueur) du vecteur indique si la variable est bien représentée dans ce plan ou non. Plus la norme du vecteur se rapproche de un, matérialisé par le cercle, mieux c'est. Celles aux normes trop faibles ne sont pas considérées dans l'analyse pour ce plan-là en tous cas. Ensuite, les variables qui pointent dans la même direction sont corrélées positivement. Les variables qui pointent dans le sens opposé sont inversément corrélées. Les vecteurs orthogonaux correspondent à des variables non ou très faiblement corrélées entre elles")
grade_code("Ce graphique est similaire au précédent. Il s'interprète de la même façon. Cependant, on ne s'intéresse plus à la projection de chaque variable initiale mais desaxes des ACP pour chaque groupe de variables. Le premier axes du groupe flore pointe dans la meme direction que la seconde dimension du groupe physico. Il y a donc un forte corrélation ave ces deux plans. On obtient le même résultat pour le premier axe de physico et du secon axe de flore. Les normes des vecteurs sont proche de 1 pour chacune des ACP. Les deux ACP sont représentées correctement au sein de l'AFM.")
481
+
grade_code("Ce graphique est similaire au précédent. Il s'interprète de la même façon. Cependant, on ne s'intéresse plus à la projection de chaque variable initiale mais des plans des ACP pour chaque groupe de variables. La première dimension du groupe flore pointe dans la meme direction que la seconde dimension du groupe physico. Il y a donc un forte corrélation entre ces deux plans. On obtient le même résultat pour le premier axe de physico et du second axe de flore. Les normes des vecteurs sont proche de 1 pour chacune des ACP. Les deux ACP sont représentées correctement au sein de l'AFM.")
482
482
```
483
483
484
484
### Représentation des individus
@@ -505,7 +505,7 @@ grade_code("La forme du nuage de points et surtout des sous-groupes sont à rech
505
505
506
506
## Interprétation de l'AFM
507
507
508
-
La représentation des variables ainsi que la représentation de stations sont deux graphiques complémentaires afin d'interpréter l'AFM. Gardez à l'esprit que la part de variance exprimé par les deux premiers axes restent assez faible avec 57%.
508
+
La représentation des variables ainsi que la représentation de stations sont deux graphiques complémentaires afin d'interpréter l'AFM. Gardez à l'esprit que la part de variance exprimée par les deux premiers axes restent assez faible avec 57%.
0 commit comments