Skip to content

Commit 4e38d89

Browse files
committed
B06Lb_mds finalized
1 parent 966079a commit 4e38d89

File tree

4 files changed

+18
-20
lines changed

4 files changed

+18
-20
lines changed

NEWS.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,9 @@
11
# BioDataScience2 News
22

3+
## Changes in version 2020.6.0
4+
5+
- Tutorial B06Lb_mds migrated to version 2.
6+
37
## Changes in version 2020.5.0
48

59
- Tutorial B06La_kmeans migrated to version 2.

devel/tutorials/B06Lb_mds/B06Lb_mds.Rmd renamed to inst/tutorials/B06Lb_mds/B06Lb_mds.Rmd

Lines changed: 14 additions & 20 deletions
Original file line numberDiff line numberDiff line change
@@ -309,7 +309,9 @@ BioDataScience2::learnr_server(input, output, session)
309309

310310
## Objectifs
311311

312-
- Vérifier que vous avez bien compris les différentes étapes pour la réalisation des MDS : calcul de la matrice de distance, calcul du positionnement des points, réalisation de la carte et vérification de sa validité.
312+
Ce tutoriel consacré au positionnement multidimensionnel (MDS) vise à\ :
313+
314+
- Vérifier que vous avez bien compris les différentes étapes pour la réalisation d'une MDS : calcul de la matrice de distance, calcul du positionnement des points, réalisation de la carte et vérification de sa validité, choix entre MDS métrique ou non métrique.
313315
- Vous préparer à analyser et interpréter de manière autonome un jeu de données multivariées à l'aide des MDS.
314316

315317
Vous devez avoir compris le contenu du [module 6](https://wp.sciviews.org/sdd-umons2/?iframe=wp.sciviews.org/sdd-umons2-2020/k-moyenne-mds-som.html) du cours et en particulier la [section 6.2](https://wp.sciviews.org/sdd-umons2/?iframe=wp.sciviews.org/sdd-umons2-2020/positionnement-multidimensionnel-mds.html). Assurez-vous d'avoir réalisé les exercices H5P qui s'y trouvent avant de vous lancer dans ce tutoriel Learnr et de bien maîtriser les notions sur les matrices de distances vue dans le [module 5](https://wp.sciviews.org/sdd-umons2/?iframe=wp.sciviews.org/sdd-umons2-2020/distance-entre-individus.html).
@@ -320,7 +322,7 @@ Barro Colorado est une île artificielle située sur le lac Gatùn, au centre du
320322

321323
![Ile de Barro Colorado](images/bci_carte.png)
322324

323-
Une surface permanente de 50 hectares a été définie par l'Institut de recherche tropicale Smithsonian et l'Université de Princeton pour étudier la dynamique de la végétation. Cette surface est divisée en 50 parcelles de 1 ha, qui s'alignent les unes sur les autres. Dans chaque parcelle, le dénombrement de toutes les espèces forestières a été enregistré (seuls les plantes avec un DHP >= 10 cm [Diamètre mesuré à plus ou moins 1,3m] sont disponibles dans cet ensemble de données) et plusieurs variables environnementales ont également été mesurées. Au total, 225 espèces différentes ont été observées.
325+
Une surface permanente de 50 hectares a été définie par l'Institut de recherche tropicale Smithsonian et l'Université de Princeton pour étudier la dynamique de la végétation. Cette surface est divisée en 50 parcelles de 1 ha, qui s'alignent les unes sur les autres. Dans chaque parcelle, le dénombrement de toutes les espèces forestières a été enregistré (seules les plantes avec un DHP >= 10 cm [Diamètre mesuré à plus ou moins 1,3m] sont disponibles dans cet ensemble de données). Au total, 225 espèces différentes ont été observées.
324326

325327
![Foret tropicale de l'ile de Barro Colorado](images/bci_forest.jpg)
326328

@@ -335,7 +337,7 @@ Toutes les variables du tableau représentent des espèces (il n'y a pas ici une
335337

336338
<!-- TODO: il manque une partie description des données et éventuellement une transformation, cf espèces rares, mais le graphique boxplot parallèle est inutilisable avec 225 espèces!!! -->
337339

338-
## Matrice de distance
340+
### Matrice de distance
339341

340342
Lors de la réalisation d'une MDS, la première étape nécessite de construire une matrice de distances entre les stations ou entre les espèces comme vous l'aviez fait lors de la CAH. Pour cela, nous utiliserons la fonction `dissimilarity()` que vous connaissez déjà. Rappelez-vous que vous devrez commencer par sélectionner une métrique adaptée à votre jeu de données pour calculer votre matrice. Pour rappel, vous explorez l'aide en ligne de `?vegan::vegdist` pour déterminer les arguments à utiliser dans `dissimilarity()`.
341343

@@ -356,10 +358,10 @@ bci_dist <- dissimilarity(bci, method = "bray")
356358
```
357359

358360
```{r dist_h2-check}
359-
grade_code("Vous n'avez pas oublié comment l'on fait pour calculer une matrice de distances avec la fonction dissimilatity(). C'est maintenant que cela devient intéressant.")
361+
grade_code("Vous n'avez pas oublié comment on fait pour calculer une matrice de distances avec la fonction dissimilatity(). C'est maintenant que cela devient intéressant...")
360362
```
361363

362-
### Analyse en coordonnées principales (ou MDS métrique)
364+
## MDS métrique (ou PCoA)
363365

364366
Lorsque votre matrice de distance `bci_dist` est calculée, vous allez pouvoir visualiser son contenu en réalisant une MDS métrique ou analyse en coordonnées principales (PCoA). L'objectif est de *"projeter"* le nuage de points initial à *p* dimensions (les *p* variables) dans un espace réduit à deux dimensions. Afin de calculer votre MDS métrique vous utilisez la fonction `mds$metric()` et `chart()` permet de visualiser votre ordination en deux dimensions (nommez simplement vos stations de 1 à 50 dans l'ordre d'apparition dans le tableau).
365367

@@ -489,28 +491,20 @@ grade_code("Analysez maintenat ces mesures et répondez à la question ci-dessou
489491

490492
```{r qu_nmds}
491493
question("Considérez vous que cette MDS non métrique est de qualité ?",
492-
answer("oui, sur base de la valeur du R^2 linéaire élevée,
493-
nous pouvons considérer que la MDS non métrique
494-
exprime une grande part de la variance"),
495-
answer("oui, sur base des valeurs de R^2 linéaire basse et de R^2
496-
non métrique élevée, nous pouvons considérer que la
497-
MDS non métrique est de qualité"),
498-
answer("oui, sur base de la valeur du R^2 non métrique élevée,
499-
nous pouvons considérer que la MDS non métrique
500-
est de qualité", correct = TRUE),
501-
answer("non, sur base des valeurs R^2 linéaire et de R^2
502-
non métrique élevées, nous pouvons considérer
503-
que la MDS non métrique n'est pas optimale."),
494+
answer("Oui, car le R^2 non métrique est plus élevé que le R^2 linéaire."),
495+
answer("Oui, les R^2 sont excellents, même si la linearité de la transformation est un peu en dessous.", correct = TRUE),
496+
answer("Non, le R^2 nion métrique est excellent, mais le R^2 linéaire un cran en dessous révèle un problème."),
497+
answer("Non, il y a trop de différences entre les deux R^2."),
504498
allow_retry = TRUE,
505-
correct = "Bravo, vous avez trouvé la bonne réponse. L'indicateur R2 linéaire correspond au coefficient de corrélation linéaire de Pearson entre les distances ajustées et les distances sur la carte au carré. Il permet d'évaluer de combien les distances sont distordues. Au plus on est proche de 1, au moins la distortion est forte. Avec la valeur de 0.86 que l'on observe, notre distortion n'est pas trop forte. L'indicateur R2 non métrique indique si l’ordre des points respecte l’ordre des distances partout sur le graphique. Plus vous serez proche de 1, plus cet ordre sera respecté. La valeur de 0.97 que l'on observe ici est vraiment très bonne.",
506-
incorrect = "Retentez votre chance. Plus la valeur se rapproche de 1, mieux ce sera.")
499+
correct = "Dans la MDS non métrique, c'est le R^2 non métrique qui importe le plus. Un R^2 linéaire très élevé est un plus, mais n'est pas indispensable. D'ailleurs s'il est également très élevé, une MDS métrique pourrait convenir également et est plus rapide à calculer.",
500+
incorrect = "Pas tout à fait. Plus la valeur du R^2 se rapproche de 1, mieux c'est, mais les deux R^2 n'ont pas la même importance ici.")
507501
```
508502

509503
### Diagramme de Shepard
510504

511505
Le diagramme de Shepard (fonction `shepard()` pour le calculer puis `chart()` pour l'afficher) visualise la distorsion introduite par notre MDS non métrique. Une différence importante entre le R^2^ linéaire et le R^2^ non linéaire est une première indication d'un stress important. La fonction `shepard()` demande d'une part la matrice de distance de départ et d'autre part, l'objet nmds pour pouvoir réaliser le calcul.
512506

513-
Sur le diagramme des dissimilarités de la matrice *versus* distances sur la carte, le trait rouge matérialise la fonction de stress. Plus les points sont proches de ce trait, mieux c'est en mode non linéaire. De plus, si ce trait se rapproche d'une droite, alors la linéarité est d'autant mieux respectée également. C'est donc une analyse en deux étapes que l'on fait ici par observation du diagramme\ : d'abord, une fidélité pour des distances similaires, ert en secodn lieu comme bonus éventuellement, un respect des distances relatives les unes par rapprot aux autres.
507+
Sur le diagramme des dissimilarités de la matrice *versus* distances sur la carte, le trait rouge matérialise la fonction de stress. Plus les points sont proches de ce trait, mieux c'est en mode non linéaire. De plus, si ce trait se rapproche d'une droite, alors la linéarité est d'autant mieux respectée également. C'est donc une analyse en deux étapes que l'on fait ici par observation du diagramme\ : d'abord, une fidélité pour des distances similaires, ert en second lieu comme bonus éventuellement, un respect des distances relatives les unes par rapport aux autres.
514508

515509
Réaliser le diagramme de Shepard pour votre MDS non métrique.
516510

0 commit comments

Comments
 (0)