Skip to content

Projet étudiant de prédiction des législatives françaises à partir des présidentielles.

Notifications You must be signed in to change notification settings

tpilewicz/legis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

legis

Projet étudiant de prédiction du premier tour des législatives françaises à partir du premier tour des présidentielles.

Premier essai : utilisation de régressions pour prédire les scores de législatives à partir des scores de présidentielles pour chaque groupe et quelques variables sociodémographiques additionnelles.

Deuxième essai : utilisation de classifications (régression logistique et random forest) pour prédire le groupe qui arrive premier au premier tour des législatives à partir des scores de présidentielles et quelques variables sociodémographiques additionnelles.

Troisième essai : prolongement des essais de classifications, pour rééquilibrer les classes en présence, nous avons fait appel à la librairie "imbalanced-learn" de Guillaume Lemaître, Fernando Nogueira et Christos K. Aridas.

Voir : Imbalanced-learn: A Python Toolbox to Tackle the Curse of Imbalanced Datasets in Machine Learning, http://jmlr.org/papers/v18/16-365

Nous avons aussi essayé de manipuler les variables pour faire parler le territoire (variables binaires indiquant les départements d'outre-mer, Paris, ou bien sa banlieue) mais ça n'a pas l'air d'être d'un grand apport pour le modèle !

/!\ Attention : souvent par abus de langage, on dira que tel groupe politique "remporte" une circonscription. Les guillemets ne sont pas là pour rien, et lorsqu'on écrit ce genre de choses, cela signifie en réalité que le groupe politique en question arrive premier au premier tour des législatives. Cela vaut aussi pour les présidentielles. Lorsqu'on dira qu'un groupe est "arrivé premier" à la présidentielle d'une certaine année dans un certain département, on voudra en réalité dire qu'il est arrivé premier au premier tour.

TO DO :

  • Appliquer une meilleure méthode de cross-validation des modèles de classification, y compris avec SMOTE. La cross-validation est censée se faire avant l'over-sampling.

About

Projet étudiant de prédiction des législatives françaises à partir des présidentielles.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published