Lors de la première semaine de cours, on a vu la répartition des 3317 inscrits au Mooc selon le genre, le niveau de diplôme et l’âge (Statistiques sur les inscriptions à la deuxième édition du Mooc eFAN-EMI). Depuis, on compte plus de 1300 inscriptions supplémentaires qui n’ont pas modifié la structure des données. Nous allons voir dans ce billet comment se présentent les 4598 inscrits le 4 janvier 2016 et présenter les données de façon un peu différente que lors du début du Mooc en référence à l’activité de visualisation de la semaine dernière.

On dispose donc de l’âge, du genre et du niveau de diplôme demandés lors de la création du compte sur FUN. Comment représenter les relations entre ces trois critères ? Dans un premier temps, nous allons chercher par des représentations graphiques à caractériser et à décrire des liens entre les trois variables. Nous utiliserons une méthode issue d’une bibliothèque1 du logiciel R2 qui va autant nous guider que nous contraindre dans les représentations. Ensuite nous essayerons d’analyser et représenter les données avec un arbre de classification.

Âge des inscrits et diplômes

Représentons par un point chacun des inscrits avec en abscisse les niveaux de diplômes et en ordonnée les âges des participants, comme sur le graphique ci-dessous.


On obtient une représentation illisible avec peu de différence entre chacune des colonnes, c’est dû à une superposition des points. Pour remédier à ce problème nous allons ajouter en abscisse une valeure aléatoire qui va étaler les points de part et d’autre des modalités de diplôme.