Introduction à l'analyse de données quantitatives Deuxième semestre 2011-2012 - Mehdi Khaneboubi Université de Cergy-Pontoise

Représentations graphiques

Le diagramme en barres (barplot)

Voici un graphique qui représente la distribution d'une variable qualitative : la discipline enseignée par 169 enseignants ayant répondu à un questionnaire dans un échantillon de collèges en France.

Les barres sont de longueur proportionnelles aux fréquences des modalités. L'épaisseur des barres n'est pas importante.

La distribution individus par individus est disponible dans ce fichier. Voici une synthèse sous forme de tableau :

Les nuages de points (scatterplot)

On a extrait du document intitulé les iris de Fisher deux variables : la largeur et la longueur des pétales d'un échantillon de 150 iris. Voici la représentation graphique de ces deux variables :

Il s'agit donc de la représentation de deux variables quantitatives dont voici quelques valeurs :

À chaque individu correspond une coordonnée sur le graphique.

Vous pouvez consulter la distribution de ces deux variables dans un fichier Excel disponible ici.

Les boites à moustaches (boxplot)

Voici un graphique réalisé à partir de la colonne « dépenses publiques » du tableau figurant dans le document Dépense d'éducation dans l'Union européenne de l'INSEE.

Il s'agit de la représentation graphique d'une variable quantitative. Dans ce cas, un pays est un individu. Le tableau de données d'origine commence ainsi :

Les segments inférieurs et supérieurs du graphiques représentent les valeurs maximale et minimale de la variable, c'est-à-dire les pourcentages de PIB[1] les plus grands et les plus petits.

Le segment central représente la valeur médiane de la distribution.

La médiane est la valeur de la variable qui divise l'échantillon en deux ensembles de même effectifs.

Le rectangle délimite la moitié des valeurs centrale de la distribution : les valeurs comprises entre le premier et le troisième quartile. Nous verrons plus loin à quoi correspond les quartiles.

Le segment situé exactement au milieu du rectangle (qui n'est pas représenté sur le graphique) correspond à la valeur moyenne de la distribution.

La boite à moustache permet donc de visualiser les informations suivantes.

Pour finir...

De façon générale il est important de faire figurer dans un graphique les éléments suivants :

- titre,

- nommer les axes,

- indiquer la nature des données : effectif, pourcentages, milliers d'euros, etc.

- nommer la source des données.

Pour aller plus loin

Pour l'exposition d'une théorie et de son application, à propos des graphiques reportez-vous à Emery (1975)[2] ou à Wilkinson (2005)[3]. Si vous désirez consulter une grande variété de représentation de données, rendez-vous ici ou sur ce blog.

  1. PIB
  2. emery_1975

    Emery, M. (1975). La sémiologie graphique. Entretien avec J. Bertin. Communication et langages, 28(1), 33-43. http://www.persee.fr/web/revues/home/prescript/article/colan_0336-1500_1975_num_28_1_4248

  3. wilkinson_2005

    Wilkinson, L. (2005). The Grammar of Graphics (2 éd.). Springer-Verlag New York Inc. (attention ouvrage en anglais)

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Mehdi Khaneboubi 2011-2012 Paternité - Pas d'Utilisation Commerciale - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)