La première question du questionnaire était un champ libre demandant aux participants de présenter leur motivation (“Pouvez-vous nous préciser ce qui motive principalement votre inscription à ce MOOC ?”). Le traitement automatique de ce genre de données est un petit peu différent des autres types de questions. Dans ce billet nous présentons deux modes de traitement de ce type d’informations. Ces méthodes sont devenues assez importantes en raison de l’explosion de données que l’informatisation des sociétés a générées, connaitre leurs principes de fonctionnement participe à la fondation d’une éducation à l’information à l’ère du numérique.

Full sentimental

Le sentiment analysis ou opinion mining consiste à rechercher l’expression de sentiments dans le langage écrit. Utilisé par exemple sur Twitter, dans des forums ou pour des commentaires sur le web, la méthode consiste à évaluer numériquement si l’expression d’une émotion est positive ou négative. La méthode que nous allons présenter se base sur des dictionnaires pour lesquels ont été identifiés au préalable des termes et leurs positions relatives de façon à produire un calcul et des indicateurs (la bibliothèque d’algorithmes que nous utilisons est nommée Pattern elle est accessible sur cette page ). Voyons d’abord ce que produit ce type de calcul pour quatre phrases choisies pour l’exemple :

id	subjectivity	polarity
Le repas de la cantine était bon	0.7	0.70
Le repas de la cantine était mauvais	0.8	-0.71
Le repas de la cantine était magnifique	1.0	1.00
Le repas de la cantine était dégueulasse	1.0	-1.00

Pour chaque chaîne de caractères, le logiciel renvoie deux valeurs qui ont été nommées polarité et subjectivité. La polarité correspond à l’intensité du sentiment et à son orientation. La subjectivité évalue la présence d’opinions dans le texte et l’absence d’informations factuelles. Plus la subjectivité est proche de zéro moins la valeur de la polarité peut être considéré comme robuste. Voyons comment les valeurs de polarité et de subjectivité évoluent lorsque l’on modifie nos phrases d’exemples en ajoutant des éléments factuels :

id	subjectivity	polarity
Le repas de la cantine était bon, les champignons étaient très bien cuits et la sauce très douce	0.45	0.3750000
Le repas de la cantine était mauvais, le poisson n’était pas décongelé et les légumes avariés	0.00	-0.3866667

En ajoutant ces éléments descriptifs, les valeurs des 4 indicateurs ont baissé par rapport à la première partie de la phrase qui exprime uniquement un ressenti. Au travers de cet exemple, on constate que le calcul des indicateurs ne prend pas seulement en considération le lexique, mais aussi la position des termes laudatifs ou dépréciatifs dans la phrase (par exemple “très bien” dans la première phrase est repéré comme exprimant une opinion dans l’exposition de faits et contribue modérément à la polarité).

Appliquons cette opération sur les réponses à la première question du questionnaire et affichons les réponses dont la subjectivité est la plus élevée.

	polarity	subjectivity	id
131	0.3220833	1.00	Je suis enseignants et informaticien à la fois. J’aime le savoir et le transmettre. Mais comment ? Je souhaite véritablement trouver de plus en plus de monde qui s’intéresse également à cette nouvelle façon d’enseignée. J’ai plein d’idée, mais sont-elles vraiment sérieuses et surtout peuvent-elles être une source de bonne transmission ? Je forme des adultes depuis plus de 20 ans et je pense que découvrir un MOOC tel que le votre va me donner un bon en avant dans ma façon d’enseigner. Je connais XXXXXX pour avoir passé un DUT en XXXX il y a plus de 20 ans. Voilà.
70	0.0912500	1.00	Dans le cadre de mes prestations en qualité de formatrice pour adultes et de conseiller en insertion professionnelle,je rencontre des personnes qui n’ont pas eu d’éducation à “l’internet” comme ils disent! Face à ce constat, il est essentiel pour moi d’acquérir des connaissances sur l’éducation au média et à l’information afin de proposer des actions qui permettent à ces publics d’appréhender l’ère du “tout” numérique. Les rassurer sur leurs craintes , leurs peurs les amener à découvrir les possibles: l’accès à la culture, à l’information les familiariser aux plateformes des services administratifs Vous constaterez que je suis à des années lumières de nos chères têtes blondes mais au plus près des précaires qui subissent de plein fouet la fracture numérique tant sur le plan de la pratique que sur le plan de l’accès.
25	0.3250000	1.00	Je suis enseignante et je souhaiterai me former davantage sur l’utilisation du numérique et l’appliquer dans mes cours en utilisant les médias pour des situations plus concrètes.
438	0.3500000	0.60	Je suis prof-doc et j’essaie de me tenir au courant des évolution du métier. J’ai déjà participé à votre MOOc que j’avais trouvé très intéressant.
458	0.6100000	0.55	Le thème de l’Education touche tous les secteurs d’activités. Il faut se pourvoir adapter nos mode de transmission au monde du numérique et c’est à ce niveau que ma curiosité m’a poussée à m’inscrire à ce MOOC. Les deux domaines (éducation et numérique) sont des thèmes d’actualité pour lesquelles je suis particulièrement passionnée.
258	0.5300000	0.50	POur avoir une meilleure connaissance et formation afin de remplir au mieux mes missions de CPE.

On remarque que les réponses 458 et 258 ont les valeurs de polarité les plus élevées. La réponse 458 est probablement repérée par l’algorithme en raison de l’emploi multiple du possessif me : “ma curiosité m’a poussée à m’inscrire”. La réponse 258 obtient un score élevé probablement par l’emploi des termes “meilleure” et “mieux”.

Trois messages ont une valeur maximale de subjectivité, le 131, le 70 et le 25. Pour la réponse 131 l’emploi du pronom je (“je suis”, “j’ai”) et de verbes exprimant un sentiment (“j’aime”, “je souhaite”) ont surement contribué au calcul d’un indice conséquent. Dans une moindre mesure, la réponse 25 entre dans cette catégorie bien qu’elle soit plutôt descriptive alors que l’algorithme ne le perçoit pas.

En revanche, la réponse 70 est intéressante, car elle obtient un indicateur de subjectivité maximum alors que la polarité est proche de 0 ce qui correspond assez bien au contenu du message puisqu’il s’agit d’une expression tout à fait personnelle qui exprime plutôt un constat.

La question des modèles

Au regard des éléments que l’algorithme a identifiés, force est de constater qu’il n’est pas très efficace pour ces données. Autrement dit, il identifie et distingue assez mal les réponses à la question. Ce qui est instructif c’est de chercher à comprendre pourquoi.

Le premier élément qui explique cette inadéquation c’est que la procédure que nous avons utilisée fait appel à un modèle linguistique qui cherche à résoudre un problème qui ne se pose pas pour notre questionnaire. Ce modèle cherche à répondre à la question : “Comment mesurer des émotions dans le langage écrit ?”. En cherchant à répondre à cette question par une conceptualisation (identifier des termes et des relations entre eux) il sera possible de voire des choses et pas d’autres. Or pour répondre à la question “Pouvez-vous nous préciser ce qui motive principalement votre inscription à ce MOOC ?” il n’est pas nécessaire d’avoir recours à l’expression d’émotions (sans pour autant l’exclure). Ce modèle n’est donc pas approprié pour traiter nos données (c’est-à-dire ordonner, distinguer, identifier et classer des réponses).

Ensuite, la mise en oeuvre de ce modèle passe par la réalisation d’une modélisation technique (lors de l’identification des termes désignés comme objectif, subjectif, verbe, pronom, etc. et établissant des règles relationnelles). La conception d’un dictionnaire constitue la mise en oeuvre technique du modèle linguistique. Cette construction implique un ensemble de petites décisions qui ont une grande influence lors de l’utilisation du modèle : quels sont les mots prioritaires à taguer ? Que choisir pour les termes polysémiques (par exemple le mot “libre” est tagué comme très positifs alors que dans les réponses on trouve des répondants qui ont indiqué être “candidat libre au Capes”) ? Tout ce travail de catégorisation construit des cas qui ne seront pas adaptés à toutes les situations. Les réponses à ce genre de problème sont faites dans une perspective générale, or chaque champ lexical est souvent le reflet de ce que l’on appelle aujourd’hui rapidement “des communautés”. De ce point de vue la technologie n’est pas neutre. Pour utiliser efficacement ces algorithmes, il faudrait donc l’adapter à notre lexique et donc être en mesure de le consulter et de le modifier (ce qui est possible avec la bibliothèque que nous utilisons). Cette question est un exemple qui montre en quoi la question de la transparence, la modification et la documentation des algorithmes est très importante et donne raison aux militants pour les logiciels libres.

Enfin, les données que notre questionnaire a produit sont influencées par les conditions de passations, la formulation des questions, les catégories de réponses et dans notre cas le système technique de collecte. Réaliser un questionnaire c’est aussi construire un modèle (dans notre situation il s’agit d’un modèle assez sommaire) qui lui aussi répond à des besoins et cherche à résoudre des problèmes particuliers. Pour analyser ces données il faut faire appel à une méthode qui, soit aura pris les mêmes orientations que le modèle qui les a produits, soit permettra une identification sur mesure. C’est ce deuxième cas que nous allons voir ci-dessous.

Constitution d’un lexique

Parmi les réponses, on disposait de 476 textes courts. Pour commencer il est utile de parcourir les réponses, en voici une dizaine tirées au sort.

##  [1] "L'obligation de s'inscrire"                                                                                                                                                                                                                                                                                                                                                                                                                                    
##  [2] "Pour faire évoluer mes pratiques professionnelles et pour développer mes compétences personnelles"                                                                                                                                                                                                                                                                                                                                                             
##  [3] "Pour une mise à jour nécessaire de mes connaissances et de mes pratiques professionnelles. C'est à dire enseigner l'EMI (Education aux médias et à l'information) en collège. Je suis professeur-documentaliste."                                                                                                                                                                                                                                              
##  [4] "Il s'agit de d'enrichir mes connaissances qui traitent du sujet du MOOC.   Il s'agit aussi d'évaluer mes concepts et de rectifier mes erreurs du sujet traité."                                                                                                                                                                                                                                                                                                
##  [5] "Professeure documentaliste, je considère que l'éducation aux médias d'information fait partie de notre mission, mais j'ai passé le capes en 91 et à cette époque on ne parlait pas d'EMI. Je me suis formée bien évidemment depuis, mais je ne maîtrise pas encore, et de loin, toutes les connaissances liées à l'EMI. Je compte sur cette formation pour améliorer mon niveau et être plus apte à mettre en place un enseignement pertinent pour mes élèves."
##  [6] "J'ai exercé sur de courtes périodes le métier de professeur documentaliste et je voulais disposer de cours sur l'enseignement des média et du numérique."                                                                                                                                                                                                                                                                                                      
##  [7] "Ma première motivation pour s'inscrire à ce MOOC (comme aux autres que j'ai déjà suivi) est une curiosité quasi-insatiable sur des sujets très divers.     La seconde est mon intérêt pour le monde de l'information et ses mutations à l'ère du numérique.    La dernière concerne l'exercice de ma profession qui se nourrira très certainement des enseignements de ce MOOC."                                                                               
##  [8] "je fais mon projet fin d étude  sur les mooc"                                                                                                                                                                                                                                                                                                                                                                                                                  
##  [9] "la curiosité, l'envie de formation, la découverte"                                                                                                                                                                                                                                                                                                                                                                                                             
## [10] "Je suis actuellement professeur-documentaliste stagiaire dans l'académie de Créteil. Dans le cadre de ma formation, on m'a demandé de suivre ce MOOC pour apprendre à travailler avec les disciplines scientifiques. Je vais ainsi pouvoir améliorer mes connaissances car j'avais à l'origine un baccalauréat littéraire et diversifier mes partenariats pédagogiques."

On voit que les messages ont des formes très différentes. Certains sont très rédigés, d’autres beaucoup plus lacunaires. Certains présentent des éléments de contexte personnel tandis que d’autres répondent strictement à la question. Une première étape consiste à extraire le lexique employé pour l’ensemble des messages et ses termes selon leur nombre d’apparitions :

	occurences
connaissances	140
emi	132
medias	112
mooc	104
documentaliste	102
numerique	101
formation	98
professeur	85
education	79
information	79
eleves	74
souhaite	71
plus	62
pratiques	51
domaine	48
former	45
afin	42
college	40
mieux	40
apprendre	37

On peut représenter ces données sous la forme d’un nuage de mots comme ça se fait beaucoup depuis quelques années.

Parmi les termes les plus employés on a d’abord inévitablement le triptyque : “médias”, “éducation” et “information” dont on comprend aisément qu’il s’agit de la forme éclatée du terme “EMI”.

On remarque, ensuite, que les termes dont les occurrences sont les plus élevés sont plutôt des termes issus du monde scolaire (en particulier le terme “EMI”) : “documentaliste”, “numérique”, “professeur”, “élèves”, “collège”.

Le terme le plus fréquemment employé dans les réponses est celui de “connaissances” au pluriel. On trouve aussi des verbes comme : “souhaite”, “apprendre”, “former”. Le terme “formation” et “mooc”. Le terme “pratique” qui peut être un verbe ou non. Des termes laudatifs : “plus”, “mieux”. On il y a de fortes chances que ces termes constituent le plus souvent les deuxièmes parties de messages qui exposent souvent l’intention et le souhait de mieux se former et souvent en référence aux situations qui figurent dans les premières partie des textes.

On peut interpréter ce petit champ lexical comme des textes qui présentent une situation personnelle et la volonté de se former en réponse à des éléments liés à cette situation professionnelle par exemple :

“Professeure documentaliste, je considère que l’éducation aux médias d’information fait partie de notre mission, mais j’ai passé le capes en 91 et à cette époque on ne parlait pas d’EMI. Je me suis formée bien évidemment depuis, mais je ne maîtrise pas encore, et de loin, toutes les connaissances liées à l’EMI. Je compte sur cette formation pour améliorer mon niveau et être plus apte à mettre en place un enseignement pertinent pour mes élèves.”
“J’ai exercé sur de courtes périodes le métier de professeur documentaliste et je voulais disposer de cours sur l’enseignement des média et du numérique.”

On peut conclure que les réponses les plus fréquentes dans les messages contextualisent le métier de professeur documentaliste qui concerne la majorité des répondants. Ils ont estimé que ce qui motive leur participation au Mooc est le désir de se former, car ils sont professeurs documentalistes en collège. Par rapport à l’analyse précédente, on a déjà plus de matière explicative. On va maintenant chercher à confirmer ces éléments statistiquement.

Analyse du lexique au regard d’une question fermée

On va maintenant transformer la base de réponses au questionnaire de façon à ce que chaque terme du lexique corresponde à une variable dont la valeur est présence/absence. Une fois que le tableau aura ce format, on pourra utiliser des méthodes statistiques traditionnelles. Voici les premières lignes et premières colonnes de ce nouveau tableau.

	situation	abord	academie	acceder	acces	accompagner	acquerir	activites	actualiser	actuellement	adapter	adultes	…
1	Autre	No	No	No	No	No	No	No	No	No	No	No	…
2	Enseignant ou formateur	No	No	No	No	No	No	No	No	No	No	No	…
3	Autre	No	No	No	No	No	No	No	No	No	No	No	…
4	Autre	No	No	Yes	No	No	No	No	No	No	No	No	…
5	Enseignant ou formateur	No	No	No	No	No	No	No	No	No	No	No	…
	…	…	…	…	…	…	…	…	…	…	…	…	…

On dispose maintenant d’un tableau à 333 colonnes (presque le nombre de termes figurant dans le lexique) et 509 lignes (soit le nombre de réponses au questionnaire). La première colonne contient la variable qui correspond à la question “Quelle est votre situation actuelle ?” on a recodé les modalités de réponses en deux cas : “Enseignant” et “Autre”. Ensuite viennent autant de colonnes que de termes figurant dans le lexique avec “No” pour leur absence dans la réponse à la question sur la motivation et “Yes” pour sa présence. On remarque qu’il y a très peu de “Yes”, ce qui est normal. Voyons maintenant si on trouve un lien entre la variable “situation” et le lexique employé dans les réponses, c’est à dire cherchons à répondre à la question : Quels sont les termes du lexique qui distingue les enseignants des autres répondants ?

On va commencer par construire un arbre d’inférence conditionnel. C’est une méthode qui classe l’importance des variables et permet de représenter graphiquement ce classement.

Que voit-on sur ce graphique ? D’abord, l’algorithme distingue les répondants qui ont employé le terme “EMI”. Ils sont 118 (node 7) et les 9/10ème d’entre eux se sont déclarés comme enseignants. Ensuite vient ceux qui n’ont pas utilisé le terme “EMI” et qui ont employé le terme “capes” ils sont 21 et environ les 4/5ème d’entre eux (17 exactement) ne se sont pas déclarés comme enseignant. On voit ensuite sur le node 5 que 42 répondants n’ont ni les termes “EMI” et ni “capes et ont utilisé le mot”documentaliste“, parmi eux les 9/10ème ont indiqué être enseignants. Enfin viennent 326 répondants qui n’ont utilisé aucun de ces trois mots et dont un peu plus de la moitié sont enseignants.

De cette représentation graphique il y a deux éléments importants que l’on peut en retirer. La première c’est que la modalité “Autre” de la variable situation est trop imprécise, on voit dans le vocabulaire des répondants des éléments qui concerne typiquement des étudiants qui prépare le concours il faudrait donc (re)distinguer les étudiants dans la modalité “Autre”, ce qui est impossible, car le nombre de répondants des autres catégories est trop petit (c’est pourquoi elles avaient été regroupées). Le deuxième élément important est représenté par le node 6 qui identifie une sous base dans laquelle il règne une plus grande hétérogénéité qu’il serait important d’examiner de façon plus détaillée.

Pour identifier les éléments de lexique qui distingue bien les enseignants des autres répondants, on a utilisé un autre algorithme nommé Random Forest (qui fait partie de la famille des forêt d’arbres décisionnels ). Cet algorithme est assez efficace pour identifier les liens entre une variable à expliquer (dans notre cas la situation professionnelle) et beaucoup de variables dites explicatives (dans notre cas un lexique). Pour présenter rapidement la méthode, à la figure précédente nous avons construit un arbre, cette fois nous produisons une forêt. Nous passerons sur les détails techniques, les termes du lexique que cet algorithme identifie comme de bons classificateurs de la situation professionnelle des répondants sont : “capes”, “emi”, “documentaliste”, “élèves”, “connaissance”, “curiosité”, “écoles”, “mooc”, “prépare”, “concours” et “personnel”. On retrouve des mots parmi les plus employés et ceux identifiés dans l’arbre précédent, mais pas uniquement ainsi le mot “connaissance” au singulier fait son apparition. On voit encore que l’algorithme identifie très bien les répondants ayant utilisé les termes “prépare” “concours” et “capes”, on en déduit qu’il s’agit d’étudiants candidats au concours. Mais aussi “curiosité” et “personnel”, il s’agit probablement d’un autre profil de participant que l’on n’a pas encore identifié.

En employant la méthode de la régression logistique sur ce lexique restreint, on peut affirmer que les répondants s’étant déclarés comme enseignant ont 14 fois plus de chances d’employer le terme “documentalistes” et 5 fois plus de chances d’utiliser les termes “élèves” et “EMI” que les autres répondants. Les autres éléments du lexique ont plus de chances d’être employés par les répondants non enseignants.

Ci-dessous, figure un tableau à deux lignes et deux colonnes qui concerne en colonne la présence ou l’absence du terme “élèves” dans les réponses aux questions sur les motivations et sur la situation professionnelle.

	No	Yes
Autre	154	7
Enseignant	285	61

On voit sur ce tableau que 154 répondants ne sont pas enseignants et n’ont pas employé le terme élèves. 285 enseignants ne l’ont pas employé non plus. Alors que 7 répondants ont utilisé ce terme sans être enseignants et que 61 l’ont employé en étant enseignants. L’application d’un test de khi deux d’indépendance sur ce tableau nous permet d’affirmer que les enseignants sont significativement plus nombreux à employer le terme alors que les autres répondants sont significativement moins nombreux.

Conclusion et perspectives

Pour conclure on peut dire qu’il est important d’employer une méthode de traitement de données dont les modèles qui les fondent ne soient pas totalement incohérents avec les données traitées.

L’analyse (qui reste incomplète) de cette question ouverte nous permet de confirmer sans ambiguïté que les participants au Mooc les plus nombreux sont professeurs documentalistes en quête de formation sur l’EMI probablement pour leurs élèves. On a identifié assez bien des répondants (probablement des étudiants) qui préparent le capes de documentation. Il reste enfin des répondants qui semblent mus par des motivations plus personnelles, laissant libre cours à leur curiosité. Pour compléter ce panorama, il faudrait éplucher tous les messages un par un pour obtenir un peu plus de nuances dans ce constat. Il faudrait aussi étudier la sous-base de 326 individus identifiée par l’arbre d’inférence conditionnelle.

Il serait aussi nécessaire de compléter cette analyse en réalisant la même chose avec d’autres variables qu’uniquement la variable de situation professionnelle par exemple celle qui porte sur l’expérience dans l’enseignement à distance semble prometteuse. Il serait aussi probablement fructueux de réaliser d’autre type d’analyses avec plusieurs variables du questionnaire et le lexique comme celle réalisée pour un autre Mooc.

Enfin il pourrait être très intéressant d’employer des méthodes typiques des sciences du langage par exemple celles qui sont implémentées dans les logiciels comme Alceste ou IRaMuTeQ.

________________________________________________________________________________________________________________________________ ________________________________________________________________________________________________________________________________

Questionnaire sur les participants deuxième partie et regard sur l’enquête EMI

Ce billet est composé en deux parties. Dans un premier temps, nous allons finir de voir les résultats du questionnaire sur les participants puis nous verrons la répartition des réponses à l’enquête sur l’EMI.

Réponses au questionnaire sur les participants

Le Lundi 02 janvier 2017 , on comptait 627 réponses valides au questionnaire sur les participants. On a vu précédemment (ci-dessous) la répartition d’une partie des réponses au questionnaire. Cette quinzaine nous allons examiner les non-réponses, puis nous verrons la répartition des réponses aux questions portant sur l’expérience dans l’enseignement à distance et un élément de motivation.

Les non-réponses

Seules 4 questions étaient obligatoires dans le questionnaire :
- le nombre de mooc suivi auparavant
- le genre
- l’année de naissance
- le pays de résidence des répondants

Il est tout de même possible qu’y figurent quelques non-réponses (car les questions obligatoires apparaissent à la fin du questionnaire). Il est intéressant d’examiner le taux de non-réponses des autres questions qui n’étaient pas obligatoires ou conditionnelles par exemple. Cela permet d’évaluer si elles ont du sens pour les participants et ainsi de considérer les réponses comme solides ou non, et éventuellement de les retravailler pour un questionnaire futur.

On trouve globalement peu de non-réponses dans le questionnaire, le tableau ci-dessous en présente une vision synthétique.

	Pourcentages de non-réponses
Autres diplomes	97.0
Prépare un concours	91.4
Commentaire	89.8
Nombre de mooc fini	43.2
Anciennete	32.5
Discipline	29.3
Veux faire évoluer sa pratique	9.6
Quelle motivation	6.9
Diplome	4.1
Enseignant à distance	2.1
Étudiant à distance	1.6
Année de naissance	0.5
Pays	0.5
Age	0.5
Situation	0.3
Genre	0.3
Mooc	0.0

On voit dans ce tableau, dont les noms de questions sont présentés sous leur forme abrégés, que les 6 questions ayant plus de 28 % de non-réponses sont des questions conditionnelles. Les questions suivantes sont les questions qui concernaient tous les répondants on constate qu’il y a au plus 8 % de non-réponses et le plus souvent beaucoup moins.

Expérience dans l’enseignement/apprentissage à distance

Environ la moitié des répondants ont déjà suivi un dispositif d’enseignement à distance qui ne soit pas un Mooc. Les répondants sont donc plutôt familiers avec l’apprentissage en ligne. Ils le sont moins avec l’enseignement en ligne puisque seulement 8 % d’entre eux ont déjà enseigné dans un dispositif d’enseignement à distance.

260 répondants déclarent ne pas avoir déjà suivi de Mooc avant celui-ci. On remarque pour ceux qui ont déjà participé à des Mooc que, dès lors que les participants en ont suivi plus de 4 la plupart en ont terminé au moins 1. Ces éléments sont visibles sur la figure suivante.

Motivation dans la participation au Mooc

98 % des répondants déclarent vouloir faire évoluer leurs pratiques professionnelles. Il s’agit d’un élément de résultat très clair qui explique bien ce que les participants au Mooc recherchent.

Perspectives

Accès aux données

Si vous voulez explorer ces données n’hésitez pas à envoyer un email à mehdi.khaneboubi@ens-lyon.fr.

Premiers regards sur l’enquête EMI

Lundi 02 janvier 2017 on compte 988 réponses à l’enquête sur l’EMI dont le questionnaire est consultable à en suivant ce lien. Pour cette enquête trois bases ont été constituées. La première est celle qui a été diffusée dans le mooc (626 réponses¹). Une autre a été diffusée auprès d’étudiants de l’ESPE de Créteil et parfois de leurs élèves (80 réponses). La troisième a été remplie par des étudiants en sciences de l’éducation de l’université Paris Descartes (276 réponses).

Ci-dessous figure une courte représentation graphique des réponses agrégées de ces trois bases (988 réponses). Nous vous présenterons des analyses sur cette enquête lors de la prochaine quinzaine.

Dans le premier graphique ci-dessous, on voit le nombre de réponses reçu par jours, puis les répartitions de genre, d’âge et de situation.

On remarque grâce aux classes d’âges et au statut (élève ou enseignant) qu’il y a une importante sous-population de collégiens (les répondants âgés de moins de 15 ans) et d’étudiants (entre 20 et 25 ans).

On voit ci-dessous les répartitions des réponses portant sur la lecture des commentaires, les sources d’informations préférées, le degré d’accord avec une opinion sur l’EMI et enfin le nombre d’inscriptions aux réseaux sociaux.

Par ailleurs, on trouve que 40.7 % des répondants estiment connaitre des outils pour vérifier l’origine d’une image et 51 % utilisent un bloqueur de publicité. Enfin, figure ci-dessous le nuage de mots qui évoque l’EMI aux répondants.

Vous pouvez consulter les résultats automatiques des répondants de la base du Mooc à cette adresse. Vous pouvez aussi consulter et télécharger les données brutes à cette adresse.↩

Présentation des réponses au questionnaire

Vendredi 02 décembre 2016 on comptait 4069 inscrits au Mooc. On a vu lors de la première quinzaine (ci-dessous) les profils des inscrits au regard de leur genre, âge et niveau de diplôme déclarés. On identifiait plus de femmes que d’hommes, les titulaires d’un master étaient les plus nombreux et les trois quarts des inscrits avaient entre 20 et 50 ans. Cette semaine nous allons voir comment se repartissent les réponses au questionnaire sur les participants.

Il est intéressant de commencer par comparer les réponses au questionnaire avec les éléments similaires à ceux présentés dans la semaine précédente (âge, genre, niveau du diplômes et localisation). Si l’on considère que répondre à un questionnaire est un acte indiquant une implication plus importante que l’inscription, alors la comparaison entre les réponses au questionnaire et les autres données permet de se faire une idée plus précise sur les participants au Mooc.

Caractéristiques générales des répondants

Vendredi 02 décembre 2016, on trouvait 509 réponses valident, se répartissant selon le genre, le niveau de diplôme et l’âge comme sur la figure ci-dessous. On remarque notamment que 78.8% des réponses sont celles de femmes alors que l’on compte 60.2% de femmes dans le fichier des inscriptions délivré par la plateforme FUN.

Une majorité des répondants sont titulaires de master (comme pour la population d’inscrits). On remarque que les femmes sont majoritaires à tous les niveaux de diplômes ce qui était aussi le cas pour les inscrits mais de façon moins marquée. Concernant les classes d’âges on remarque que les répondants âgés de 35 à 50 ans sont les plus nombreux comme pour les inscrits.

Localisation

Grâce au questionnaire on peut avoir une idée des pays où se trouvent les participants. La plupart d’entre eux sont situés en France avec 85.5% des répondants. Les répondants internationaux sont, comme pour le fichier des inscrits, principalement localisés dans les pays de la francophonie : Maghreb, Afrique de l’ouest et du centre, Belgique, Suisse et Canada. À noter des participants localisés au Liban.

Activités d’enseignements

Sur les 507 réponses à la question portant sur la situation professionnelle, à peu près les deux tiers (68.2%) concerne la modalité “enseignant ou formateur”.

Parmi les enseignants, étudiants et chercheurs les disciplines les plus représentées sont celle des Sciences de l’information et de la communication avec 52% des répondants on trouve ensuite les disciplines que l’on a regroupé sous le terme “Lettre et Humanités” qui représentent 15% des répondants. Les participants s’étant déclarés comme enseignants ou formateur sont principalement en activité dans le secondaire et en majorité au collège.

L’ancienneté moyenne et médiane des répondants au questionnaire sont respectivement de 14 et 14 années. La moitié des répondants ont entre 8 et 22 ans d’ancienneté ce qui les classes plutôt dans la première partie de leur carrière.

Conclusion

Au regard des réponses au questionnaire que nous avons présentées, il est probable qu’une majorité des participants au Mooc soient professeurs documentalistes en collège et en lycée de France, au cœur de leur activité professionnelle.

Accès aux données

Si vous voulez explorer ces données elles sont disponibles dans leur version pré-traitée ici.

Enquête sur l’EMI

Enfin, si vous ne l’avez pas déjà fait, je vous invite à participer à l’enquête sur l’éducation aux médias et à l’information en vous rendant sur cette page.

Profils des inscriptions au MOOC EMI3

Lundi 21 novembre 2016, on comptait 3744 inscrits au Mooc. Lors de la création d’un compte sur la plateforme FUN, il est demandé l’âge, le genre, le niveau de diplôme, le pays et la ville des utilisateurs. Ces données fournissent des tendances générales qu’il est intéressant de regarder pour esquisser des profils types. Comment est structurée la population des inscrits ? Y a-t-il des effets de genre ? Quel est l’âge moyen des inscrits ? Les participants sont-ils très diplômés ? En somme quels sont les profils des inscrits au Mooc ? C’est ce que nous allons voir dans ce billet. Il faut mentionner au préalable que le nombre d’inscrits ne correspond pas au nombre de participants effectifs, qui est, le plus souvent, bien moindre.

Répartition géographique

Comme on le voit sur la carte ci-dessus la majorité des inscrits est localisée en France métropolitaine avec 2308 inscrits soit 61.6 %. On trouve ensuite des inscriptions principalement dans les pays francophones (Maghreb, Afrique de l’ouest, Haïti, Belgique et Canada) mais aussi en Espagne et au Brésil.

Âges et genres des inscrits

Sur les 3744 inscrits au Mooc, on compte :

1129 hommes (30.2 % des inscrits)
2256 femmes (60.3 % des inscrits)
359 non-réponses (10 % des inscrits)

Les âges moyen et médian des inscrits sont proches de 38 ans. La pyramide des âges (figure 1) est asymétrique. On remarque que les hommes sont moins nombreux que les femmes pour toutes les classes d’âge.

Genres et niveaux de diplômes

Un peu moins de la moitié des inscrits (49 %) sont titulaires d’un master. Là encore il y a plus de femme que d’hommes pour tous les niveaux de diplômes.

Âges et diplômes

La figure 3 présente la répartition des niveaux de diplômes selon les âges. Les niveaux master et licence (en bleu foncé et clair) sont les plus représentés. Par ailleurs on remarque que les moins de 21 ans et les plus de 60 ans sont peu nombreux. On perçoit aussi l’importance en nombre des individus ayant un âge compris entre 20 et 50 ans qui représentent 2724 personnes (73 % des inscrits).

Accès aux données

Vous pouvez explorer ces données en les téléchargeant ici

Questionnaire

Enfin, je vous invite à participer à l’enquête par questionnaire sur les participants au Mooc en vous rendant sur cette page.

Rubrique statistiques

Bienvenu dans la rubrique « statistiques » de la troisième édition du MOOC EMI. À partir du 21 novembre, vous trouverez chaque quinzaine une analyse de données réalisée avec des données produites dans le MOOC.

Y seront traitées des données d’origine différentes. D’abord sur les inscriptions produites par la plateforme du MOOC. Ensuite une présentation des participants faite grâce aux réponses au questionnaire que vous êtes invité à remplir en suivant ce lien : https://goo.gl/LQXdy5 .

Nous vous proposerons enfin de participer à une enquête sur l’Éducation aux Médias et à l’Information. Nous vous inviterons à faire remplir un questionnaire, mais aussi à participer à son analyse en téléchargeant des données brutes.

Nous vous donnons donc rendez-vous le lundi 21 novembre pour la première quinzaine du MOOC.

Traitement automatique d’une question ouverte dans un questionnaire

Mehdi Khaneboubi

Lundi 9 janvier 2017

Full sentimental

La question des modèles

Constitution d’un lexique

Analyse du lexique au regard d’une question fermée

Conclusion et perspectives

Questionnaire sur les participants deuxième partie et regard sur l’enquête EMI

Mehdi Khaneboubi

Lundi 2 janvier 2017

Réponses au questionnaire sur les participants

Les non-réponses

Expérience dans l’enseignement/apprentissage à distance

Motivation dans la participation au Mooc

Perspectives

Accès aux données

Premiers regards sur l’enquête EMI

Présentation des réponses au questionnaire

Mehdi Khaneboubi

28 novembre 2016

Caractéristiques générales des répondants

Localisation

Activités d’enseignements

Conclusion

Accès aux données

Enquête sur l’EMI

Profils des inscriptions au MOOC EMI3

Mehdi Khaneboubi (ENS de Lyon)

Lundi 21 novembre 2016

Répartition géographique

Âges et genres des inscrits

Genres et niveaux de diplômes

Âges et diplômes

Accès aux données

Questionnaire

Rubrique statistiques

Novembre 2016