Comment mesurer la progression des élèves par la taille d'effet?

Je vous partage un petit texte sur la mesure de la progression des élèves. En effet, une Cogni’Classe devrait maximiser l’apprentissage des élèves, mais pour le savoir, il faut mesurer et comparer les progrès des élèves. C’est ce que font les chercheurs en éducation en calculant la taille d’effet associée à un facteur de réussite et d’apprentissage.

Rendre visible la progression de vos élève par la taille d’effet

ou

Comment calculer si vos élèves progressent lentement ou rapidement ?

(ou)

(Comment savoir si vos pratiques professionnelles sont médiocres, moyennes ou excellentes ?) (Gasp !)

Vos élèves progressent, mais :
- comment savoir s’ils progressent plus ou moins que les autres ?
- comment mesurer l’efficacité de vos méthodes pédagogiques ?

La taille d’effet compare statistiquement les progressions. Popularisée par John Hattie dans son livre Visible learning, publié en 2009, elle mesure la progression d’une classe et la compare à d’autres classes. L’enseignant a une information fondamentale : il sait si ses pratiques font progresser rapidement ses élèves. Il a une boussole pour orienter ses choix et améliorer sa pratique.

Qu’est-ce qu’une taille d’effet ?
La taille d’effet calcule, en écart type, la progression entre deux évaluations successives et similaires. Si vous avez évalué vos élèves en cartographie, vous avez une série de notes pour cette évaluation 1. Après un nouveau cours, vous faites une évaluation 2. Les deux évaluations sont très proches, voire identiques.

Alors, vous pouvez calculer la taille d’effet selon cette formule :

Taille d’effet=(Moyenne (évaluation 2)- Moyenne (évaluation 1))/(Écart type)

L’écart type peut être soit celui de l’évaluation 1, de l’évaluation 2, de l’ensemble des deux séries de notes, voire (si vous utilisez une évaluation standardisée qui a été réalisée sur un grand nombre d’élèves) celui d’une très grande série de notes obtenues par d’autres élèves à la même évaluation. Mon conseil est de prendre la valeur la plus élevée, pour être le plus prudent possible.

Si la différence entre les deux moyennes n’était pas divisée par l’écart type, l’enseignant n’aurait qu’un écart en points propre aux deux évaluations données. Peut-être que les moyennes en cartographie sont plus élevées qu’en analyse de document. Si les élèves progressent de deux points en cartographie et de un point en analyse, comment comparer ces écarts ? En supposant que les notes de chaque évaluation ont une distribution normale, la division par l’écart type mesure le déplacement, en nombre d’écart type, entre les deux distributions.

taille d'effet

La progression est alors exprimée en écart type, ce qui permet de les comparer dans une unité commune. Si les élèves progressent de 0.2 écart type en cartographie et de 0.8 en analyse de document, je peux être plus confiant pour dire qu’ils progressent plus vite dans le second exercice.

Pour calculer une taille d’effet crédible, il faut au minimum une trentaine de notes et si possible soixante-dix ou plus.

Comment interpréter une taille d’effet ?
Les études portant sur de nombreux élèves et les méta-analyses montrent que la progression moyenne d’un élève sur une année correspond à une taille d’effet de 0,40.

5th-annual-conf-john-hattie-keynote-4-638

Une taille d’effet négative de la classe est un signal fort et rare qu’un enseignement a échoué. Elle doit être un signal d’alerte pour l’enseignant. Une taille d’effet entre 0 et 0,15, indique une progression médiocre, ce qui doit faire l’objet d’une analyse de l’enseignant car son apport a été faible. Une progression entre 0,15 et 0.4 indique un effet moyen d’un enseignant sur les résultats de ses élèves. Au-dessus, la progression peut être considérée comme rapide et éventuellement comme le résultat d’une meilleure pratique professionnelle. Les progressions sont souvent plus rapides dans le primaire que dans le secondaire.

Comment calculer une taille d’effet individuelle ?

On peut aussi calculer une taille d’effet individuelle :

Taille d’effet=(Note (évaluation 2)-Note(évaluation 1))/(Écart type de la classe)

Cette taille d’effet mesure l’évolution de l’élève. Cette information est moins pertinente que la taille d’effet du groupe et ne doit pas être surinterprétée.

Que faire de ces données ?
La taille d’effet est une échelle d’efficacité professionnelle plus objective que les estimations utilisées dans l’Éducation nationale, comme une augmentation de moyenne trimestrielle. Ces données questionnent les pratiques de l’enseignant et l’oriente dans son amélioration.

Cette méthode est peu compatible avec les pratiques habituelles dans l’Éducation nationale, où les élèves sont souvent évalués une seule fois, de façon sommative, à la fin de leur apprentissage, ce qui empêche de mesurer une progression. Toutefois, il est possible d’intégrer ce type de mesure en mettant en œuvre des évaluations diagnostiques et formatives, et en réduisant et espaçant les évaluations sommatives. L’enseignant peut alors calculer la progression de ses élèves.

La taille d’effet rend visible la progression des élèves. L’enseignant ne voit plus Stanislas comme un élève en échec, mais comme un élève qui a beaucoup progressé, en augmentant ses résultats de 1.2 écart type, même si sa moyenne trimestrielle reste de 7,6/20. La classe de seconde C a peut-être une moyenne de 10.06/20 en histoire géographie, mais elle a progressé de 0,7 écart type en analyse de document, elle s’est donc améliorée deux fois plus vite que la moyenne des élèves français. Mesurer la taille d’effet focalise l’attention de l’enseignant sur les élèves aux résultats faibles et à la progression lente. En voyant les progrès des élèves, la vision du métier change.

Sources:
Hattie, John, 2008, Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. NY: Routledge. p. 392
Hattie, John A., 2011, Visible Learning for Teachers: Maximizing Impact on Learning.

Une explication en détail sur la taille d’effet.

« C’est la taille d’effet, triple buse ! »

3 « J'aime »

Merci pour ces informations. Si les notes ne sont pas sur une échelle de 0 à 20, mais plutôt sur une échelle différente, peut-on ajuster la formule de la taille d’effet en conséquence ?

Justement, c’est tout l’intérêt du calcul de la taille d’effet (appelée aussi D de Cohen en statistique) : elle permet de comparer des évolutions mesurées avec des outils différents.

Il suffit que le niveau des élèves soit évalué par une échelle numérique continue, comme une note ou un score sur 5, sur 10, sur 27,5 ou sur 100 ou plus, pour que le calcul fonctionne.

Toute l’astuce est d’utiliser la notion d’écart type comme une forme d’unité. On compare en fait de combien d’écart type la distribution des notes s’est déplacée.

C’est utile pour les chercheurs en sciences de l’éducation quand ils veulent comparer l’efficacité de différentes interventions.

1 « J'aime »

Merci. Cependant, dans le contexte du premier degré, où les évaluations sont souvent exprimées sous forme de mentions (A : acquis, AR : à renforcer, etc.), une adaptation de cette méthodologie serait nécessaire et longue.

Je ne suis pas certain que cela soit nécessairement compliqué. On pourrait facilement transformer une évaluation par positionnement en évaluation chiffrée, par exemple en attribuant un point à non acquis, deux à encours d’acquisition, trois à acquis et quatre à dépassé.

Il me semblerait alors assez intuitif de calculer une moyenne avec ces « notes » pour ensuite calculer la taille d’effet.

Je ne suis pas sûr que le faible empan dans la notation biaise la taille d’effet calculée. À coup sûr, il limite les effets des notes extrêmes qui ont tendance à fortement influencer les moyennes, ce qui serait plutôt positif sur le sens de la moyenne. Cela vaudrait le coup de faire le test avec une situation réelle pour voir ce que l’on obtient comme données.

1 « J'aime »

Voici une application de la taille d’effet pour aider les élèves à progresser. 64 élèves de seconde ont suivi un cours d’histoire géographie sur La place des populations de l’Europe dans le peuplement de la Terre. Les élèves doivent répondre à une question sur un document de façon argumentée.

Le système pédagogique est explicite et formatif :

1 Les critères de réussite sont explicites pour les élèves.

2 L’enseignant rédige une réponse argumentée devant les élèves comme phase de modelage.

3 Les élèves rédigent une première réponse argumentée pendant une évaluation formative (première évaluation).

4 La correction insiste sur les critères de réussite non atteints (citation entre guillemets et phrase conclusive) sur lesquels les élèves doivent progresser pour l’évaluation suivante.

5 Les élèves rédigent une nouvelle réponse argumentée en évaluation sommative (deuxième évaluation).

6 La taille d’effet entre les deux évaluations est calculée.

7 Un diagnostic est établi pour les élèves qui n’ont peu ou pas progressé.

8 Ces élèves bénéficient d’un travail en groupe qui cible leurs difficultés et comprend une troisième évaluation.

9 Une deuxième taille d’effet est calculée pour évaluer la progression de l’ensemble des élèves.

La première évaluation montre que peu d’élèves citent le texte avec des guillemets et rédigent une phrase conclusive, malgré les efforts d’explicitation. La moyenne est 3,9/10 et 50 élèves ont moins de 5/10.

La deuxième évaluation montre que les élèves progressent avec une moyenne de 5,1/10. On peut calculer la taille d’effet.

TE 1 = (5,1 - 3,9) /1,6 = 0,76

(1,6 est l’écart type de la première évaluation, car il est le plus élevé)

Le résultat est encourageant, car il correspond, selon John Hattie, à l’équivalent de deux ans de progression moyenne. Cette avancée aurait été réalisée par les élèves pendant une période de trois semaines. Toutefois, il ne faut pas surinterpréter ce résultat, la progression vient surtout du fait que les compétences demandées sont précises et assez simples à acquérir dès que les élèves comprennent les demandes enseignantes.

La taille d’effet montre qu’un résultat en apparence médiocre (5,1/10 de moyenne) cache une forte progression. Surtout, elle nous focalise sur les élèves qui progressent le moins.

On peut calculer une taille d’effet pour chaque élève et représenter les résultats sur un graphique avec la taille d’effet en abscisse et la note à la deuxième évaluation en ordonnée.

Si 29 élèves sur 64 ont une progression inférieure à 0,4 écart type, seulement 24 ont une progression faible et des résultats inférieurs à la moyenne. Ce sont ces élèves à résultat faible et progression lente qui feront l’objet d’une remédiation.

1 « J'aime »

Merci Aurélien pour toutes ces précisions. C’est bien détaillé et formateur. Bravo !