L'administration du Texas met en œuvre une correction automatique pour les évaluations scolaires obligatoires

À la fin de l’année, les écoles du Texas utiliseront des ordinateurs pour corriger certains devoirs destinés aux élèves âgés de 8 à 14 ans. Cette stratégie permettrait d’économiser de l’argent. Mais comment cela va-t-il fonctionner ?

Publié le 22/04/2024 11:51

Temps de lecture : 3 minutes

Une version d'essai testée l'hiver dernier a donné plus de mauvaises notes qu'une niveleuse humaine. Photo d'illustration (JEFFREY GROENEWEG/ANP/AFP) — Une version d’essai testée l’hiver dernier a donné plus de mauvaises notes qu’une niveleuse humaine. Photo d’illustration (JEFFREY GROENEWEG/ANP/AFP)

Ces ordinateurs corrigeront le test STAAR, les initiales américaines de ce qu’on appelle l’évaluation de la préparation académique dans l’État du Texas. Il s’agit d’un examen standardisé que passent chaque année tous les élèves de l’équivalent du CE2 à la 4e année. Il permet de jauger, comme son nom l’indique, le niveau global d’un élève en lecture, écriture, sciences et sciences humaines.

Jusqu’à 4 000 postes de correcteurs enregistrés

Jusqu’à l’année dernière, ce test consistait principalement en des questionnaires à choix multiples. Mais la nouvelle version implique des réponses plus ouvertes avec du texte construit, plus difficile à corriger automatiquement. Désormais, la technologie qui alimente le correcteur numérique fonctionne un peu comme ChatGPT. L’intelligence artificielle a été entraînée avec 3 000 réponses évaluées par des humains. Elle a analysé ces réponses et les notes qui les accompagnaient, pour apprendre à noter comme un humain. Selon l’administration du Texas, les humains vérifieront environ un quart des réponses notées par l’ordinateur. Sachant que si l’ordinateur n’est pas sûr de sa note ou ne comprend pas la réponse – si l’élève a écrit en argot par exemple, un humain examinera la copie à son tour.

Avec ce système, l’administration texane espère économiser 15 à 20 millions de dollars par an. Jusqu’à présent, pour assurer la correction de ces tests STAAR, le Texas embauchait environ 6 000 correcteurs. L’intelligence artificielle devrait donc réduire fortement les besoins humains cette année. Le Texas prévoit d’embaucher plus de 2 000 personnes.

Une communauté éducative surprise par l’initiative

LE Tribune du Texas, premier média à avoir fait état de cette affaire, rapporte que l’annonce a surpris de nombreux membres du corps enseignant et des parents d’élèves. Il existe également un scepticisme quant à la capacité de l’intelligence artificielle à faire ce travail correctement et à noter la créativité ou la réflexion d’un élève. Et qu’arrive-t-il à ces élèves si les notes ne correspondent pas à la réalité ? Apparemment, une version d’essai testée l’hiver dernier a donné plus de mauvaises notes qu’une niveleuse humaine.

Les résultats de ces tests sont également utilisés par l’administration pour évaluer chaque district scolaire. Toutefois, ces académies sont dirigées aux Etats-Unis par des conseillers élus par les citoyens, et l’administration peut éventuellement décider de changer ces conseillers si le niveau des étudiants de l’académie est jugé insatisfaisant au fil du temps. D’où l’importance de ces tests, de leur notation et du système de notation, qui a des conséquences au-delà des seuls étudiants.