Peut-on mesurer mathématiquement et objectivement les compétences des élèves ?

Avec Alfred Binet vers 1905, le concept psychométrique de QI a permis d’évaluer l’âge mental par rapport à l’âge mental moyen scolaire, afin de détecter des retards du développement. Le QI, à la base, ne mesure pas l’intelligence…

Sur un principe similaire (la courbe de Gauss), peut-on évaluer objectivement et mathématiquement les élèves d’une classe ? Je pense que oui, même si actuellement la notation par les profs est souvent subjective…

Comme exemple, je vais me baser sur le concept de QCM, un questionnaire basé sur 30 questions dont chaque question a une seule bonne réponse possible parmi 4 réponses proposées. Bref, un QCM rempli par un élève aura alors entre 0 bonne réponse (devoir noté 0/20) et 30 bonnes réponses (devoir noté 20/20).

Mais doit-on noter le QCM de façon proportionnelle, tel que le nombre de bonnes réponses est proportionnel à la notation sur 20 ? Non, et je vais expliquer pourquoi.

En fait, la conversion du nombre de bonnes réponses en note sur 20 est une loi logarithmique. En effet, à chacune des questions du QCM, il existe une probabilité de 1 chance sur 4 d’avoir une bonne réponse par question. Par conséquent, si un élève répond au hasard complètement au QCM, il aura en moyenne 7 bonnes réponses sur 30, dans ce cas on ne pourra pas lui attribuer une note de 7 sur 30, c’est-à-dire 4,66 sur 20. Obtenir un gain après avoir répondu au hasard, ce n’est pas légitime. Il faut donc prouver que l’on peut réaliser un score meilleur que le pur hasard, pour se démarquer de façon statistiquement significative. D’où une échelle logarithmique de conversion.

 

  • Entre 0 et 7 bonnes réponses sur 30, la note sera de 0/20. Dans cet intervalle, un élève connaît forcément les bonnes réponses mais aura choisi délibérément de mettre des réponses fausses. Même si c’est rare que ça arrive de faire zéro bonne réponse au hasard, sauf si l’élève ne répond pas du tout aux questions, c’est éliminatoire.
  • Avec 7 bonnes réponses, c’est le score le plus fréquent obtenu en moyenne par le hasard. Aucun point n’est attribué : 0/20. La note devient supérieure à zéro sur 20 au-delà de 7 bonnes réponses au QCM. C’est logique.
  • À partir de 12 points sur 30, la différence devient significative statistiquement (p-value = 0,05, distanciation de 2 écarts-types, et d’après la loi binomiale), auquel cas la note sera la moyenne : 10/20. L’écart-type est égal à 2,37.
  • À partir de 14 ou 15 points sur 30,  une nouvelle significativité (p-value = 0,01, distanciation de 3 écarts-types, et selon la loi binomiale), auquel cas la note sera de 12/20.
  • Enfin, avec 30 points sur 30, la note sera évidemment de 20/20. Mais la fonction dans son ensemble dans l’intervalle [7 ; 30] est logarithmique.
  • Équation approximative : note sur 20 = 13,51 * ln (0,1561 * bonnes réponses).
  • Il est possible d’ajuster autrement la notation : on pourrait par exemple attribuer 8/20 pour 12 points sur 30, mais cela ne changera que peu la courbe. Reste à définir correctement ce seuil. Le but de l’évaluation ici, c’est de voir l’effort fourni par rapport au hasard.

 

Voila ce que ça donne graphiquement, en première approximation :

 

L’intérêt d’un QCM correctement calibré est de mesurer le plus fiablement possible la quantité d’effort intellectuel par rapport à ce qu’on obtiendrait au hasard

Tu joues au hasard ? Donc tu n’as fait aucun effort, alors zéro pointé… Un peu d’effort afin de s’éloigner du hasard ? Tu gagnes alors des points. Mais plus l’effort sera important, plus ça devient dur d’essayer d’atteindre 30 bonnes réponses aux 30 questions du QCM (croissance logarithmique). C’est simple. Quel meilleur arbitre existe t-il de mieux que le hasard et de se mesurer contre lui ? C’est mieux que la subjectivité des profs dont les notes données à un élève varient sensiblement d’un prof à l’autre, même quand l’élève ne change pas sa méthode de travail (pour une même matière, aucun prof ne note pareil qu’un autre prof). Le travail ne se mesure que par le seul mérite, par l’effort de l’élève. Établir des quotas arbitraires et aveugles pour favoriser les élèves à avoir le Bac, de façon à ce qu’un maximum d’élèves aient le Baccalauréat, ce n’est pas une évaluation objective, ça ne veut rien dire. Il faut évaluer les compétences des élèves pour ce qu’elles valent réellement. Les mauvaises notes ne servent ni à juger ni à punir, mais à inciter à progresser grâce à des efforts réguliers (cela s’apprend, et peut ainsi devenir une bonne habitude). La réussite ça ne fonctionne pas autrement.

Bac 2015 de mathématiques série STI2D

 

J’ai effectué les exercices pour en évaluer la difficulté. Exercices accomplis sans le corrigé car apparemment le corrigé n’est pas encore en ligne au moment où je rédige cet article. Mais le lendemain, le corrigé est disponible en ligne : http://www.letudiant.fr/examen/baccalaureat/bac-sti2d/corriges-et-sujets-du-bac-sti/bac-sti2d-le-sujet-de-maths-specialite-spcl.html#noroutage  et je procède par conséquent à la correction avec une couleur rouge.

 

Exercice 1

 

  1. 3*e^(-i*pi/6) = 3 3/2 – 3i/2  Bonne réponse
  2. z1 * z2 = (1 + 3)(3 – i) = 2 3 + 2i = 4 * e^(i*pi/6)  Bonne réponse
  3. y »+y/3=0 (équation différentielle du second ordre) : y(x) = A*cos (x/3) + B*sin (x/3) Bonne réponse
  4. La limite de (2 + 1/(x+1)) tend vers 2.  Bonne réponse

4 points attribués à l’exercice 1

 

Exercice 2

A.    Ps = Pe * e^(-a*L) = 7 * e^(-0,046 * 100) = 0,07 < 0,08. Donc oui, pour ce type de fibre, il sera nécessaire de placer au moins un amplificateur sur la ligne pour que le signal soit détectable en sortie. Bonne réponse

B.    

  1. y’+0,035y=0, avec g(0) = y(0) = 7, ça donne g(x) = 7 * e^(-0,035 *x). OK
  2. Le coefficient d’atténuation de la fibre est de toute évidence la valeur 0,035. OK
  3. Le sens de variation de g(x) est une fonction décroissante. Lorsque cette fonction voit x tendant vers l’infini, la fonction tend vers zéro. OK
  4. g(100) = 7 * e^(-0.035 * 100) = 0,21. Donc oui, le signal sera encore détecté au bout de 100 km de propagation. La longueur maximale de la fibre permettant une détection du signal à la sortie sans amplification est de 127,8 km. OK

5 points attribués à l’exercice 2

Exercice 3

A

  1. Selon les prévisions de l’ADEME, quel serait en 2030 le nombre de véhicules hybrides vendus ? Le tableau indique que 24% des 2 millions de véhicules en 2030 sont hybrides, soit 0,24 * 2 000 000 = 480 000. Bonne réponse
  2. Selon les prévisions de l’ADEME, quel serait en 2030 le pourcentage de véhicules à faible émission de CO2 dans le parc automobile ? Dans le tableau, on voit que la part des véhicules thermiques (donc à forte émission de CO2) atteint 89%, par conséquent, la part des autres véhicules (ceux à faible émission de CO2) est donc de 11%. Bonne réponse  Cependant, si l’on explore au-delà de ce que demande l’exercice, comme on sait qu’une voiture thermique du parc automobile produit 165 g/CO2 en moyenne par véhicule, alors l’estimation du taux de CO2 des autres véhicules est calculable par un système de deux égalités à deux inconnues : 0,89*165+0,07A+0,04B = 100 et 0,64*127+0,24A+0,12B=49, avec A = taux de CO2 pour voitures hybrides et B = taux de CO2 pour voitures électriques. Mais je trouve A=3609 g/CO2 et B=-7487 < 0. Il y a un problème… Mais si je pose B=0 (puisque les voitures électriques n’émettent théoriquement pas de CO2), je trouve cependant une valeur négative pour le taux de CO2 moyen d’une voiture hybride. Je m’interroge légitimement sur la crédibilité des taux de CO2 indiqués dans le tableau de l’énoncé. A moins qu’il existe une explication qui aurait échappé à mon attention…

B

  1. Pourcentage d’augmentation des ventes de véhicules hybrides de 2012 à 2013 : 27730 * 1,4908^1 = 41340, donc ça a augmenté de 49,08%.  Bonne réponse
  2. u0= 41340, puisque un = u0 * 1,16^n = 41340 * 1,16^n. Bonne réponse Avec 41340 * 1,16^17 = 515414, et avec le ratio 515414/2000000 = 25,77%, je démontre que ça dépasse les 24% prévus pour les ventes en 2030. Bonne réponse
  3. Sorry, I haven’t any tableur, but I can calculate everything… Alors 13954*1,16^17=173974, puis 173974/2000000=8,7% au lieu de 12%, donc non, le taux d’augmentation annuel de 16% ne permet pas d’atteindre les prévisions de l’ADEME des ventes de véhicules électriques en 2030. Bonne réponse mais absence de la formule saisie dans la cellule B3 du tableur
  4. La valeur 173 974 prise par la variable u dans l’initialisation de l’algorithme correspond au nombre de bagnoles électriques prédites pour 2030, à partir d’un taux de ventes de +16% par an depuis 2013. Bonne réponse La valeur affichée par l’algorithme lorsqu’il a achevé son travail est 19. Bonne réponse malgré l’absence des étapes de l’algorithme Sans algorithme on peut néanmoins établir une équation afin de calculer précisément la solution :   (1/2000000) * 13954 * (1 – x/100)^17=0,12. Et je trouve x=18,22, soit un taux de +18,22% par an.

Attribution de 5 à 6 points : doit-on appliquer une pénalité concernant la non-saisie de cellule du tableau et l’absence d’étapes de l’algorithme malgré des réponses finales correctes ?

Exercice 4

  1. La courbe adéquate correspond à la figure 3, parce que le maximum de la courbe correspond à la valeur de x qui exprime la valeur moyenne de 1,5. Bonne réponse P(1,485 <= X <= 1,515) = intégrale de (1/(0,015(2*pi))) * e^(-(x – 1,5)/(2*0,015²)) dx = 0,6827, et cela correspond à la densité de probabilité dans un intervalle qui est celui de la moyenne plus ou moins l’écart-type. Bonne réponse
  2. P(X=1,48)=10,934. Faux, la probabilité est nulle Bizarre comme valeur réelle, je m’attendais à un nombre inférieur à 1, ne serait-ce pas plutôt 10,93%. J’aurais dû me résigner à mon premier choix car une valeur nulle faisait partie de ma première hypothèse mais j’ai malheureusement choisi une autre valeur qui est fausse (oh le con !) P(1,46 <= X <= 1,54) = 0,9864. C’est bizarre, le corrigé dit que c’est 0,9923. P(X >1,55) = 0,00043. Faux ici aussi, le corrigé indique une valeur 10 fois plus élevée : 0,004.
  3. Je suppose qu’il s’agit de l’intervalle de confiance à 95%. Cet intervalle correspond à la moyenne plus ou moins 1,96 multiplié par l’écart-type (0,04) et divisé par la racine carrée de l’échantillon (lot de 10000 bouteilles). Je n’en suis pas sûr mais je pense qu’il y a une confiance à 95% pour que les bouteilles non conformes sont au nombre compris entre 60 et 90. Or il y a 90 bouteilles non conformes, c’est juste à la limite de l’intervalle. J’avais fait d’autres essais de calcul en brouillon, me suggérant que 90 bouteilles non conformes c’est au-delà du seuil de ce qui est « normal ». Je ne suis pas sûr de mon résultat ici. Faux, car l’intervalle de confiance de 95% indique des bornes qui vont de 59 à 95 produits non conformes sur 10000, et 90 ça reste dans cette marge « normale ». Je me suis planté dans l’exercice 4, et c’est l’occasion d’étudier le corrigé attentivement…

Ici, je m’attribue seulement 1 point au lieu des 5

Par conséquent, ma note est entre 15 et 16/20. Assez bien, mais peut mieux faire !

 

na_gif

  •  Mise à jour du 19/06/2015 : le lendemain de l’accomplissement des exercices, je découvre en ligne le corrigé de l’épreuve  de maths STI2D. Par conséquent, je procède à la vérification de mes réponses.

 

Quand Internet résout les DM à votre place

Quand Internet résout les DM (devoirs maison = homework) à votre place.

Analyse de la situation de ceux qui demandent de l’aide ou à faire faire leurs devoirs par autrui sur Internet :

  • Quand vous êtes étudiants, vous apprenez, donc vous cherchez tout seul.
  • Quand vous avez fini vos études, vous avez un travail et vous touchez un salaire.

Il est donc hors de question de vous donner la solution…

  • Soit vous êtes lycéens ou étudiants et ce n’est pas vous rendre service que de faire vos devoirs à votre place.
  • Soit vous n’êtes pas lycéens ni étudiants, et dans ce cas on veut bien donner une solution moyennant un salaire.

Personne ne m’a aidé (c’est-à-dire : personne n’a fait mes devoirs à ma place) pendant toutes mes études scientifiques, et heureusement, car sinon je n’aurais rien appris et je serais toujours un cancre en maths maintenant.

La réussite dans les études se gagne avec notre propre sueur. C’est comme le sport : si vous êtes sportif, c’est vous qui devez pratiquer votre sport, personne ne fait de compétitions sportives à votre place…

Le dopage dans le sport c’est démodé, maintenant on engage une doublure qui fait le boulot à notre place.

iconlol

© 2013 John Philip C. Manson