Détection mathématique de triche dans une classe d’école

Je propose un exercice inédit que j’ai inventé.

On suppose que la distribution des notes dans une classe de N élèves est une courbe gaussienne normale centrée sur une moyenne. Ces notes forment une courbe gaussienne classique qui reste habituelle, sans changements de notes majeurs.

Je pose m=intégrale de x=a à x=b de (1/(k*(2*pi)^0.5)) * e^(-(x-µ)²/(2*k²)).

m est ici une valeur entre 0 et 1, c’est la proportion d’élèves ayant une note comprise entre a et b, selon un écart-type k.

Il peut arriver que les élèves se mettent à travailler mieux afin d’améliorer leur note, ce qui modifierait du coup la courbe gaussienne. L’intérêt est d’évaluer la variation par rapport à la courbe habituelle.

Supposons un cas où la moyenne de la classe est µ = 14,01 (sur 20), lors du dernier trimestre par exemple. Son écart-type est de k = 3,76. On obtient alors une courbe gaussienne particulière, véritable signature instantanée de la classe.

On va ensuite exposer une problématique. Lors du trimestre suivant : parmi une classe de N élèves, x élèves obtiennent chacun une note supérieure ou égale à 18. La question : y a t-il eu triche ?

Probabilité pour que x élèves aient plus de 18 sur 20 : on calcule T = l’intégrale de x=18 à x=20 de (1/(3,76*(2*pi)^0.5)) * e^(-(x-14,01)²/(2*3,76²)) avec un écart-type k = 3,76.

La probabilité devient P = (N! / ((N-x)!*x!)) * T^x * (1-T)^(N-x).

Si la probabilité est inférieure à 0,05, on peut légitimement soupçonner une fraude. Dans notre exemple ci-dessus, si x est supérieur ou égal à 5, on peut avoir des doutes. Parmi ceux qui ont eu plus de 18/20, il y a des fraudeurs mais il peut y avoir aussi ceux qui ont mérité leur note. On peut détecter la fraude mais on ne peut pas identifier les tricheurs, le meilleur choix est de coller un zéro à tout le monde, comme sanction, on est sûr alors d’avoir atteint les tricheurs, même si on fait des victimes collatérales…

  • Voici un autre débat : la suppression des notes à l’école.

Certains pédagogues ont l’idée saugrenue de supprimer la notation des élèves… Supprimer les notes, c’est tromper les élèves. Et surtout, comment ferait-on pour détecter la probabilité de triche lors d’un examen de mathématiques par exemple ?

Le but des mauvaises notes quand on en reçoit, c’est d’identifier ses propres erreurs, de se remettre en question dans le but de s’améliorer. Je n’ai pas toujours été bon en maths autrefois (il y a bien longtemps), et une mauvaise notation contraint à redoubler d’efforts pour progresser. Quand on veut comprendre, on finit toujours par y arriver, on le peut. Les efforts réguliers produisent toujours une progression. Se dire « Je suis nul en maths » c’est en fait un effet nocebo (contraire du placebo), une méthode Coué avec des effets délétères et fatalistes. Si on ne note plus les élèves, on ne fera que masquer et nier un problème de plus. L’école est nivelée par le bas, et bientôt il ne finira par ne plus rien rester du tout !

  • La notation sur 10 ou sur 20 offre une évaluation fiable : elle est le meilleur critère pour évaluer le travail de l’élève et permet aux parents de savoir où en est leur enfant. La note est la mesure d’une compétence. Elle n’a pas pour seule vocation de « juger » un élève ni même de les comparer entre eux. Elle a aussi pour avantage d’être simple, en comparaison des autres systèmes d’évaluation par « acquisition de compétences » avec des codes de couleurs (rouge, orange, jaune, vert), de lettres (ABCD) ou de chiffres (de 1 à 4). Avec ces systèmes alternatifs, il serait plus complexe pour les enseignants de mesurer ce qui est acquis et ce qui ne l’est pas. Il y aurait aussi un risque que ces barèmes aboutissent à trop de laxisme. Les notes sur 10 ou sur 20 peuvent inciter les élèves à travailler pour progresser, à condition que les professeurs précisent ce qu’il faut améliorer et encouragent les élèves. A l’école, la sélection est naturelle, elle ne dépend que des efforts des élèves, un prof ne donne pas des mauvaises notes par injustice ni par sadisme. Moi je le dis clairement : niveler l’école selon les désirs des élèves ou celui de leurs parents, pour leur faire plaisir, ça ne les aide absolument pas ! Le progrès scolaire n’est possible qu’avec une contrainte ou une difficulté, une bonne note ça doit se mériter. Le remède contre l’échec scolaire ne tient qu’en un seul mot : le travail, aussi bien de la part des profs que celle de leurs élèves. La question à se poser : le problème est-il la notation elle-même ou les échecs qu’elle révèle ?

 

Musique, plagiat, contrefaçon, et probabilités

J’ai appris aujourd’hui la condamnation en appel d’un chanteur français célèbre. Le tribunal a rendu le jugement en estimant que le chanteur a réellement plagié la chanson d’un autre…

Le plagiat est une faute morale, civile, commerciale et/ou pénale consistant à copier un auteur ou créateur sans le dire, ou à fortement s’inspirer d’un modèle que l’on omet délibérément ou par négligence de désigner. Il est souvent assimilé à un vol immatériel.

Sans nommer le chanteur, on va voir si mathématiquement la condamnation est justifiée. Même si la chanson est contrefaite (en partie), elle reste une belle chanson avec un beau texte. Avec sa belle voix, le chanteur (vous savez qui) est un véritable artiste : même s’il a partiellement copié une oeuvre, il sait écrire des émotions à travers sa musique. Il est facile de pleurer, ému, en écoutant ses chansons.

J’ai examiné la partition de musique. Il paraît que sur 63 notes de musique du refrain il y aurait 41 notes communes entre la partition présumée plagiaire et la partition originale.

Mais l’estimation de la culpabilité d’un chanteur ne se base pas sur ce pourcentage de 41 notes communes sur 63 notes. Outre le pourcentage 41/63, il faut déterminer la probabilité pour qu’une oeuvre soit une copie partielle d’une oeuvre originale, et l’on va voir cela avec la loi binomiale.

La partition comporte ces informations essentielles :

  • Paramètres de durée : soupir, demi-soupir, demi-pause, pause, noire, croche, blanche.
  • Paramètre de hauteur (fréquence acoustique) : 10 niveaux de hauteur sur la portée.

Par conséquent, chaque notation écrite (1 note ou 1 silence) sur la portée dans la partition a 70 façons différentes d’être écrite.

Et la partition, si je ne m’abuse, utilise une harmonique dont la fréquence acoustique (sur un piano) est entre 163,5 Hz et 327 Hz, entre Mi2 et Mi3.

P = (63! / (41! * 22!)) * (1/70)41 * (1 -(1/70))22 = 8,6 * 10-60.

La probabilité pour qu’il y ait 41 notes sur les 63, qui aient rigoureusement chacune exactement la même hauteur et le même temps, entre la copie et l’original (donc comme un copié/collé), est de 0,0000000000000000000000000000000000000000000000000000000000086. C’est très significatif. Il n’y a pas de doute. Environ une chance sur 10 millions de milliards de milliards de milliards de milliards de milliards de milliards…

Mais pour une oeuvre seulement ressemblante, du type similitude quand la note suivante monte ou baisse en hauteur, et a un temps court ou long ?

On vérifie :

P = (63! / (41! * 22!)) * (1/4)41 * (1 -(1/4))22 = environ 0,00000000002.  Soit une chance sur 50 milliards.

Là encore, ça reste très significatif. Même quand la ressemblance tend à être vague.

Il apparaît évident que 41 notes communes sur les 63, ça ne relève pas du hasard accidentel. L’expert du tribunal avait raison…

Mais alors, quel contexte faut-il pour innocenter un artiste injustement accusé de plagiat, ou pour lui accorder le bénéfice du doute ?

Lorsque 12 à 20 notes présentent une ressemblance avec entre 12 et 20 notes d’une oeuvre originale, sur 63 notes en tout, là dans ce cas la probabilité est suffisamment élevée pour dire que l’accusation de plagiat ne se base pas sur une preuve significative.

  • Mais malheureusement, dans le cas qui a été jugé, il s’agit de 41 notes sur 63. La probabilité est nulle pour écrire 41 notes sur 63 qui soient identiques aux 41 notes du refrain original. Et il y a une chance sur 50 milliards dans le cas de 41 notes sur 63 qui donnent une mélodie seulement ressemblante. Mais s’il n’y avait eu que 12 à 20 notes communes maximum (ressemblantes à l’original, pas rigoureusement identiques à l’original), là l’innocence (ou le non lieu) aurait été crédible.

Hey psssst ! Si on plagie délibérément 12 à 20 notes de musique en les disposant par ressemblance et non à l’identique par rapport à l’original, on ne peut pas ensuite prouver si c’est accidentel ou si c’est intentionnel.  Chuuuut ! 😉

Mais là, 41 notes communes, sur les 63, c’est trop, on est imprudent et on se fait forcément choper…

John Philip C. Manson