Seules les personnes avec un QI de 140 peuvent résoudre ce calcul ? Vraiment ?

 

Je cite ladite page : « Quel est le dernier numéro de cette suite mathématique? Vous souvenez-vous bien de vos cours de mathématique de l’école élémentaire ? »

L’école élémentaire ? Sérieux ? Les séries arithmétiques et les séries géométriques sont étudiées en classe de première, au lycée. Ce n’est pas un niveau élémentaire, mais c’est toutefois largement à la portée d’un jeune de 17 ans.

Faudrait-il avoir un QI de 140 pour résoudre ce défi mathématique ? J’en doute, puisque comme je l’ai dit, c’est un sujet étudié par les lycéens, à la portée de tous les lycéens.

Je cite encore la page : « Depuis que ce petit défi mathématique a été proposé sur internet, seulement 1 personne sur 30 a été capable de trouver la solution, seule et rapidement. »

Là encore, je suis sceptique. Le défi ne pose portant aucune difficulté d’analyse.

Je donne des précisions : il s’agit d’une suite arithmétique dont la raison n’est pas constante mais de croissance linéaire. La série est de la forme Un = n² – 4.

En programmation informatique, au lieu d’utiliser la fonction Un = n² – 4, on peut aussi bien écrire un code source Perl sous cette forme :

 

print « 0 « ;
for ($n = 2; $n <= 100; $n++)
{
$r = 2 * $n + 1;
$suite = $suite + $r;
print « $suite « ;
}
print  » \n »;

 

Bref, je n’ai pas un QI de 140, mais j’ai pourtant résolu le défi rapidement et sans difficulté…

Et puis, une proportion de 1 personne sur 30 correspond plutôt à un QI supérieur ou égal à 127 ou 128, mais pas 140.

La réussite d’un défi ne dépend pas du QI, la réussite ne dépend que de l’apprentissage de certaines notions en mathématiques et de l’effort exercé. Donc ça ne dépend que de la volonté. Quiconque s’autoproclame nul en maths ne veut simplement pas faire l’effort de réfléchir, ni l’effort d’apprendre. On n’est nul que si on a essayé en dépit des efforts. Déclarer sa défaite sans avoir essayé ce n’est pas être nul, c’est être lâche. Un nul est celui qui veut atteindre un objectif et se cherche des moyens en vain en dépit de ses efforts, sans réussir, et un lâche est celui qui ne veut pas atteindre un objectif et se cherche des excuses…

 

J’en profite aussi pour vous souhaiter une bonne année 2020.

 

© 2020  John Philip C. Manson

Peut-on mesurer mathématiquement et objectivement les compétences des élèves ?

Avec Alfred Binet vers 1905, le concept psychométrique de QI a permis d’évaluer l’âge mental par rapport à l’âge mental moyen scolaire, afin de détecter des retards du développement. Le QI, à la base, ne mesure pas l’intelligence…

Sur un principe similaire (la courbe de Gauss), peut-on évaluer objectivement et mathématiquement les élèves d’une classe ? Je pense que oui, même si actuellement la notation par les profs est souvent subjective…

Comme exemple, je vais me baser sur le concept de QCM, un questionnaire basé sur 30 questions dont chaque question a une seule bonne réponse possible parmi 4 réponses proposées. Bref, un QCM rempli par un élève aura alors entre 0 bonne réponse (devoir noté 0/20) et 30 bonnes réponses (devoir noté 20/20).

Mais doit-on noter le QCM de façon proportionnelle, tel que le nombre de bonnes réponses est proportionnel à la notation sur 20 ? Non, et je vais expliquer pourquoi.

En fait, la conversion du nombre de bonnes réponses en note sur 20 est une loi logarithmique. En effet, à chacune des questions du QCM, il existe une probabilité de 1 chance sur 4 d’avoir une bonne réponse par question. Par conséquent, si un élève répond au hasard complètement au QCM, il aura en moyenne 7 bonnes réponses sur 30, dans ce cas on ne pourra pas lui attribuer une note de 7 sur 30, c’est-à-dire 4,66 sur 20. Obtenir un gain après avoir répondu au hasard, ce n’est pas légitime. Il faut donc prouver que l’on peut réaliser un score meilleur que le pur hasard, pour se démarquer de façon statistiquement significative. D’où une échelle logarithmique de conversion.

 

  • Entre 0 et 7 bonnes réponses sur 30, la note sera de 0/20. Dans cet intervalle, un élève connaît forcément les bonnes réponses mais aura choisi délibérément de mettre des réponses fausses. Même si c’est rare que ça arrive de faire zéro bonne réponse au hasard, sauf si l’élève ne répond pas du tout aux questions, c’est éliminatoire.
  • Avec 7 bonnes réponses, c’est le score le plus fréquent obtenu en moyenne par le hasard. Aucun point n’est attribué : 0/20. La note devient supérieure à zéro sur 20 au-delà de 7 bonnes réponses au QCM. C’est logique.
  • À partir de 12 points sur 30, la différence devient significative statistiquement (p-value = 0,05, distanciation de 2 écarts-types, et d’après la loi binomiale), auquel cas la note sera la moyenne : 10/20. L’écart-type est égal à 2,37.
  • À partir de 14 ou 15 points sur 30,  une nouvelle significativité (p-value = 0,01, distanciation de 3 écarts-types, et selon la loi binomiale), auquel cas la note sera de 12/20.
  • Enfin, avec 30 points sur 30, la note sera évidemment de 20/20. Mais la fonction dans son ensemble dans l’intervalle [7 ; 30] est logarithmique.
  • Équation approximative : note sur 20 = 13,51 * ln (0,1561 * bonnes réponses).
  • Il est possible d’ajuster autrement la notation : on pourrait par exemple attribuer 8/20 pour 12 points sur 30, mais cela ne changera que peu la courbe. Reste à définir correctement ce seuil. Le but de l’évaluation ici, c’est de voir l’effort fourni par rapport au hasard.

 

Voila ce que ça donne graphiquement, en première approximation :

 

L’intérêt d’un QCM correctement calibré est de mesurer le plus fiablement possible la quantité d’effort intellectuel par rapport à ce qu’on obtiendrait au hasard

Tu joues au hasard ? Donc tu n’as fait aucun effort, alors zéro pointé… Un peu d’effort afin de s’éloigner du hasard ? Tu gagnes alors des points. Mais plus l’effort sera important, plus ça devient dur d’essayer d’atteindre 30 bonnes réponses aux 30 questions du QCM (croissance logarithmique). C’est simple. Quel meilleur arbitre existe t-il de mieux que le hasard et de se mesurer contre lui ? C’est mieux que la subjectivité des profs dont les notes données à un élève varient sensiblement d’un prof à l’autre, même quand l’élève ne change pas sa méthode de travail (pour une même matière, aucun prof ne note pareil qu’un autre prof). Le travail ne se mesure que par le seul mérite, par l’effort de l’élève. Établir des quotas arbitraires et aveugles pour favoriser les élèves à avoir le Bac, de façon à ce qu’un maximum d’élèves aient le Baccalauréat, ce n’est pas une évaluation objective, ça ne veut rien dire. Il faut évaluer les compétences des élèves pour ce qu’elles valent réellement. Les mauvaises notes ne servent ni à juger ni à punir, mais à inciter à progresser grâce à des efforts réguliers (cela s’apprend, et peut ainsi devenir une bonne habitude). La réussite ça ne fonctionne pas autrement.

Pourquoi des personnes « intelligentes » ne sont pas toujours rationnelles ?

L’argumentation critique sur la Mensa montre que le QI n’empêche pas l’irrationnalité.

Personnellement, je ne crois pas à l’intelligence. On n’a même pas de définition précise et objective de l’intelligence. Je crois même que la connerie est la chose la plus communément partagée…

Dans mon vécu, j’ai eu plusieurs opinions successives de ce que pourrait être l’intelligence : autrefois, j’attribuais beaucoup d’importance à la mémoire et à la capacité d’apprentissage afin de développer l’aptitude de résoudre des problèmes, mais depuis quelques années j’irai jusqu’à considérer que le manque d’intelligence est un manque d’esprit critique afin de résoudre des problèmes, mais malgré les efforts humains nous pouvons rester faillibles selon les circonstances. Les êtres humains sont pas parfaits, et ont leurs limites.

D’après ce que j’ai lu dans l’article cité en lien ci-dessus : la Mensa semble sans intérêt et l’on a l’impression que l’on risque de s’y ennuyer à en mourir… C’est juste un club de joueurs de tests de QI tout comme il existe des joueurs habiles au Sudoku. Mais y mesurent-il l’intelligence ou l’égo ?…

Un être qui pense cherche à résoudre des problèmes (que ce soit en science ou en politique ou etc). Or, selon moi, chercher à résoudre des problèmes, ça implique utiliser une seule méthode ou plusieurs méthodes. Mais négliger une méthode comme la rationalité n’est-elle pas un défaut d’intelligence ?

Il ne faut pas confondre les émotions et la logique. Il est fort difficile de rester constamment logique, mais être souvent logique, ça peut risquer d’être considéré comme un grand malade (comme Kurt Gödel qui avait l’esprit fort tourmenté). Pourtant, le recul critique peut permettre de ne pas se perdre dans des situations loufoques.

L’article a raison : mieux vaut s’entourer de gens rationnels que de bons compétiteurs en tests de QI. Quand les gros QI interagissent, on a l’impression d’avoir affaire à des coqs qui chantent plus fort l’un contre les autres, avec les pieds dans la merde.

fiercoq

iconlol

Être rationnel n’est pas une chose naturelle, c’est un travail utile qui s’apprend. La rationalité est une marque de motivation, de volonté. L’irrationalité est une preuve de paresse intellectuelle, un manque de volonté au lieu de s’efforcer à démêler le vrai du faux. De bons scores de QI semblent incompatibles avec la paresse intellectuelle, justement. Les esprits intelligents sont fréquemment stimulés par des informations nouvelles et n’arrêtent quasiment pas de réfléchir. Mais tout croire sans recul critique (qui est le propre de l’irrationnalité) n’est absolument pas réfléchir… L’irrationalité est de la paresse, de la bêtise…

© 2015 John Philip C. Manson

 

Le QI ne fait pas le génie

Je suis sidéré par l’article de Science et Avenir… Ce magazine évoque une étude menée par deux psychologues de l’université de Californie qui ont revisité l’étude d’une psychologue américaine de l’école de médecine de Yale, Catharine Cox, datant de 1926.

Pour entrer dans les détails, Catharine Cox donna une estimation du QI de célébrités qui vécurent à une époque où les tests de QI (et plus particulièrement les tests de QI pour adultes) n’existaient pas encore. C’est peu avant la Première Guerre Mondiale que le docteur Binet a conçu un outil psychométrique, mais cet outil était destiné à dépister les jeunes enfants en situation de retard scolaire (en termes de développement intellectuel par rapport à une moyenne d’enfants du même âge physique). C’est vers les années 1950 que les tests de QI notamment pour adultes ont été mis au point. Puis vint la mode de la surdouance, qui s’éloigne de la finalité initiale qui était de dépister des enfants ayant un retard du développement mental.

Ce que je souligne, c’est l’ineptie qu’est la prétention d’évaluer des QI sans utiliser les tests de QI. Les tests de QI souffrent eux-mêmes d’un biais : l’écart-type pour la valeur d’un résultat d’un test de QI est d’environ 11 points de QI. C’est-à-dire que pour un QI quelconque que l’on a « mesuré », il existe une incertitude de plus ou moins 11 points : par exemple, une personne a un QI de 126 d’après le test, mais selon un point de vue statistique, ce QI est plus vraisemblablement de 126 plus ou moins 11 points (c’est-à-dire que la valeur est comprise dans l’intervalle [115 ; 137]).

Ainsi, l’incertitude autour de la valeur d’un résultat de test de QI est de l’ordre de 20 à 25%.

Mais lorsque l’on bidouille des grandeurs quantitatives sur la prétention à pouvoir estimer un QI sur l’appui de biographies ou des oeuvres écrites de célébrités, c’est complètement inepte. En effet : Jean-Jacques Rousseau, Rembrandt, Blaise Pascal, Mozart, Isaac Newton, Charles Darwin, ils ont vécu bien avant l’invention des tests de QI. A ce niveau de spéculation, la marge d’incertitude peut donc être énorme… Cette spéculation peut même tout simplement être fausse de A à Z… Et en aucun cas elle ne peut être utilisée dans une étude scientifique pour donner un quelconque crédit à l’hypothèse d’une causalité (ou l’absence de causalité) entre le QI et l’originalité/créativité.

Ce qui me surprend, c’est que l’étude menée par les psychologues s’appuie sur ladite spéculation pour livrer un résultat qui peut être faux lui aussi.

Voici un diagramme (celui que l’on voit dans l’article de Science et Avenir) :

QI-genius

On y voit le score d’originalité en fonction du QI. Les psychologues auraient trouvé une corrélation qui suggère que l’originalité n’est pas liée aux plus hauts QI au-delà de 120, alors que moi-même je n’observe aucune corrélation nulle part. Je ne suis donc absolument pas convaincu.

En effet, lorsque des points sont dans un diagramme, l’on devrait observer une tendance pour conclure à une corrélation : une droite, une gaussienne, une parabole, une loi exponentielle, etc… Mais là on n’observe qu’un nuage difforme de points, sans tendance réelle, et rien de significatif.

  • Pour illustrer un exemple concret et récent : ma recherche sur la durée de vie d’une ampoule électrique non défectueuse qui a une probabilité de 1/42 de griller au cours des prochaines 24 heures. Dans cet exemple concret, j’avais employé une simulation informatique dont les résultats montraient une tendance nette : sur le site http://www.wolframalpha.com, j’ai introduit mes résultats sous forme de points à tracer dans un graphe, et voila ce que ça a donné. Voir ici : http://www.wolframalpha.com/input/?i=exponential+fit+{1%3B0.024}%2C{10%3B0.0193}%2C{20%3B0.0149}%2C{30%3B0.0119}%2C{40%3B0.0093}%2C{100%3B0.0022}%2C{200%3B0.00018}

exponential-law

Mes résultats avaient conduit vers la conclusion que le grillage d’une ampoule électrique suit une loi exponentielle de la forme y = 0,024×e^(-0,024×x) où la constante lambda est 0,024. Voila un exemple très significatif par une preuve empirique.

Mais en ce qui concerne les psychologues et le nuage de points dans le diagramme exprimant l’originalité en fonction du QI, on ne voit pas de loi mathématique révélant clairement une causalité… Je suis dubitatif.

Dans un nuage de points, on peut trouver tous les alignements de points que l’on veut, mais ce seront généralement des alignements dus au hasard. Arguments ici : https://jpcmanson.wordpress.com/2014/07/11/topometrie-alignement-de-sites-statistiques-et-probabilites/

Il existe une différence entre découvrir soudain quelque chose à laquelle on ne s’y attendait pas et décider qu’il existe nécessairement une causalité (préconçue) en dépit des faits qui ne révèlent rien…

A travers la politique du « publish or perish », le monde de la recherche risque évidemment de tirer des conclusions échevelées en annonçant des corrélations là où il n’y en a pas forcément… De toute façon, la psychologie n’est pas une science exacte…

Ce n’est pas parce que des études sont publiées que cela signifie qu’elles sont la Vérité. Il faut toujours avoir un regard critique sur les études scientifiques de recherche, même quand elles paraissent sérieuses. Il faut toujours rester prudent. L’erreur est humaine. Ayant exercé autrefois dans le commerce, je déclare que lors de chaque livraison de marchandises sur des palettes, j’ai fréquemment observé qu’il manquait environ 1% des produits (je contrôlais moi-même les entrées), ce qui prouve dans cet exemple que l’on n’est jamais sûr de rien et qu’il faut toujours vérifier. Dans le monde de la recherche scientifique, c’est pareil, il faut évaluer la solidité des théories plutôt que leur faire confiance aveuglément.

 

Humour :

  • Quand j’écoute un CD de Mozart à l’envers, on entend la voix angélique des extraterrestres qui récitent une doctrine New Age, je vais donc publier en urgence mon étude dans les magazines Voici et Gala.

iconlol

© 2014 John Philip C. Manson

 

La toxicité prénatale des phtalates et ses effets sur le QI

Je prends connaissance d’une étude selon laquelle l’exposition in utero à des niveaux élevés de phtalates (substances chimiques) a un effet nocif sur le quotient intellectuel (lequel serait moindre à l’âge de 7 ans par rapport aux enfants du même âge qui ne sont pas exposés aux phtalates).

Il est indéniable qu’il existe des produits chimiques nocifs qui soient néfastes au système nerveux central. Ce n’est pas cela qui est critiqué ici. On sait que les phtalates sont des perturbateurs endocriniens, et on les suspecte d’être cancérigènes.

L’objet de la critique ici, c’est l’emploi du QI comme moyen de mesure et de comparaison. Des biopsies permettant de déceler des lésions cérébrales ou des perturbations neurochimiques du cerveau sont des exemples qui conduisent à une étude aux résultats fiables. Mais le QI, lui, n’a de rôle que celui d’indicateur, sa fiabilité objective est plutôt relative.

Chez un seul individu qui passe plusieurs tests de QI le même jour, les résultats de chaque test de QI sont variables assez sensiblement d’un test de QI à l’autre. Cela fait qu’il est peu crédible qu’une étude soit fiable si elle prétend à mesurer des variations du QI parce que celui-ci est lui-même fortement variable d’un test à l’autre.

Si l’on ne réalise qu’un seul test de QI, l’on aura déterminé le QI de la personne. Mais en science, en toute rigueur, l’on se base surtout sur la reproduction des tests afin d’établir une grandeur moyenne que l’on associe à une marge d’incertitude.

Par exemple, pour 9 tests de QI (du même type de test comme structure) effectués par un seul individu le même jour, on peut constater une dispersion non négligeable autour de la valeur moyenne du QI de l’individu. Article à lire :  https://jpcmanson.wordpress.com/2012/05/24/experience-statistique-sur-9-tests-de-qi/

Ayant expérimenté sur moi-même, mon QI moyen est de 126, mais ce nombre est affecté d’une incertitude de plus ou moins 11 points de QI. Ce détail important ne doit pas être négligé.

Qu’est-ce qu’une expérience scientifique dans laquelle la comparaison est un critère essentiel ? Un résultat est probant, positif, quand la grandeur observée est externe à la marge d’incertitude. Par exemple, pour faire une métaphore compréhensible : en physique acoustique, s’il existe un bruit de fond qui oscille autour d’une moyenne de 30 décibels avec une incertitude de plus ou moins 3 décibels, alors on peut dire qu’on a quelque chose de probant s’il l’on détecte un bruit de plus de 33 décibels : et en particulier, a contrario, on n’a rien de probant si on détecte un bruit compris dans l’intervalle d’incertitude (comme une hallucination auditive, quand un ingénieur du son a cru entendre la voix outre-tombe de Frank Sinatra). On peut ainsi avoir un biais d’interprétation d’un résultat quand le phénomène perçu reste dans la marge d’incertitude du bruit de fond (c’est-à-dire croire mettre en évidence un phénomène qui n’en est pas finalement un…). Par exemple, les parapsychologues crédules peuvent croire percevoir des fantômes dans une maison hantée, alors que l’impression de sentir une « présence » est souvent due à l’émission d’infrasons lorsque le vent circule dans des canalisations. Ce que je veux dire, c’est que l’on peut imaginer les théories les plus loufoques à partir de l’oubli manifeste de ce paramètre important qu’est la marge d’incertitude ; tout comme le déni du hasard notamment dans l’étude biaisée de l’astrologie, alors que le hasard comme moyen de comparaison permet de déceler quelque chose de significatif si ce quelque chose se distingue clairement des résultats dûs au seul hasard (il n’y a pas de phénomène découvert si les résultats se confondent avec ceux du hasard).

Pour revenir au concept de QI, qu’avons-nous concrètement d’après ce que l’étude affirme ?

Je cite l’article du Figaro :

  • « Pour cette étude, les auteurs ont suivi 328 New-Yorkaises enceintes aux revenus modestes, et l’évolution de leurs enfants. Ils ont mesuré dans l’urine des futures mères, au troisième trimestre de la grossesse, les niveaux de cinq types de phtalates. Le QI de l’enfant a par la suite été testé quand ce dernier a atteint l’âge de 7 ans. Résultat : ceux qui avaient été exposés in utero aux concentrations les plus élevées de phtalates DBP et DiBP avaient un QI de 6,6 à 7,6 points plus bas que ceux qui avaient été en contact avec des niveaux plus faibles. »

Or, il y a un problème : chez un même individu qui se soumet à plusieurs tests de QI le même jour, les résultats des différents tests sont sensiblement variables entre eux, avec plus ou moins 11 points de QI d’incertitude.

Et l’étude sur les phtalates nous révèle une différence de 6 à 8 points de QI (si on arrondit aux valeurs entières). L’étude présente donc une différence qui reste comprise dans la marge d’incertitude due aux tests de QI eux-mêmes, mais non selon une valeur significativement distincte de cette marge d’incertitude.

Ma critique ne nie pas le rôle toxique réel des phtalates, je veux juste souligner que le concept de QI peut conduire à des biais expérimentaux.

Les tests de QI ne sont qu’un indicateur, une approximation (il existe des faux-positifs). S’en servir comme moyen de mesure pour effectuer des comparaisons est donc inadapté. Dans une maladie comme la maladie d’Alzheimer ou la sclérose en plaques, par exemple, on se base sur des autopsies afin de déceler des lésions cérébrales et des modifications neurochimiques (prélèvements de tissus, observations histologiques, analyses biochimiques des protéines…), et cette méthode est nettement plus fiable que le concept plutôt abscons du QI. Mais le choix du QI comme moyen de comparaison vient du fait que c’est plus simple (on ne va pas faire des biopsies ni des autopsies…) mais ce choix ne rend pas le résultat aussi fiable…

On ne peut pas quantifier de façon fiable l’intelligence humaine. Lorsque le QI intervient dans des études scientifiques, on peut considérer que celles-ci sont discutables (en fait, toutes les « découvertes » scientifiques sont épistémologiquement réfutables).

On a très souvent tort de considérer des résultats d’études comme des vérités mises en plein jour. Le critère essentiel qui définit la science, c’est la réfutabilité, c’est-à-dire que tout résultat est un édifice dont on a le devoir d’évaluer sa solidité. En particulier, la vulgarisation scientifique doit inviter et inciter à porter un regard critique objectif et argumenté sur les découvertes scientifiques plutôt que d’accueillir bêtement ces découvertes scientifiques comme des vérités incontestables. C’est sur ce détail que j’insiste.

 

© 2014 John Philip C. Manson

Statistiques : notion de QI, p-value et valeur significative

Cela fait du bien de se remettre dans le bain des mathématiques. On a tendance à oublier un peu quelques notions quand on n’exerce plus de maths (ou certaines spécialités de maths) depuis un moment.

J’ai longtemps critiqué le concept de QI, et aujourd’hui je n’en pense pas moins.

Mais dans le présent article, outre le concept évasif d’intelligence, je vais aborder un détail pourtant essentiel quand on parle de statistiques.

En effet, si l’on entend souvent parler des tests de QI, de la mesure du QI, il semble que l’on entende jamais parler de résultat significatif quand on parle d’un QI.

Comme nous le savons tous, le QI moyen d’une population est calibré (ajusté) à 100. Et quand un QI est supérieur à 100, on parle de surefficience intellectuelle, voire de surdouance. Alors je vais parler de signifiance, afin de calculer à partir de quel QI (selon un résultat de test de QI) est un résultat significatif.

Un paramètre, nommé p-value, entre dans son rôle : quand il est de valeur inférieure à 0,05, ce qui est une valeur souvent utilisée, on dit que le résultat est significatif. Mais une autre valeur (0,01), plus contraignante, est parfois utilisée par les scientifiques exigeants.

  • Dans le site http://www.wolframalpha.com on tape ces paramètres : normal distribution, mean=100, sd=15, p-value=0.05.
  • En français, cela veut dire : distribution normale de Gauss, moyenne = 100, écart-type = 15, p-value = 0,05.

Pour une p-value inférieure à 0,05 : il faut un QI supérieur à 124,7 pour que le QI mesuré représente quelque chose de significatif (afin de déclarer qu’un individu à « quelque chose en plus » par rapport à la moyenne).

Pour une p-value inférieure à 0,01 : il faut un QI supérieur à 134,9 pour que le QI mesuré représente quelque chose de significatif.

Pour les QI inférieurs au seuil : non statistiquement significatif.

Mais comme je l’ai montré dans un ancien article : le QI est variable avec plusieurs test, un homme ayant un QI moyen de 126 peut avoir des tests dont le QI mesuré oscille entre 103 et 143. Il existe ainsi une part d’incertitude autour de la moyenne des tests. Le QI est alors de 125,67 ± 11,16. Ce qui donne aussi une incertitude à la réponse à la question suivante : le résultat est-il significatif ou pas ? Le résultat, s’il était rigoureusement précis, soit 126, aurait été supérieur à la valeur critique de 124,7. Mais comme il existe un écart-type non nul, la signifiance d’un résultat implique la probabilité pour qu’un résultat soit significatif : 53,46% pour qu’il le soit, avec une p-value de 0,05, dans l’exemple évoqué. Mais 20,41% de probabilité avec une p-value de 0,01. Et ça n’apprend rien de plus. Pour savoir si le QI a une valeur significative, il faudra faire d’assez nombreux tests… Après tout, le QI n’est qu’un accessoire. Pour que la p-value ait un sens, il faudrait que le concept de QI ait un sens lui aussi, or la mesure de l’intelligence est quelque chose de flou. On ne sait pas vraiment ce que l’on mesure. Des tests basés sur l’efficacité des médicaments expérimentaux par les labos pharmaceutiques (tests d’une molécule active et comparaison avec l’effet placebo), voila quelque chose de plus concret, qui a plus de sens (quand il n’y a pas de fraude scientifique, évidemment).

 

Moi intelligent ou bête ? Ni l’un ni l’autre. Peu importe à partir du moment que je peux encore aller aux WC, j’avais peur que ça cicatrise…

iconlol

© 2014 John Philip C. Manson

 

QI, population et effet Flynn

Il y a quelque chose qui me chiffonne…

Voici le paragraphe qui déclenche mon scepticisme.

flynn

 

Le QI de la population augmenterait-il de 3 points tous les 10 ans ?

Il existe un contre-sens. En effet, la construction des tests de QI est empirique : aucune théorie complète ne la sous-tend. La moyenne du QI standard est fixée à 100. Cette moyenne est invariable puisque la moyenne des QI individuels reste égale à 100 par calibrage des tests de QI. Parler de variation du QI de la population n’a donc aucun sens vis à vis de la définition du concept de QI… L’étalonnage fixe par construction la moyenne de 100, l’écart type et la distribution a priori associée à ces contraintes dans la méthode bayésienne (c’est-à-dire la seule n’introduisant pas d’information ajoutée) se trouve être la courbe de Gauss. C’est donc sur elle qu’on étalonne le test. Tous les tests fixent la moyenne à 100. L’écart-type est le plus souvent fixé à 15 (on parle alors de QI Standard), parfois à 16 ou même à 24 (Cattell).

On évalue le QI d’une personne par rapport à une moyenne. Mais parler de variation QI de la population contredit la notion même de la moyenne.

Non seulement l’effet Flynn contredit la définition du QI qui se base sur une moyenne toujours fixée à 100, mais non seulement le QI varie d’une personne à l’autre mais le QI d’un seul individu varie d’un test à l’autre. J’ai moi-même démontré que 9 tests de QI présentent des résultats discordants, le QI varie entre 103 et 143 pour mon cas sur ces 9 tests, et la moyenne de mon QI sur ces 9 tests est de 126 avec une incertitude de plus ou moins 11 points. Un QI individuel n’est donc pas exact selon un nombre précis, il présente lui-même une marge d’incertitude. https://jpcmanson.wordpress.com/2012/05/24/experience-statistique-sur-9-tests-de-qi/   L’effet Flynn prend-il en compte cette marge d’incertitude pour les QI individuels ?

Pour reprendre la question suivante : «Le QI de la population augmenterait-il de 3 points tous les 10 ans ? », je dis que cela n’est pas crédible. Les hommes et les femmes qui nous ont précédés n’étaient pas idiots, surtout des personnages remarquables comme Ératosthène, Hipparque, Thalès et d’autres qui étaient vraisemblablement plus intelligents que mes contemporains endoctrinés par les pseudo-sciences et les sectes…

Certains penseront sans doute que j’exagère. J’ai de bonnes raisons de penser que le niveau a baissé décennie après décennie. Pour compléter le présent article, je vous propose une expérience, et vous obtiendrez peut-être les mêmes résultats. Est-ce qu’autrefois, il y a environ un siècle, les jeunes écoliers étaient moins intelligents que ceux de maintenant ? Pour vérifier un truc, je propose un petit exercice qui a été utilisé lors du certificat d’études primaires de l’année 1920 (destiné à des candidats âgés d’environ 12 à 14 ans). Voici l’énoncé, il est assez court et simple : «On fait un mélange de 84 L de vin avec 16 L d’eau. Que faut-il ajouter de vin pour que 75 L du nouveau mélange ne contienne que 4 L d’eau ?». Notre expérience avec cet exercice consiste à proposer à des jeunes du même âge que ceux qui passèrent l’examen à résoudre cet exercice. On peut même proposer l’exercice à des jeunes plus âgés (des lycéens de Terminale S, pourquoi pas ?), voire même des chefs d’entreprise aussi. La correction des copies vous révélera des surprises…

«Euh, c’est cela ouiii, c’est un test, le test IKUL…»

iconlol

Alors, le QI de la population augmenterait-il avec le temps ? J’en doute… Autrefois, les fautes d’orthographe étaient moins fréquentes, et les jeunes gens savaient compter et surtout réfléchir. C’est une observation. Avec la polémique concernant l’épreuve de mathématiques du Bac S de 2014, qui m’a complètement sidéré, d’ailleurs, j’ai la preuve que le sujet de maths n’était pas insoluble, alors que j’étais un lycéen moyen (filière F6) j’ai pu trouver les solutions : https://jpcmanson.wordpress.com/2014/06/20/la-session-2014-de-lepreuve-de-maths-du-bac-un-carnage/  Ce n’est pas l’intelligence qui manque à la plupart des contemporains, mais le courage et la motivation… La question que je me pose : est-ce que les jeunes sont suffisamment évalués pour remédier efficacement à leurs difficultés ? Non, apparemment. Mais pourquoi ? Puis je reste dans l’incompréhension devant ce paradoxe : des lycéens échouent aux maths du Bac S parce qu’ils n’ont pas le niveau, et pourtant le score de réussite au Bac cette année atteint un nouveau record, avec 87,9% de réussite…

Autrefois, c’était les meilleurs élèves qui passaient leur certif d’études primaires, ainsi ils étaient motivés et avaient un bon niveau par rapport à la moyenne. En ce qui concerne le Bac, son accès s’est démocratisé : entre 1962 et 1974, le nombre de bacheliers a été multiplié par 2,3. Et à partir de 1985, ça s’est accéléré : +5% par an.

accessBAC

successBAC

Pourquoi le taux de réussite au Bac a t-il gonflé à partir de 1984 ? Et pourquoi était-il stable pendant les années 1970 et jusqu’en 1984 ? Est-ce que les efforts des élèves ont progressé, ou alors leur a t-on facilité leur réussite ? Voila un questionnement plus concret et plus direct que l’effet Flynn.

En 1995, une évaluation entre des copies d’élèves du certificat d’études de 1925 et des élèves de même niveau scolaire de 1995 à qui on a fait passer les mêmes épreuves, montre que les élèves de 1995 sont globalement moins performants en orthographe et en calcul. Il faudrait que je retrouve cette évaluation pour en examiner les détails. Quelques minutes plus tard, j’ai réussi à mettre la main sur cette évaluation, la voici : http://web.archive.org/web/20090214012945/http://membres.lycos.fr/reconstrlecole/Lois/certif2095.html  C’est intéressant. Je cite : «Les élèves d’aujourd’hui (1995) ont commis, en moyenne, sur les dictées proposées, environ 2,5 fois plus de fautes que ceux des années vingt […]. La baisse est plus prononcée pour les garçons que pour les filles. Depuis un siècle, les compétences orthographiques des élèves ont donc d’abord crû puis décru, le niveau moyen d’aujourd’hui étant inférieur à celui des années vingt, mais supérieur à celui qui prévalait au début de la IIIe République. L’analyse de la répartition des types de fautes commises montre que les élèves d’aujourd’hui font proportionnellement deux fois moins de fautes de langue et de signes orthographiques que ceux des années vingt». Mais aussi : «Mathématiques : L’évaluation permet de distinguer la réussite au problème et les compétences calculatoires des élèves.
La comparaison sur l’ensemble des générations montre que les élèves des années vingt étaient plus nombreux à réussir complètement le problème proposé au certificat d’études de l’époque que ceux d’aujourd’hui (1995).».

J’ai trouvé ça plutôt intéressant. Mais je précise un truc : évaluer des élèves c’est pour les aider, pas pour les sanctionner. Pour certains, l’évaluation du niveau des élèves est tabou…

Que certains prétendent que l’effet Flynn signifierait une augmentation de l’intelligence, ça me fait rire. L’effet Flynn est un phénomène apparent, il ne traduit pas une réalité intrinsèque (les petits mogwaïs se transforment en vilains gremlins, par exemple). La mesurabilité de l’intelligence humaine est un fantasme occidental parfois excessivement porté aux nues…

Pour en revenir à l’effet Flynn observé : des tests d’intelligence qui donnaient des résultats moyens de 100 points dans les années 60 donnent aujourd’hui des résultats de 120. C’est normal, puisque les tests de QI ne sont pas fixes, ils sont calibrés de façon à avoir toujours une moyenne de 100.

Mais un QI individuel est-il fixe ? Non. Passez une dizaine de tests de QI : vous verrez qu’ils ne donnent pas du tout le même résultat. Dans mon cas, un test m’attribue un QI de 103, un autre m’attribue 143. Je pense qu’un QI d’une personne pourrait être défini avec une moyenne sur un certain nombre de tests indépendants. Comme le QI est déjà assez variable pour une seule personne d’un test à l’autre, est-ce que l’effet Flynn pourrait éventuellement présenter une marge d’incertitude ? Pour un QI individuel, la marge atteint environ 22 points de QI, c’est-à-dire qu’un individu ayant un QI moyen de 126, l’incertitude est de 22 points autour de cette moyenne, on aura donc un QI moyen de 126 plus ou moins 11 points. Ainsi si un QI d’une population restreinte varie de 20 points en plus de 50 ans, ne serait-ce pas lié à une marge d’incertitude ou un biais statistique ? Voila ce que j’essaie d’expliquer.

Je pense que si on s’amusait à compliquer artificiellement les tests de QI, les gens testés seront très motivés pour améliorer leur score au plus vite (parce que les gens ont un égo et une fierté). C’est parce que les gens veulent avoir un bon score qu’ils apprennent à améliorer leurs scores, d’où un recalibrage régulier de la moyenne pour les tests. L’effet Flynn s’auto-entretient : plus on complique les tests, mieux les testés veulent y réussir et réussiront. Les tests de QI sont à la mode, d’autant plus que l’égo des gens est démesuré. Si un jour les tests de QI devenaient impopulaires, ou si les gens manquent de confiance en eux, ou si les intellectuels leur paraissent ringards, les gens ne seraient plus motivés à s’améliorer eux-mêmes en multipliant les tests, et l’effet Flynn s’inverserait.

Les tests de QI ne mesurent pas l’intelligence, ces tests ne servent qu’à mesurer la capacité à réussir des tests de QI. C’est tautologique.

Puis voici un argument présentant la preuve qu’il existe une contradiction dans les publications : vous êtes plus intelligents que vos parents d’après la revue Science & vie Junior n° 279 (décembre 2012), mais cela contredit le magazine Science & Vie qui publie dans son numéro 1135 du mois d’avril 2012 un dossier sur l’intelligence humaine, laquelle serait en stagnation, voire en régression, avec en titre : l’intelligence humaine en panne ; l’article pose la question suivante : l’intelligence a cessé de progresser ; aurait-elle atteint ses limites ?

Si on fait passer des tests de QI à nos aînés et aux jeunes, qu’est-ce qui pourrait expliquer que les jeunes aient des scores plus élevés ? La vieillesse altère les performances intellectuelles. Les jeunes suivent des études, tandis que les seniors ont commencé à travailler assez jeunes dès l’âge de 14 ans. Voila des arguments qui démentent l’idée que les jeunes seraient plus intelligents que les anciens.

Il est malsain de tenter de classer les êtres humains selon leurs différences entre eux, sous peine de créer et entretenir des préjugés et des idées reçues.

Le concept de QI est seulement un indicateur, il a ses limites, il n’est pas un outil à finalité scientifique dans le sens rigoureux du terme. Déjà que personne n’a donné une satisfaisante définition objective et complète de ce qu’on appelle l’intelligence… L’intelligence est-elle le contraire de la connerie ?… Ou vice versa… Ou les deux… Enfin, je ne sais plus trop…

iconlol

scientihumour

© 2014 John Philip C. Manson

 

QI et probabilités

À la base, le QI est un concept statistique qui sert à dépister les enfants en âge scolaire qui sont en retard scolaire par rapport à la moyenne. C’est-à-dire que pour un individu quelconque, l’on définit un âge mental de développement par rapport à l’âge physique. Bien qu’initialement intéressant en tant qu’outil psychométrique, le QI est un concept qui a dérivé ensuite dans la recherche de «petits génies», et qui a surtout été transposé pour l’usage à des personnes adultes où le concept de QI perd son sens. C’est-à-dire qu’il est peu crédible qu’un quinquagénaire par exemple soit encore en développement cérébral au même degré qu’un enfant et donc soit équivalent à un enfant en pleine croissance et en plein éveil.

 

La question à se poser est la suivante : le QI d’un humain est-il sans limite ou en a t-il une ? Tout est affaire de nombre de cas probables sur l’ensemble de la population humaine.

La loi normale dans le concept du QI se base sur un QI moyen de 100, avec un écart-type de 15.

Par exemple, il y aurait 2,3% des individus qui ont un QI supérieur ou égal à 130.

Considérons ensuite l’hypothèse d’un cas humain unique, le «génie» vivant ultime, qui existerait parmi 7 milliards d’humains. Comme nous connaissons par définition la probabilité d’un tel cas (1 individu sur 7 milliards), quel peut bien être son QI ?

L’intégrale de la fonction normale de Gauss dans l’intervalle [x; infini] où x est la grandeur du QI à évaluer devra donc être égale à 1 sur 7 milliards. La valeur x correspondante, en l’arrondissant à l’entier le plus proche, vaut 195.

Ainsi, un être humain contemporain et unique parmi la population aura un QI maximum de 195. Un QI supérieur à 195 implique une probabilité inférieure à 1 cas sur 7 milliards. Le QI maximum vaut 200 si l’on considère qu’il existe un humain unique sur les 75 milliards d’humains qui nous ont précédé et qui n’existent plus. C’est-à-dire un cas unique tous les 150 000 à 200 000 ans environ…

Par conséquent, il est logique de considérer qu’il est peu probable de rencontrer un individu dont le QI est supérieur à 200. Il est même quantitativement bien plus probable de gagner le gros pactole à des jeux de hasard, comme le Loto ou Euromillions que de rencontrer un… un extraterrestre… dont le QI est de 200. Sauf peut-être si on arrive à le recruter sur Internet (à condition que l’individu existe !).

iconlol

Un QI de 200 correspond à quoi ? Cela équivaut à un enfant âgé de 10 ans et qui a un diplôme de Bac +2 (âge mental de 20 ans). Cela équivaut aussi à un ado de 13 ans qui a obtenu un doctorat (âge mental de 26 ans).

Mais le QI des personnes devenus adultes ne signifient plus grand chose : les tests de QI pour adultes ça équivaut plutôt à jouer au Sudoku, un simple sport cérébral pour le fun et non une évaluation sérieuse. De plus, les tests de QI sont centrés sur la logique, la mémoire, quelques connaissances culturelles et l’aptitude visuo-spatiale, mais pas la créativité artistique (les artistes ne sont pas débiles mais les tests de QI s’en foutent) ni l’aptitude à l’esprit critique (un mec très instruit mais néanmoins crédule n’est pas vraiment intelligent mais les tests de QI s’en foutent…), ni même le comportement social. Bref, le concept de QI, non seulement inadapté quand il est appliqué aux adultes, ne considère pas la nature humaine dans la globalité de ses facultés.

Les tests de QI ? Ils mesurent l’égo. Tout est vanité…

iconlol

© 2014 John Philip C. Manson

 

Le QI d’une américaine de 3 ans ?

  • 28 février 2014 : Ayant eu récemment une pause forcée suite à des états grippaux qui ont interrompu pour quelques jours mon projet professionnel actuel, mon blog dispose d’un court sursis avant son arrêt réellement définitif. Cependant, j’hésite à arrêter complètement mon blog ; je pourrai éventuellement poster de temps en temps quelques nouveaux articles, à un rythme faible (un article par mois ou tous les 3 mois), en fonction de ma disponibilité. Je souligne toutefois que mon projet professionnel reste et restera prioritaire. Dès fin mars 2014 et pour les mois suivants, je serai complètement absent de ce blog, c’est certain. Après, on verra si j’aurai un tout petit peu de temps à y consacrer…
  • J’aurai ici juste le temps de commenter brièvement ce qu’on pourrait appeler un « phénomène de foire », qu’il faudrait dénoncer. Il faudrait démystifier le fantasme de la surdouance et en critiquer la médiatisation.
  1. Définir une personne sur la base de son QI est simpliste et réducteur. L’intellect et la personnalité des personnes comportent des nuances, des  subtilités qu’aucun psy ne pourra connaître en totalité. Il n’existe pas d’intelligence mais des intelligences : http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_intelligences_multiples  L’intelligence n’est donc pas uniquement construite sur le seul raisonnement logico-mathématique. En effet, que dire de l’intelligence des artistes ? Léonard de Vinci et Michel-Ange étaient des artistes suprêmes, ils étaient très loin d’être des idiots. Les tests de QI ne mesurent absolument pas la créativité ni l’habilité, ni même l’aptitude à l’esprit critique !
  2. Un QI de 160 équivalent à celui d’Albert Einstein ? C’est un anachronisme. Le fameux physicien n’a jamais passé de tests de QI de son vivant car les tests de QI pour adultes n’étaient pas encore inventés. De plus, enfant, Einstein ne passa jamais de tests de QI. Ainsi, Einstein ayant un QI de 160 est une affirmation qui ne provient pas de sources objectives vérifiables. Einstein était vraisemblablement intelligent mais son QI est inconnu. En outre, il est important de préciser qu’un QI de 160 pour une fillette de 3 ans signifie exactement ceci : la fillette de 3 ans a un âge mental scolaire de 3×160/100 = 4,8 ans (soit 4 ans et 10 mois environ). La fillette de 3 ans a donc presque 2 ans d’avance intellectuellement par rapport à la moyenne des autres enfants de son âge physique. On est donc très loin du fantasme selon lequel on tendrait à croire que la fillette aurait pu avoir par exemple un niveau de doctorat… Honnêtement, pendant toute ma scolarité j’ai déjà observé plusieurs cas d’élèves qui sautait une ou deux classes d’avance ; c’est peu fréquent mais cela arrive au moins une fois. Doit-on alerter les journalistes chaque fois que ce phénomène se produit ?…
  3. Quel est le but de l’article ? Faire de la publicité pour l’association Mensa ? Ou proposer une version idéale ou romantique de l’intelligence infantile ?
  4. L’apprentissage précoce des langues étrangères s’explique par l’extraordinaire plasticité du cerveau humain. Le cerveau est capable de s’adapter très tôt à de nouveaux stimuli. On apprend plus vite et mieux quand on considère l’apprentissage comme un jeu. Cela ne se limite pas aux enfants précoces ni aux surdoués. Les enfants issus de mariages mixtes sont fréquemment bilingues, qu’ils soient surdoués ou pas. Le talent apparaît avec beaucoup de pratique, le plus tôt possible. Un gamin qui a des parents qui sont profs de maths aura alors une plus forte probabilité de développer des aptitudes pour les maths, mais pourra cependant aussi faire autre chose selon ses goûts.
  5. Existe t-il une déontologie en psychologie où les tests psychométriques devraient rester discrets et confidentiels car relevant de la vie privée ? Pourquoi alerter les journalistes et faire un article ? Quel en est l’intérêt ? Le voyeurisme n’a jamais servi les intérêts des enfants. La surexposition, la surmédiatisation des enfants surdoués ou précoces est préjudiciable et déstabilisant pour les concernés.
  6. Le pire dans cette médiatisation est de présenter des informations fantaisistes : http://expresse.excite.fr/a-11-ans-elle-a-un-qi-N15914.html et http://sante.lefigaro.fr/actualite/2013/10/11/21368-surdoues-pour-vie  Il existe une faille en ce qui concerne Napoléon Bonaparte (mort en 1821), Einstein (mort en 1955), Sigmund Freud (mort en 1939), Blaise Pascal (mort en 1662), Goethe (mort en 1832) cités dans ces liens hypertextes… Pour info, les tests de QI pour adultes existent dès la fin des années 1950 aux États-Unis, et les tous premiers tests psychométriques pour les enfants datent de 1912 (voire vers 1905 pour les tests précurseurs). Il est donc flagrant que prétendre connaître le QI des personnes (célèbres ou non) ayant vécu avant le vingtième siècle (et avant la fin des fifties dans le cas des adultes) est mensonger ! Parler du QI de Steve Jobs, de Stephen Hawking ou de Bill Gates qui sont nos contemporains, c’est nettement plus crédible.
  7. La mesure du QI des adultes est connue publiquement depuis février 1955, grâce au « Wechsler Adult Intelligence Scale (WAIS) » d’après un livre publié en février 1955 par David Wechsler, psychologue américain. Albert Einstein, lui, est décédé en avril 1955. Je doute qu’Einstein ait eu le temps d’avoir passé en urgence un test de QI pour adultes au cours des 2 derniers mois de sa vie, et qu’il ait eu surtout le temps de lire le livre de David Wechsler… Quant à Bonaparte, Freud, Pascal et Goethe, leur QI est pure invention fantaisiste et arbitraire. Où est passé le devoir déontologique de vérité et d’objectivité ?

© 2014 John Philip C. Manson

Le QI vendu comme un produit sur Facebook

einstein160

Einstein n’a jamais passé de tests de QI car ils n’existaient pas encore avant sa mort sous leur forme moderne telle qu’on les connaît… En 1926, la psychologue Catherine Morris Cox a publié une étude sur les hommes et femmes, ayant vécu avant le 20e siècle, réputés être les plus intelligents. Par exemple, l’écrivain Goethe fut «évalué» avec un QI de 210, sans qu’aucune preuve ne soit avancée, cette valeur de 210 n’est même pas apte à être comparée avec d’autres éléments objectifs pour confirmer ou réfuter cette hypothèse. Pareil pour Einstein avec son présumé QI de 160. Idem pour Descartes (17e siècle), Blaise Pascal (17e siècle), Galilée (17e siècle), Nietzsche (19e siècle), Mozart (18e siècle). Leur QI a été estimé d’après les écrits et travaux qu’ils ont laissés, mais ce n’est pas fiable car il s’agit d’une évaluation subjective, fondée sur une appréciation personnelle de la psychologue. Dans des tests classiques actuels, la marge d’erreur est de l’ordre de 35%… Et au début du 20e siècle, les premières évaluations de QI servaient à dépister les écoliers en retard scolaire par rapport à la moyenne (c’était le but légitime du Dr Binet qui inventa ce procédé psychotechnique au début du 20e siècle).

Les médias ont rapidement dénaturé ce concept pour en faire un produit vendeur qui flatte les égos…

On ne peut pas réduire les gens à des chiffres, et surtout des chiffres inventés.

À travers le web, on s’aperçoit bien que les journalistes se sont emparés du thème fumeux de QI. Par exemple, sur le moteur Google, on tape ce terme de recherche : « QI supérieur à einstein ». On tombe sur presque 15000 titres racoleurs de personnes dotées d’un QI supérieur à Einstein, des personnes qui sont systématiquement des enfants… Vendre du rêve c’est classique…

Un beau jour, un œuf dur, baignant dans de l’eau en ébullition dans une casserole, s’est posé cette question : « Euh, c’est quoi un test de « cuit » ? »    😉

einstein195

Dix jours après cette publicité du QI d’Einstein sur Facebook, une nouvelle publicité est apparue. Cette fois, Einstein présente un QI (toujours fictif) de 195 au lieu de 160 (comparaison avec l’image d’en haut). La supercherie est explicite.

Ça alors (ton ironique), le QI d’Einstein a augmenté de 35 points en 10 jours, même après sa mort…

 

Le QI ne mesure pas l’intelligence mais la crédulité des internautes.

 

© 2013 John Philip C. Manson