Etude statistique sur les articles de Wikipedia

Dans la colonne de gauche de fr.wikipedia.org, on peut ouvrir un article au hasard :  https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Page_au_hasard

  • Grâce à cette fonctionnalité, j’ai réalisé une étude statistique simple en ouvrant 104 articles au hasard.

Voici le résultat :

  • 50% des articles Wikipedia sont à l’état d’ébauche.
  • 15,38% des articles sont relatifs à l’art sous toutes ses formes (dont 37,5% concerne la littérature, et dont 56,25% la musique).
  • 24,04% des articles concernent une personnalité (donc une biographie).
  • 16,35% des articles sont relatifs aux sciences (hors géographie), dont la zoologie (35,29%), la botanique (17,65%), la médecine (17,65%), la biologie (5,88%), l’astronomie (5,88%), la chimie (11,76%).
  • 13,46% des articles restent sans sources externes pour étayer leur contenu…
  • 19,23% des articles sont relatifs à la géographie (noms de villes, lieux divers, monuments…).
  • 14,42% des articles sont relatifs au sport.
  • 5,77% des articles sont relatifs à la politique.
  • 5,77% concernent l’histoire.
  • 2,88% des articles sont relatifs à l’armée ou les activités militaires (hors Histoire).
  • 1,92% des articles sont relatifs à l’informatique.
  • 0,96% des articles concernent une entreprise.
  • 0.96% relatifs aux télécommunications.
  • 2,88% concernent la linguistique.
  • 1,92% des articles concernent les faits divers ou la criminalité.
  • 1,92% concernent la religion ou la spiritualité.
* (Note : un article peut avoir plusieurs catégories, par exemple : personnalité + politique, ou personnalité + sport)

 

Bilan :

  • Environ 1 article Wikipedia sur 2 est incomplet ou lacunaire (ébauche).
  • Environ 1 article Wikipedia sur 7 a un contenu sujet à précaution car non sourcé.

 

Je vais maintenant vous demander d’être patients : je vais révéler d’autres données concernant la date de création et celle de dernière modification concernant les 104 articles de mon échantillon. Résultat ci-dessous dans quelques heures…

Voila, le traitement des données à la main est très long et fastidieux. Mieux vaut automatiser tout ça avec un programme informatique…

Une nouvelle expérience est réalisée dans un terminale de GNU/Linux :  la commande wget https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Page_au_hasard exécutée 71 fois télécharge autant de fois la page https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Page_au_hasard qui redirige vers un article Wikipedia au hasard, ensuite on exécute la commande suivante :   cat Spécial* | grep « Derni.re modification de cette page le « 

 

Résultat :

Sur 71 articles Wikipedia téléchargés le jour-même le 7 novembre 2015 :

  • 53 (donc 74,65%) ont été modifiés durant l’année 2015 (il y a donc moins d’un an).
  • 12 (donc 16,9%) ont été modifiés durant l’année 2014.
  • 5 (donc 7%) ont été modifiés durant l’année 2013.
  • 1 (donc 1,4%) a été modifiés durant l’année 2012.

 

Il semble que nous ayons affaire à une loi exponentielle, intéressant ça.

En considérant que l’année 2015 correspond à l’intervalle entre x = 0 et x = 1, alors y = 1,46521 * e^(-1,00758*x), et on constate que la fonction exponentielle décroissante a une courbe qui suit bien les points des données.

En moyenne, la dernière édition d’un article est réalisée au cours de 2015 (donc moins d’un an plus tôt).

Je vais accroître la taille de l’échantillon avec de nouveaux articles Wikipedia, afin de déterminer l’équation de la loi exponentielle.

Avec un nouvel échantillon composé de 200 articles :

  • 99 articles sur 200 sont des ébauches (49,5%), ce qui est cohérent avec le tout premier test statistique relaté ici.

Concernant l’année au cours de laquelle a eu lieu la dernière modification d’article :

  • 143 articles (71,5%) ont été modifiés au cours de 2015.
  • 28 articles (14%) en 2014.
  • 27 articles (13,5%) en 2013.
  • 2 articles (1%) en 2012.
  • 0 (0%) en 2011.

On obtient y=0,709244 * e^(-1,34638*x)

En moyenne, les articles ont été modifiés la dernière fois en 2013 (environ 2 ans plus tôt).

Mais l’équation la plus crédible est y = 1,46521 * e^(-1,00758*x) qui indique que la dernière édition d’un article date de moins d’un an en moyenne.

 

Pour finir, en analysant 20 articles sur les 104 articles du premier échantillon, voici le résultat en approximation :

  • L’âge moyen d’un article Wikipedia (à partir du jour de sa création) est de 5,4 ans plus ou moins 3,32 ans.
  • Le temps écoulé après la dernière modification d’un article Wikipedia est en moyenne de 4,69 mois (plus ou moins 5,49 mois).

 

John Philip C. Manson

 

Faire des statistiques avec les articles de Wikipedia

Peut-on réaliser des statistiques au moyen de Wikipedia ? A priori, oui.

Sur Google, on peut rechercher certains mots-clés contenus dans les articles du site fr.wikipedia.org. Et faire des comparaisons en ajoutant des mots-clés.

Par exemple, avec cette requête sur Google : -inurl:Discussion -inurl:Catégorie -intitle:Discussion -intitle:Catégorie site:fr.wikipedia.org « né|née le » intitle:(-« Catégorie »|-« Discussion »|-« Aide »|-« Projet »|- » né le »|-« Liste ») inurl:(-« Catégorie »|-« Discussion »|-« Aide »|-« Projet »|-« Liste ») on  constate qu’il y aurait 273 000 personnes répertoriées sur Wikipedia (personnes ayant une notoriété publique : acteurs, musiciens, chanteurs, politiciens, activistes, etc…).

Par exemple, on peut dénombrer combien il y a de personnes (ainsi que leur pourcentage par rapport à leur totalité) qui sont impliquées dans la mouvance New Age : « new age » -inurl:Discussion -inurl:Catégorie -intitle:Discussion -intitle:Catégorie site:fr.wikipedia.org « né|née le » intitle:(-« Catégorie »|-« Discussion »|-« Aide »|-« Projet »|- » né le »|-« Liste ») inurl:(-« Catégorie »|-« Discussion »|-« Aide »|-« Projet »|-« Liste »)

En apparence, il y aurait 275 personnes parmi 273 000 personnalités notoires (soit 0,1%) qui s’adonneraient au New Age.

Et si l’on exclut les musiciens et les compositeurs, cela se réduit à 251 personnes newagers (~0,09%).

C’est curieux ça… Il y aurait proportionnellement peu de newagers, et pourtant on entend souvent parler de New Age à travers le web, les médias en font régulièrement la propagande jusqu’à l’overdose…

L’on peut aussi tenter de déterminer le pourcentage de personnes homosexuelles : homosexuel|homosexualité| »coming out »|lgbt -inurl:Discussion -inurl:Catégorie -intitle:Discussion -intitle:Catégorie site:fr.wikipedia.org « né|née le » intitle:(-« Catégorie »|-« Discussion »|-« Aide »|-« Projet »|- » né le »|-« Liste ») inurl:(-« Catégorie »|-« Discussion »|-« Aide »|-« Projet »|-« Liste »)

soit environ 4790 sur 273 000, soit 1,7%. Ce serait à peu près le même taux général que dans la population, mais ce taux n’est pas connu avec exactitude.

J’ai également trouvé 1470 articles faisant référence aux féministes. Parmi les féministes j’ai relevé 159 articles faisant à la fois référence aux féministes et aux homosexuelles, soit 10,8% environ.

Ensuite, parmi les 273 000 personnes archivées dans Wikipedia, on relève environ 6560 cas où les personnes ont eu un cancer, ou ont un cancer ou sont mortes d’un cancer, soit 2,4%. Cela semble largement sous-représenté par rapport à la réalité (environ 1 quart à 1 tiers des gens ont eu ou ont ou auront un cancer).

Ensuite, parmi les 273 000 personnes dans Wikipedia, on relève environ de 994 à 1060 cas de personnes notoires séropositives mais néanmoins toujours en vie, soit environ 0,37%. Tandis qu’en France, l’on sait qu’il existe 0,23% de personnes séropositives. Les taux sont assez proches.

Pour terminer ce présent article, j’ai constaté 2590 cas d’entrepreneurs parmi 273 000 personnes notoires, soit à peine 1%, ce qui est peu. En effet, en France, seuls environ 6% des gens sont (ou ont été) entrepreneurs, c’est vraiment peu.

 

Ainsi, l’on voit que Wikipedia peut contribuer à faire des statistiques, mais néanmoins les données restent approximatives, et l’on ne doit pas oublier le risque que les données disponibles ne soient pas fiables.

 

Wikipedia reste vulnérable aux canulars pseudoscientifiques

Il y a plusieurs mois, grâce à l’outil Google Alert, j’avais mis le web en surveillance en ce qui concerne la création de nouveaux articles de Wikipedia dans le domaine de la physique quantique.

Voici le terme de recherche mis en suivi sur Google Alerts :   quantique site:fr.wikipedia.org

Cette astuce permet de détecter tout nouvel article suspect (concernant plus ou moins la physique quantique), et d’intervenir en cas de nécessité.

Le 11 janvier 2015, je reçois une notification de Google Alerts :

monogramme

On peut constater que le contenu partiel de l’article Wikipedia relatif au monogramme quantique est suspect et formulé dans un charabia étrange… A mon avis, celui ayant rédigé l’article ne comprenait même pas lui non plus ce qu’il écrivait…

Et en faisant un petit tour sur l’article directement : http://fr.wikipedia.org/wiki/Monogramme_quantique

On s’aperçoit qu’un administrateur a eu la prudence de supprimer l’article douteux selon le motif duquel l’expression « monogramme quantique » est inexistante en littérature spécialisée : il s’agit d’un probable canular ou d’un plausible travail inédit non encyclopédique.

La suppression cette fois a été relativement rapide, mais ce n’est pas toujours le cas : parfois certains articles contiennent des sottises pendant 2 ou 3 ans avant qu’un contributeur daigne apporter une correction pertinente…

C’était l’occasion aujourd’hui de rappeler que Wikipedia doit inciter à l’analyse critique.

Le mot « quantique », utilisé avec pertinence dans la physique quantique, est assez populaire dans les pseudosciences où ce mot perd complètement sa pertinence. Le test de Google Alerts démontre que les sujets connexes au mot « quantique » peuvent être l’objet de dérives idéologiques qui n’ont plus grand lien avec les sciences.

beee

Humour :

Ça alors ! Quand je chie à travers les deux fentes d’Young (http://fr.wikipedia.org/wiki/Fentes_d%27Young), il se produit des interférences quantiques : je chie en plusieurs endroits distincts en même temps !

iconlol

caca1caca2

D’après les personnages de Charb

© 2015 John Philip C. Manson

Le test de Lucas-Lehmer

Jusqu’à présent, j’avais été généralement peu convaincu des textes francophones à propos des contenus sur Wikipedia, à quelques exceptions près. Très souvent, j’ai constaté que la Wikipedia anglophone est sensiblement plus détaillée que la Wikipedia francophone.

Par exemple, j’ai regardé http://fr.wikipedia.org/wiki/Test_de_primalit%C3%A9_de_Lucas-Lehmer_pour_les_nombres_de_Mersenne

Dans cette page, les explications de l’algorithme sont assez confuses. Cependant, j’ai trouvé un détail très intéressant dans l’article anglophone : http://en.wikipedia.org/wiki/Lucas%E2%80%93Lehmer_primality_test

Voici un pseudo-code :

// Determine if Mp = 2p − 1 is prime
Lucas–Lehmer(p)
    var s = 4
    var M = 2p − 1
    repeat p − 2 times:
        s = ((s × s) − 2) mod M
    if s = 0 return PRIME else return COMPOSITE

C’est concis, simple, et propre.
A partir de ce pseudo-code, on peut adapter celui-ci à tous les langages informatiques.

Voici le code Perl que j’ai conçu à partir du pseudo-code :

#!/usr/bin/perl
for ($p = 3; $p <= 100; $p++)
{
$s = 4;
$M = (2 ** $p) – 1;
$k = $p – 2;
for ($i = 1; $i <= $k; $i++)
{
$s = (($s * $s) – 2) % $M;
}
if ($s == 0)
{
print « $M = 2 ^ $p – 1 is prime \n »;
}
}

Cela fonctionne, mais rapidement à partir d’un nombre assez grand, c’est « arrondi » à une expression sous forme de puissances en base 10. Et cela fausse le reste des calculs…

Dont acte :

7 = 2 ^ 3 – 1 is prime
31 = 2 ^ 5 – 1 is prime
127 = 2 ^ 7 – 1 is prime
8191 = 2 ^ 13 – 1 is prime
131071 = 2 ^ 17 – 1 is prime
524287 = 2 ^ 19 – 1 is prime
2147483647 = 2 ^ 31 – 1 is prime
7.20575940379279e+16 = 2 ^ 56 – 1 is prime
2.88230376151712e+17 = 2 ^ 58 – 1 is prime
1.15292150460685e+18 = 2 ^ 60 – 1 is prime
4.61168601842739e+18 = 2 ^ 62 – 1 is prime

Ici, au-delà de 2 puissance 31 – 1, tout est faux.

Mais j’ai une arme secrète : j’ai transposé le code Perl en code Python, et Python ici prouve sa toute-puissance : on a enfin des nombres complets, chiffre par chiffre, sans limite pour les nombres entiers !

Voici le code source en langage Python :

#!/usr/bin/python
p=3
while (p <= 100000):
 s = 4
 M = (2 ** p) – 1
 k = p – 2
 i=1
 while (i <= k):
  s = ((s * s) – 2) % M;
  i=i+1
 if (s == 0):
  print « 2 ^ « , p,  » – 1 is prime »
 p=p+1

Attention cependant, il y a une indentation stricte à respecter dans le script en Python, il peut arriver qu’en collant le code ici l’identation ne soit pas apparente.

Voici les résultats du script Python :

2 ^  3  – 1 is prime
2 ^  5  – 1 is prime
2 ^  7  – 1 is prime
2 ^  13  – 1 is prime
2 ^  17  – 1 is prime
2 ^  19  – 1 is prime
2 ^  31  – 1 is prime
2 ^  61  – 1 is prime
2 ^  89  – 1 is prime
2 ^  107  – 1 is prime
2 ^  127  – 1 is prime
2 ^  521  – 1 is prime
2 ^  607  – 1 is prime
2 ^  1279  – 1 is prime
2 ^  2203  – 1 is prime
2 ^  2281  – 1 is prime
2 ^  3217  – 1 is prime
2 ^ 4253 – 1 is prime
2 ^ 4423 – 1 is prime

La série ci-dessus est 100% exacte.  😉

Plus le nombre à tester est grand, plus le temps de calcul est long…

Pour que ça aille beaucoup plus vite :

  • il faut un calcul informatique distribué, avec des milliers d’ordinateurs qui fonctionnent en commun
  • il faut un ordinateur quantique (le temps de calcul deviendrait alors linéaire et non plus exponentiel)

Je vais bientôt établir le temps de calcul en fonction de l’exposant premier des nombres de Mersenne pour un PC de bureau classique. L’article ici présent sera réédité à cette occasion.

 

Réédition de l’article le 30 décembre 2014 :

 

J’ai modifié le programme Python en y ajoutant le module time, afin d’obtenir un outil qui servira à l’horodatage de chaque ligne de résultat.

 

#!/usr/bin/python
import time
last = time.time()
p=3
while (p <= 100000):
 s = 4
 M = (2 ** p) – 1
 k = p – 2
 i=1
 while (i <= k):
  s = ((s * s) – 2) % M;
  i=i+1
 if (s == 0):
  now = time.time()
  chrono = now – last
  print « t = « , chrono, » s :: 2 ^ « , p,  » – 1 is prime »
 p=p+1

 

Voici le résultat, avec le temps écoulé depuis l’exécution du programme Python :

t =  0.0000138282775879  s :: 2 ^  3  – 1 is prime
t =  0.00019097328186  s :: 2 ^  5  – 1 is prime
t =  0.000243902206421  s :: 2 ^  7  – 1 is prime
t =  0.000355958938599  s :: 2 ^  13  – 1 is prime
t =  0.000600814819336  s :: 2 ^  17  – 1 is prime
t =  0.000720024108887  s :: 2 ^  19  – 1 is prime
t =  0.00141787528992  s :: 2 ^  31  – 1 is prime
t =  0.00507187843323  s :: 2 ^  61  – 1 is prime
t =  0.0113019943237  s :: 2 ^  89  – 1 is prime
t =  0.0172729492188  s :: 2 ^  107  – 1 is prime
t =  0.0260407924652  s :: 2 ^  127  – 1 is prime
t =  0.673669815063  s :: 2 ^  521  – 1 is prime
t =  1.09742283821  s :: 2 ^  607  – 1 is prime
t =  15.6437869072  s :: 2 ^  1279  – 1 is prime
t =  121.935223818  s :: 2 ^  2203  – 1 is prime
t =  138.3559618  s :: 2 ^  2281  – 1 is prime
t =  673.330420017  s :: 2 ^  3217  – 1 is prime
t =  1962.14330792  s :: 2 ^  4253  – 1 is prime
t =  2188.334692  s :: 2 ^  4423  – 1 is prime

 

  • A partir de ces données chronométriques, j’ai pu estimer que le temps de calcul nécessaire pour découvrir M48 qui est le 48e nombre premier de Mersenne est d’environ 300 années avec un PC de bureau ordinaire (AMD Athlon 64×2 dual core 4600+) si on lance le calcul au-delà de M47 tel que P est supérieur à 43112609 (en testant P jusqu’à 57885161) où M47 = 2^P – 1. Je ne peux donc pas me contenter d’un PC classique pour espérer découvrir de nouveaux nombres premiers de Mersenne encore inconnus à ce jour… Il faut donc au moins des centaines de microprocesseurs de PC pour pouvoir découvrir des nombres premiers de Mersenne dans des délais raisonnables.

 

En revanche, j’ai apporté une amélioration entre-temps : pour tout nombre premier de Mersenne (M), l’entier P est toujours un nombre premier impair (à l’exception de 2^2 – 1 = 3 où P est premier mais pair). J’ai donc ajouté un test de primalité de P.

#!/usr/bin/python
import time
last = time.time()
p=3
while (p <= 100000):
 d=2
 lim = int(p ** 0.5)
 produit = 1.000
 while (d <= lim):
  produit = produit * (p % d)
  if (d > 2):
   d=d+2
  if (d == 2):
   d=d+1
   if (produit != 0):
  s = 4
  M = (2 ** p) – 1
  k = p – 2
  i=1
  while (i <= k):
   s = ((s * s) – 2) % M;
   i=i+1
  if (s == 0):
   now = time.time()
   chrono = now – last
   print « t = « , chrono, » s :: 2 ^ « , p,  » – 1 is prime »
 p=p+2

 

Cette fois, avec la nouvelle amélioration du script Python, le calcul est nettement plus rapide.

Résultats :

t =  6.48498535156e-05  s :: 2 ^  3  – 1 is prime
t =  0.000236988067627  s :: 2 ^  5  – 1 is prime
t =  0.000296831130981  s :: 2 ^  7  – 1 is prime
t =  0.000382900238037  s :: 2 ^  13  – 1 is prime
t =  0.000496864318848  s :: 2 ^  17  – 1 is prime
t =  0.000589847564697  s :: 2 ^  19  – 1 is prime
t =  0.000875949859619  s :: 2 ^  31  – 1 is prime
t =  0.00200796127319  s :: 2 ^  61  – 1 is prime
t =  0.0035548210144  s :: 2 ^  89  – 1 is prime
t =  0.00507688522339  s :: 2 ^  107  – 1 is prime
t =  0.00654602050781  s :: 2 ^  127  – 1 is prime
t =  0.151687860489  s :: 2 ^  521  – 1 is prime
t =  0.218498945236  s :: 2 ^  607  – 1 is prime
t =  2.25717282295  s :: 2 ^  1279  – 1 is prime
t =  15.902233839  s :: 2 ^  2203  – 1 is prime
t =  18.2337968349  s :: 2 ^  2281  – 1 is prime
t =  62.6072969437  s :: 2 ^  3217  – 1 is prime
t =  181.48553586  s :: 2 ^  4253  – 1 is prime
t =  206.73643899  s :: 2 ^  4423  – 1 is prime

  • On n’a plus besoin d’attendre 300 années pour déterminer M48 en testant tous les P supérieurs à 43112609, mais seulement un peu plus de 20 ans environ. Mais 20 ans c’est toujours long comme délai. Le calcul distribué est ainsi toujours une nécessité.

 

© 2014 John Philip C. Manson

 

Nombre pi, géométrie dans le plan et expériences aléatoires

La polémique à propos de l’apparente difficulté de l’épreuve de maths pendant le Bac S 2014 a des conséquences positives. Lorsqu’on plonge dans les maths, et quand on a des idées et beaucoup d’imagination, on peut suivre certaines pistes intéressantes dans le domaine des mathématiques. En explorant la géométrie suite à la réflexion portée sur l’exercice 4 de l’épreuve de maths du Bac S, et qui a aiguisé mon inspiration, et puis en associant la géométrie avec des expériences de simulation du hasard, on peut tomber sur des trucs intéressants.

 

Premier exemple :

J’imagine un repère orthonormé 0;i;j. Soit un carré EFGH de côté 1 dont les coordonnées des côtés sont (0;0) et (0;1) et (1;0) et (1;1). Ensuite, on considère que dans l’aire du carré EFGH (aire qui vaut 1), on génère aléatoirement 3 points A et B et C dont les réels x et y (coordonnées respectives de A,B,C) appartiennent à l’intervalle [0;1].

ABC, par ses 3 points, forme un triangle quelconque ABC. La formule de Héron permet d’en calculer l’aire.

L’enjeu est de déterminer l’aire moyenne de ABC par rapport au carré EFGH. Pour cela, j’ai généré des millions de triangles pour évaluer cette aire moyenne rapportée à celle du carré.

Le rapport moyen vaut environ 0,076. Je m’attendais à découvrir un nombre réel où le nombre pi intervenait. En gros, le quotient moyen semble compris entre 1/(4×pi) et 3/(4×pi²). Je n’ai pas d’autre information là-dessus, c’est à explorer…

Souvent, le nombre pi intervient dans des phénomènes aléatoires. C’est le cas pour l’expérience de probabilité de l’aiguille de Buffon. Pareillement pour la loi normale (avec les courbes de Gauss : voir ici http://upload.wikimedia.org/math/8/f/1/8f1da4cf31d40e7b18f29c22a78c7abd.png).

 

 

Deuxième exemple :

Certains d’entre nous ont entendu dire que le rapport entre la longueur réelle d’un fleuve ou d’une rivière et la distance à vol d’oiseau entre la source et l’estuaire serait égal au nombre pi.

Cela en parle dans cette page : http://villemin.gerard.free.fr/Wwwgvmm/Geometri/PiCurios.htm

Je cite :

  • « 3,14 =rapport entre la longueur réelle d’un fleuve, et sa longueur à vol d’oiseau. Loi postulée par Einstein et constatée par Hans-Hendrick Stolum, spécialiste des sciences de la Terre. »

J’ai vérifié avec le cas de la Loire, un célèbre fleuve français. Selon les géographes, la Loire mesure 1006 km de long, lorsque l’on suit les sinuosités. Ayant moi-même localisé la position géographique de la source (dans l’Ardèche) et celle de l’estuaire (à St Nazaire), et grâce à un calcul que j’ai mis au point il y a quelques mois pour calculer la distance à vol d’oiseau (en suivant la rotondité terrestre) entre deux points de la surface du globe (grâce aux coordonnées GPS), j’ai établi que le rapport vaut 1006 / 562,56 = 1,7883, donc proche de 1,8, ce qui est franchement loin du nombre pi.

Remarque à propos de Wikipedia : l’article sur la Loire (fleuve) raconte que la longueur du fleuve est de 1006 km, mais d’autres articles dans Wikipedia (liste des fleuves français) racontent que la Loire est longue de 1012 km… Je me suis aperçu de ça sur Google, avec les mots clés : longueur Loire. Cela ne change pas grand chose dans mes présents calculs, heureusement, mais les contradictions rencontrées dans Wikipedia ne font pas de celle-ci une référence fiable… La validité d’une information ne se mesure pas à la rapidité de son accès sur le web, mais à son exactitude.

Poursuivre la vérification avec d’autres fleuves est long. J’ai donc développé un programme de simulation qui génère aléatoirement les « courbures » des méandres d’un fleuve. Si l’écoulement est isotrope, c’est-à-dire sans direction d’écoulement privilégiée, le rapport tend vers 10,36 à 10,37 (auquel cas le fleuve peut croiser ses propres méandres, ce qui ne correspond pas à ce qui se passe dans la nature). Cependant, si l’écoulement se dirige dans la direction du vecteur OP (1;1) qui passe par le point O (0;0), alors le rapport devient nettement plus faible (le fleuve dans son parcours ne fait pas intersection avec lui-même). Tout dépend des reliefs rencontrés par le fleuve dans une direction d’écoulement due aux pentes locales.

Sur l’appui des maths, je n’ai pas encore, pour le moment, des preuves que le rapport entre la longueur sinueuse d’un fleuve et de sa longueur à vol d’oiseau tendrait vers le nombre pi. L’anecdote sur Einstein qui aurait lui-même évoqué un tel rapport qui serait égal au nombre pi serait-elle une légende urbaine ?

Je n’ai actuellement aucune conclusion définitive. Néanmoins, le cas de la Loire montre concrètement que le rapport tend vers 2 plutôt que vers 3,1415927… C’est ce qu’affirme aussi ce site : http://www.pi314.net/fr/anecdotespi.php dont je cite : «Skolum (1996) vérifia que le rapport entre la longueur réelle et la longueur à vol d’oiseau (distance entre la source et l’embouchure) d’une rivière égalait en moyenne Pi . Ce rapport se retrouve davantage au Brésil ou dans la toundra sibérienne, mais cela reste à vérifier… Pour ma part, en France, je trouve que le rapport est à chaque fois plutôt proche de 2 (coïncidence, d’ailleurs ?). »   Le doute est donc légitime.

Affaire à suivre.

Élément nouveau : j’ai vérifié pour la Seine, sa longueur courbée vaut 776 à 777 km, et mon calcul indique que la distance à vol d’oiseau entre la source et l’estuaire vaut 400,26 km. La division indique que 777 / 400,26 = 1,94, ce qui est proche de 2. Mais pas du nombre pi.

© 2014 John Philip C. Manson

 

Les contradictions sont partout

Même dans une activité banale, on rencontre des contradictions.

Récemment, lors de mots croisés, je tombe sur une contradiction qui prouve l’existence d’au moins une erreur. Les mots croisés ici en question ont pour thème des personnalités du cinéma ou de la télévision. Ici, les mots croisés ont pour thème la très jolie actrice Marine Delterme.

Maintenant, ouvrons les yeux. Ce qui suit n’est pas une critique de l’actrice (je ne me le permettrai absolument pas), mais une critique de ce que les divers médias diffusent, et on s’y perd en conjectures.

MD1

Dans cette photo ci-dessus, on observe que l’actrice est née à Paris en 1970.

MD2

Dans cette deuxième photo, ci-dessus, qui est à la page suivante de la première image, on y lit que la même actrice est née dans le chef-lieu de la Haute-Garonne, c’est-à-dire à Toulouse. C’est contradictoire : la première image indique que le lieu de naissance est Paris !

Mais ce n’est pas fini. Dans la deuxième photo, on lit que Marine Delterme est née un 12 mars. Je passe sur la page Wikipedia de l’actrice : http://fr.wikipedia.org/wiki/Marine_Delterme  et on y lit qu’elle est née un 18 mars. Soit 6 jours de différence. C’est contradictoire !

Il existe même une contradiction flagrante sur Wikipedia. En haut de l’article http://fr.wikipedia.org/wiki/Marine_Delterme on lit que l’actrice est née à Paris, et en bas on lit que la catégorie mentionne sa naissance à Toulouse !

La personne qui a conçu les grilles de mots croisés dans le magazine examiné a probablement recopié les infos de l’article Wikipedia sans rien vérifier…

Qu’est ce qui est vrai ? Qu’est-ce qui est faux ?

Alors, je fais un petit tour sur le site officiel de l’actrice : http://www.marinedelterme.com

Vraiment, c’est une très belle femme. La beauté absolue.  🙂

Je clique ensuite sur sa biographie : http://www.marinedelterme.com/fr/sculptrice/7.html

Intéressant, Marine pratique la sculpture. Stupeur, je lis qu’elle naquit en 1972, et non en 1970 !

Dans cette autre page : http://www.marinedelterme.com/fr/mode/20.html on apprend qu’elle est née à Paris.

Mais le Wikipedia anglophone la fait naître à  Toulouse : http://en.wikipedia.org/wiki/Marine_Delterme

Cependant, si les Wikipedia français, anglais et allemands la font naître en 1970, le Wikipedia italien fixe son année de naissance le 12 mars 1972.

Qu’est-ce qui me trouble le plus ? Les contradictions ? Ou la beauté parfaite de cette magnifique artiste ?  😉

 

© 2014 John Philip C. Manson

 

Astuce pour mieux contribuer à Wikipedia

Même si vous n’êtes pas  spécialistes dans le domaine des sciences, vous pouvez contribuer activement aux connaissances et à la culture. Nous pouvons tous être utiles.

Wikipedia est une encyclopédie libre en ligne. Les plus habiles y rédigent du contenu pertinent, d’autres peuvent aussi contribuer en signalant des lacunes ou des incohérences, comme par exemple les articles qui ne sont pas sourcés, ou les articles qui n’ont pas un format encyclopédique.

Comment détecter des articles non sourcés ?

Voici un exemple :

  • Je choisis des articles cibles ayant une thématique scientifique.
  • Je recherche les articles exempts de sources et de références.
  • J’élimine de la liste les articles dûment sourcés et référencés et ceux qui ne sont pas des articles (portail, catégorie, pages de wikipédiens…)

La recherche est alors lancée sur Google avec ces mots-clés :

site:fr.wikipedia.org -« Notes et références » (science|physique) -intitle:(Projet|Discussion|Catégorie|Portail|Utilisateur)

La requête envoyée à Google conduit à l’examen du site Wikipedia francophone, en mettant en évidence les articles de physique ou de science et qui ne contiennent pas le paragraphe « Notes et références». Sont exclues les pages qui ne sont pas des articles.

Lorsque vous trouverez des articles qui ne contiennent aucune source, ce sera à cause des raisons suivantes : l’article est récent et donc à l’état d’ébauche, l’article est un travail inédit personnel (interprétation personnelle conçue entièrement par un internaute lambda), propagande ou désinformation, etc…

Pour contribuer à Wikipedia, avec ou sans compte de wikipédien, il suffit d’éditer le code source du début de la page (cliquez sur l’onglet « Modifier le code »), et y ajouter ce bandeau :  {{À sourcer}}

Ensuite, enregistrez la modification en cliquant sur le bouton en bas de la page d’édition.

Le bandeau suivant apparaîtra alors en début d’article :

Si vous disposez d’ouvrages ou d’articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l’article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ». (Modifier l’article)

De cette manière, même si vous n’y écrivez pas de contenu dans la page, vous attirerez bien l’attention de spécialistes qui s’intéresseront à la page.

Les internautes utilisent fréquemment Wikipedia parce que c’est un site assez vaste, et accessible rapidement. Mais la vitesse n’équivaut pas à l’exactitude. Avec prudence, il faut toujours conserver une attitude critique sur ce que l’on lit ou entend. Des documents totalement exempts d’erreurs ou de lacunes sont un mythe.

En explorant quelques articles suggérés par les résultats de la requête sur Google, je suis tombé sur un contenu laissant dubitatif : https://fr.wikipedia.org/wiki/La_Science_du_Disque-monde faisant référence à un livre dont la structure est particulière. Ce livre est à la fois un roman et une vulgarisation scientifique. C’est un amalgame qui peut causer des malentendus. Parmi les thèmes abordés dans ce livre, certains nécessitent une analyse critique approfondie :  le rapport entre Science et magie, l’avenir de l’univers et de la Grande A’Tuin, l’ascenseur spatial et l’extelligence (mieux connue sous le nom de noosphère, concept métaphysique popularisé par Pierre Teilhard de Chardin)…

La vulgarisation scientifique devrait plutôt aborder le questionnement suivant : quels sont les critères de la méthode scientifique ? Si la science au goût romancé peut paraître séduisante, plus attractive, on ne doit pas s’éloigner de ce qui définit précisément la science. Dériver vers la littérature, l’imaginaire ou la métaphysique, c’est s’éloigner des principes de la vulgarisation scientifique.

En effet, qu’est-ce qui définit une bonne vulgarisation scientifique ? Une bonne qualité de rédaction, de la rigueur scientifique, le souci de vulgarisation et de l’originalité  et aussi susciter un intérêt sans dénaturer l’information scientifique (surtout), être compréhensible à la fois par des adultes et des enfants, simplifier sans basculer dans le simplisme et le réductionnisme, mettre les faits en valeur plutôt que des opinions. La vulgarisation scientifique doit éviter de présenter des théories et des hypothèses comme des vérités immuables ou définitives, puisque les «savoirs» procèdent par élimination des hypothèses superflues et non par la construction de «vérités».

Pour parler de l’ascenseur spatial évoqué plus haut, il faut dire que ce projet n’est pas crédible : risque de rupture du câble (sur sa longueur ou ses points d’attache) à cause de la tension mécanique, problème d’induction électrique dans le câble à cause d’une différence de potentiel électrique entre les extrémités, risque de collision du câble avec des météorites ou des satellites, etc. Pour le moment, ce n’est guère réaliste.

Ensuite, l’examen du lien wiki vers A’Tuin conduit au bestiaire de personnages du roman, où la supposée vulgarisation est mêlée de mythologie, avec des dieux parodiques de l’Égypte antique… Il y a un danger à faire un amalgame entre science et mysticisme, même si on croit bien faire… On peut faire de la science et du roman, mais il faut bien préciser la démarcation nécessaire entre les critères de la science et la fiction littéraire.

Ce n’est pas parce que je suis un sceptique très remonté que cela veuille dire que je ne m’intéresse pas aux œuvres de fiction. Par exemple, j’ai vu tous les épisodes de la série «X Files» avec les agents Mulder et Scully, je n’en ai pas raté un seul. On peut apprécier le cinéma et les séries de science-fiction, mais c’est pour se distraire, mais pas pour en faire des Vérités.  😉

© 2013 John Philip C. Manson

Encore des dérives sur Wikipedia

J’utilise Wikipedia de façon très épisodique. Je n’y contribue pas souvent. Récemment j’ai corrigé le paragraphe d’un article, il était truffé de fautes d’orthographe. En même temps je me suis aperçu d’autre chose parmi les notifications, et ce sera le sujet de ce présent article.

Les contributeurs comme moi s’efforcent d’apporter de la qualité dans l’encyclopédie libre, à travers une écriture exempte de fautes, et à travers un contenu pertinent et rigoureusement objectif.

Mais voila, le relativisme postmoderniste de certains contributeurs réduit l’objectivité factuelle nécessaire à une simple opinion qui peut être rejetée comme n’importe quelle autre.

Parmi les nouveautés de Wikipedia, j’ai pris connaissance de cette page : http://blog.wikimedia.org/2013/10/21/sue-gardner-response-paid-advocacy-editing/

En effet, Wikipedia est une encyclopédie lue par des centaines de millions de personnes à travers le monde. Wikipedia est donc pour certains individus malintentionnés un outil idéal de propagande. Ainsi de nombreux éditeurs sont tentés d’écrire des conneries dans les articles de Wikipedia par intérêt, à des fins de tromperie, ou pour promouvoir des produits. Depuis longtemps, on sait que Wikipedia est à prendre avec des pincettes, car son contenu est sujet à caution. L’on soupçonne même certains contributeurs d’être payés pour écrire des foutaises afin de mystifier les lecteurs.

Lutter contre la mystification et la propagande est un bienfait. Mais…

Mais aujourd’hui, ce que j’ai pu voir sur wikipedia est inquiétant car l’effet contraire se produit aussi. Les propagandistes adeptes du paranormal, de la méditation transcendantale et du New Age mettent à profit la nouvelle directive de lutte antipropagande dans le but de supprimer les éditions réalisées par les sceptiques qui sont désignés abusivement comme étant les vecteurs de propagande. C’est-à-dire que les rôles sont inversés. Ce sont les gourous et leurs adeptes qui accusent les sceptiques et les scientifiques de propagandistes… Les partisans de l’irrationnel suppriment ainsi donc le contenu gênant (révélation de dérives sectaires, dénonciation de pseudo-sciences, etc…) publié par les sceptiques. C’est le monde à l’envers. Voila où conduit le relativisme. Rester objectif et critique est une nécessité. Nous vivons à l’ère d’internet où les informations circulent vite et en abondance, et l’apprentissage du discernement par les internautes devient très difficile.

Surveiller le contenu ajouté par les contributeurs wikipédiens était assez facile, avec la liste de suivi. Mais il devient plus difficile de surveiller le contenu édité par les sceptiques qui a été supprimé presque sans laisser de traces… Parce que si Google permet de relever des textes récemment ajoutés dans des articles, Google ne détecte pas les paragraphes qui ont été supprimés. Les charlatans ont trouvé là une faille. Cela rend donc le travail des sceptiques plus difficile.

Bref, ce que j’ai vu récemment dans un article, c’est la suppression d’une référence non négligeable dans un article sans laquelle l’article paraît plus gentil par rapport à certaines réalités qui le dénoncent… Le contributeur ayant supprimé la référence fait ouvertement partie d’une mouvance politique dont je tairai le nom.  :/

Wikipedia n’a pas à être orientée par les partis politiques, les mouvances religieuses ou sectaires, ni par des intérêts aidés par des méthodes marketing. Wikipedia ne doit suivre qu’une seule directive légitime : l’objectivité et le recul critique.

Adhérer et obéir à n’importe quel comportement motivé et dicté par le pognon ou par les croyances ou même par les émotions, dans le but d’asseoir un système d’idées saugrenues plutôt que de faire connaître des faits , c’est trahir notre conscience, c’est trahir toute confiance.

Les illusions de l’esprit ne peuvent pas se substituer aux réalités. Les faits ne trompent personne, eux, mais les idées, elles, le peuvent, et souvent.

Tout le circuit de l’info est gangrené par de nombreux manipulateurs prêts à tout. Je suis complètement déçu et consterné par tout cela…

  • Depuis 2007, en tant que blogueur, j’ai voulu présenter une façon nouvelle de faire du journalisme scientifique, non pas en relayant des théories nouvelles publiées dans la plupart des magazines scientifiques, mais en analysant les données de la presse et du web afin de montrer l’existence de failles dans la diffusion de l’information. L’analyse critique montre que souvent lesdites données sont erronées ou inexactes (le plus souvent au niveau quantitatif, via des données sous forme de nombres), et qu’il ne faut jamais les considérer comme des vérités, et encore moins comme des vérités définitives. Je cesse mon activité de blogueur vers la fin de 2013, pour des raisons professionnelles, et aussi pour consacrer plus de temps avec mes amis. Si je ne devais dire qu’un dernier mot ici, c’est que le doute est une nécessité quand on s’intéresse aux informations et plus ou moins aux sciences de près ou de loin. Et dans l’exercice du doute, qui nécessite du temps et des efforts (et l’on ne peut pas toujours s’y consacrer), il faut surtout éviter la précipitation (la vitesse augmente le risque d’erreurs de jugement) et les idées préétablies (comme les « théories » personnelles ad hoc ; mieux vaut être très neutre car seuls les faits tranchent et non pas les opinions).

  • «Le premier [précepte] est de ne recevoir jamais aucune chose pour vraie, que je ne la connusse évidemment être telle.»    (René Descartes)

© 2013 John Philip C. Manson

Euromillions et probabilité du gros gain

 

Dans l’article, je relève juste cette phrase : «Le gagnant n’avait qu’une chance sur 116 531 000 de cocher les sept bons numéros pour décrocher la cagnotte»

Hé bien, on va vérifier ça.

 

Une visite sur http://fr.wikipedia.org/wiki/Euro_Millions me donne les renseignements nécessaires : il y a 5 numéros (de 1 à 50, et non de 1 à 49) auquel on ajoute 2 étoiles numérotées de 1 à 11.

  • Calcul :      [50!/(5!(50-5)!)] × [11!/(2!(11-2)!)] = 2 118 760 × 55 = 116 531 800

Je retrouve donc la même probabilité que celle énoncée par Yahoo. On est bien d’accord.

 

© 2013 John Philip C. Manson

Scepticisme sur un catalyseur d’énergie nucléaire

Le mécanisme décrit dans l’article de Wikipedia est sujet à caution. Il n’est pas validé par la science.

Je ne critiquerai pas, ici, la fusion froide. Ce n’est pas à moi de prouver que la fusion froide n’existe pas ; c’est à ses partisans de prouver avec transparence qu’elle existe.

Cependant, il est possible de réfuter clairement certains passages quantitatifs. Voici l’image d’un paragraphe précis ci-dessus :

NiH

Pour obtenir le nickel 62 à partir du nickel 58, il faut bombarder avec des neutrons ou alors par des protons qui provoquent une émission d’un électron chargé négatif. Le nickel 62 est nucléairement stable, mais l’obtenir aura entraîné l’émission de rayons gamma…

Une énergie nucléaire de 37,36 MeV correspond à 5,9776×10⁻¹² J et cela correspond à un rayonnement gamma de longueur d’onde de 3,32×10⁻¹⁴ m.

Avec une masse de 5 g de nickel 58, ce qui correspond à 0,0862 mole comme quantité de matière, cela équivaut à une énergie nucléaire totale de 310,3 milliards de joules rayonnée en 6 mois, ce qui correspond à une puissance moyenne de 19 658,8 W (et non pas 10 000 W ou 10 kW) pour une durée de 6 mois. Donc les chiffres ne collent pas, je trouve une valeur double par rapport à celle de Wikipedia.

Ensuite, le gros problème, c’est que les rayons gamma sont très dangereux et incitent à ne pas utiliser ce type d’énergie nucléaire, si évidemment cette énergie existe… À moins que le mystérieux catalyseur marche, mais sans lien avec des rayons gamma…

Exemple : je me place à une distance de 1 mètre du catalyseur au nickel, alors quel rayonnement je subis quantitativement, d’après un compteur Geiger ?

Si la puissance rayonnée est de 10 kW, alors mon corps absorbe un flux de 796 W en rayons gamma (donc 133 mille milliards de Bq ?). Avec un corps de masse moyenne, cela fait environ 10 J/kg à chaque seconde écoulée. Donc une dose radioactive de 10 Sv/s, soit 36 000 Sv/h ou 36 milliards de µSv/h. Concrètement, 3,6 millions de rems par heure. Donc, avec un catalyseur de puissance 10 kW et émetteur de rayons gamma, alors à une distance de 1 mètre du catalyseur la mort humaine par irradiation est assurée dès la première seconde… Ensuite, le rayon d’action à l’intérieur duquel les rayons gamma présentent un taux de radioactivité supérieur à la radioactivité naturelle (0,1 µSv/h) est une distance bien trop importante (des kilomètres si les rayons gamma n’étaient pas absorbés par l’atmosphère) pour rendre exploitable un catalyseur nucléaire…

Je ne me prononce pas trop : ou le catalyseur fonctionne (mais sans rayons gamma) et Wikipedia n’est pas foutu de livrer des données correctes ; ou alors tout est faux… Je vais en parler au Dr Goulu pour avoir son avis. Je vais aussi me relire plus tard pour revérifier mes calculs.

  • «Are you telling me that you built a time machine out of a DeLorean ???» (from the movie «Back to the future»)

iconlol

© 2013 John Philip C. Manson