Détection statistique de mots thématiques dans un texte à analyser

Plusieurs mois plus tôt, j’avais évoqué la détection du vocabulaire New Age dans divers textes.

Plus l’on utilise de mots-clés dans le détecteur, plus les résultats trouvés sur le web sont restreints. Les mot-clés que j’avais utilisé sont les suivants : amour ange ascension astral Atlantide atmique bioénergétique bouddhique causal chakras changement channelling christique conscience cristaux dualité électrosensibilité énergie entité ésotérisme esprit éthérique extraterrestre fin fraternité karma lâcher-prise lémurien lumière mayas méditation mental merkaba new age nouvel âge occultisme paix paradigme paranormal parapsychologie plan quantique réincarnation Septénaire subtil universel Verseau.

 

Mais on peut se contenter de 8 mots, qui sont les plus courants chez le New Age : ascension astral changement conscience énergie fraternité méditation paix. En anglais : ascent astral change awareness energy brotherhood meditation peace.

 

Résultats des analyses lexicologiques :

  • Première observation : l’existence du New Age est manifeste pour les langues occidentales (anglais, français) ; le New Age est marginal ou inexistant dans les Balkans et l’Europe orientale (les mêmes termes en langue albanaise n’ont donné aucun résultat probant).
  • Deuxième observation : dans les documents PDF du web francophone, 47,6% des PDF explicitement New Age contiennent le mot « climatique » ; dans tous les autres formats francophones (sauf PDF), ce taux est de 43,8%. Dans tout le web anglophone, 44 à 45% des pages New Age contiennent le mot « climatique ». Plus inquiétant, si on remplace le mot « climatique » par des mots relatifs aux mythes fondateurs du nazisme (ou l’appartenance/sympathie de membres New Age envers le mysticisme nazi), on trouve quelque chose reliant l’occultisme et le fascisme… A lire : https://fr.wikipedia.org/wiki/Paul_Le_Cour et https://fr.wikipedia.org/wiki/Wotanisme et https://fr.wikipedia.org/wiki/Shambhala_%28mythe%29#Dans_la_Th.C3.A9osophie.2C_le_New_Age_et_les_croyances_modernes_occidentales où Shambhala est un mythe commun du New Age et de l’occultisme nazi…
  • Troisième observation : le contenu de mon blog (avant le 6 octobre 2015) contient 95 mots New Age (sur les 8 mots-clés utilisés pour la détection) sur un total de 54523 mots (soit 0,17%).
  • Quatrième observation : le document à l’adresse http://www.maitrereikiquebec.com/wp-content/uploads/2011/11/REIKI-MULTIDIMENTIONNEL-DES-PLANS-DE-LUMIERE.doc contient 138 mots typiques du New Age sur un total de 922 mots (soit 14,97%).
  • Cinquième observation : le document à l’adresse k.dalton.free.fr/undercover/undercover11/undercover11.doc contient 272 mots typiques du New Age sur un total de 1464 mots (soit 18,58%).
  • Sixième observation : le dictionnaire à l’adresse http://www.authsecu.com/dictionnaire/francais-divers.php contient 11 mots New Age sur un total de 46821 mots (soit 0,023%). Ce dictionnaire peut servir d’étalon de comparaison par rapport aux textes à analyser.
  • Septième observation : un test a été réalisé sur tout le contenu de fr.wikipedia.org, et le résultat est positif pour les articles « New Age » (ce qui est évident), « Expérience de mort imminente », et dans une moindre mesure, « Omraam Mikhaël Aïvanhov » (où le mot « nazi » est présent dans l’article).

 

Bilan :

  • Les textes explicitement New Age contiennent au moins 1000 fois plus les mots du New Age (parmi 8 mots-clés) que dans un dictionnaire. Les textes résolument New Age contiennent au moins 100 fois en fréquence les mots New Age relatés dans mon propre blog. Il serait donc possible de distinguer de façon fiable un texte clairement adhérant au New Age et un texte parlant de New Age dans un but neutre et seulement journalistique, sceptique ou critique.

 

John Philip C. Manson