Les statistiques sur Google et les autres moteurs de recherche

Quelques articles plus tôt, j’avais publié deux expériences de statistiques appliquées au moteur Google :

Aujourd’hui, au moment où j’écris ce nouvel article, je dois apporter une modification à cause de nouveaux paramètres. Mon principal contact Facebook s’est intéressé à mes deux tests statistiques mais il a souligné que je m’étais seulement concentré sur Google, et que je devais vérifier aussi sur d’autres moteurs de recherche parce que, selon lui, les résultats sont différents. J’ai pris sa remarque au sérieux.

Par exemple, une recherche sur bing.com (pour toutes les dates) montrent une majorité de liens vers des sites de science (taux de 90%). Cependant, le moteur Bing, contrairement à Google, ne permet pas de lister les résultats les plus récents (les pages d’il y a moins d’une heure)… Comme on le sait, la liste des résultats les plus récents sur le mot-clé « quantique » sur Google présente un taux alarmant de mysticisme, mais une recherche générale sur Google pour toutes les dates montre seulement 20% de sites douteux (thérapie quantique, expérience de mort imminente…). Cette observation montre une tendance actuelle vers une dénaturation de la théorie scientifique en une doctrine mystique, quand on examine les pages récentes par rapport à l’ensemble des pages plus anciennes. Mon contact Facebook a t-il pris en compte une variation des statistiques en fonction du temps ? Jusqu’à présent, je me basais seulement sur Google, c’est vrai, mais je me basais aussi sur la dernière heure de publication des pages recensées par Google, mais pas sur toutes les pages contenant le mot « quantique » pour toutes les époques.

Mon contact Facebook m’a fourni lui-même sa propre analyse statistique :

  • duckduckgo.com (sans profils, filtres, etc), résultats différents de ceux de Google : science = 67% / arts + divers : 12% / mysticisme : 21% …

De mon côté, j’effectue une recherche générale du mot « quantique » sur duckduckgo : il y a 5 sites douteux parmi 22 résultats, soit un taux de 22,7%, ce qui est proche du taux relevé par mon contact Facebook.

Les moteurs de recherche diffèrent entre eux par leur propre algorithme : duckduckgo se distingue en utilisant les informations de crowdsourcing provenant d’autres sites (comme Wikipédia) dans le but d’enrichir les résultats traditionnels et d’améliorer la pertinence.

De mon propre aveu, depuis l’an 2000, j’ai très rapidement utilisé Google comme unique moteur de recherche. Google est mon ami, ma religion. 

Mais comme je l’avais fait remarquer souvent dans mon blog, il faut recouper les informations entre elles, réunir une diversité de documents afin de débusquer des failles et des contradictions. Je vais explorer sur duckduckgo pour me donner une idée. Je n’abandonnerai pas Google pour autant.  ^^

J’ai parlé des algorithmes des moteurs de recherche. Ma question est simple : quel algorithme est le plus représentatif et le plus objectif du web ?

© 2013 John Philip C. Manson

Publicités