Test de Turing sur Cleverbot

Voici un exemple de test de Turing sur le «robot» Cleverbot (www.cleverbot.com). Un robot peut mimer certains comportements humains basiques plutôt assez banals (salutations, formule de politesse, la pluie et le beau temps…), mais comme je l’avais raconté plusieurs mois plus tôt (article sur Evie), Evie et Cleverbot sont des «robots» vulnérables aux questions qui portent sur les mathématiques élémentaires, notamment l’arithmétique.

Comme le montre le dialogue ci-dessous, Cleverbot est souvent en difficulté pour calculer une somme, un carré et une racine carrée, des opérations pourtant évidentes pour un être humain.

User: Hi.
Cleverbot: Are you a boy?
User: No.
Cleverbot: Why ?
User: Dunno.
Cleverbot: Would you like to play a game?
User: No.
Cleverbot: Would you like to play a game now.
User: I repeat no.
Cleverbot: That makes no logical point or sense, for I am a human.
User: What is the sum of 1 and 1 ?
Cleverbot: 10.
User: Exact only in binary code.
Cleverbot: No, I don’t.
User: What is the square of 10 ?
Cleverbot: The square of 4 is 2.
User: Wrong.
Cleverbot: I’m a person.
User: What is the square of 10 ?
Cleverbot: Square root of 7.
User: Wrong, 7 is not equal to 10 power 4, please gimme an answer to this calculation : what is the square of 5 ?
Cleverbot: What question ?
User: What is the square of 5 ?
Cleverbot: 3.
User: What is the square of 5 ?
Cleverbot: There is none.
User: What is the square root of 36 ?
Cleverbot: 6.
User: What is the square root of 121 ?
Cleverbot: The square root of 18 is a perfectly good number.
Pour résumer, la somme de 1 et 1 vaut 2 en base décimale, et vaut 10 en base binaire ; j’avais ensuite demandé le carré de 10 (qui vaut 100) mais Cleverbot répondit que le carré de 4 vaut 2 (alors que c’est l’inverse : 2² = 4) ; en réitérant ma question, Cleverbot répondit : racine carrée de 7 (qui est un nombre irrationnel), mais 7 est différent de 10⁴ (le robot affirmait une égalité) ; en demandant le carré de 5 (qui vaut 25), Cleverbot répondit 3 (résultat faux) ; en revanche, à la question sur la racine carrée de 36, la réponse de Cleverbot est exacte ; puis le robot dérape de nouveau à la question suivante sur la racine carrée de 121 (qui vaut 11) mais le robot répondit une autre réponse évasive : la racine carrée de 18 est plutôt ordinaire (elle est égale à 3√2 qui est un nombre irrationnel).

Ainsi, il semble que la meilleure façon de vérifier si un interlocuteur est un robot ou un humain, c’est de lui poser de petits exercices de calculs élémentaires. Concernant les cas d’Evie et de Cleverbot, j’avoue être déçu, car c’est loin d’être à la cheville de l’ordinateur Deep Blue (http://fr.wikipedia.org/wiki/Deep_Blue). Oui, je sais, Deep Blue n’était qu’un gros calculateur qui ne causait pas beaucoup. 😉

 

 

© 2013 John Philip C. Manson

 

Publicités