Le théorème de Bayes expliqué en détail

Bien des lycéens se cassent la tête en essayant de comprendre le théorème de Bayes en examinant la formule faisant intervenir plusieurs probabilités combinées.

Je vais montrer qu’il est possible de schématiser tout cela en développant les branches d’un arbre des probabilités, et que cela va simplifier beaucoup la problématique.

Supposons par exemple l’exercice suivant :

  • Un laboratoire pharmaceutique veut commercialiser un nouveau test de dépistage d’une maladie rare.
  • On note ‘M’ la proportion de personnes malades dans la population. Les résultats des études attestent que :
  • -Si une personne est atteinte par la maladie, le test est positif à 99% ; je le désigne par la probabilité Pm.
  • -Si une personne n’est pas atteinte par la maladie, le test est positif à 0,1% ; je le désigne par la probabilité Ps.

Avant d’autoriser la commercialisation de ce test, l’Agence française de sécurité sanitaire des produits de santé souhaite connaitre la « valeur prédictive positive » du test, c’est- à- dire la valeur de probabilité pour que, le test étant positif, la personne choisie soit réellement atteinte par la maladie.

Voila comment je développe le problème :

Soit 1 la probabilité de la totalité des 2 groupes de personnes : ceux qui sont malades (probabilité M) et ceux qui sont sains (probabilité 1 – M). Parce que P + (1 – P) = 1.

Avec la probabilité M, le groupe des malades, on sait que le test est positif avec une probabilité de 0,99.

  • Soit 0,99×M la probabilité des vrais positifs, c’est-à-dire les malades qui sont déclarés positifs (quand le test est correct).
  • Soit (1 – 0,99)×M la probabilité des faux négatifs, c’est-à-dire les malades qui sont déclarés sains à tort.

Maintenant, avec la probabilité 1 – M, le groupe des sains, on sait que le test est positif avec une probabilité de 0,001.

  • Soit 0,001×(1 – M) la probabilité des faux positifs, c’est-à-dire quand des personnes saines sont déclarées malades à tort.
  • Soit (1 – 0,001)×(1 – M) la probabilité des vrais négatifs, c’est-à-dire les personnes saines sont déclarées saines (quand le test est correct)

 

Par conséquent, si l’on recherche la probabilité P pour qu’une personne soit vraiment malade quand le test est positif, il faut donc faire le rapport entre les vrais positifs et la somme des vrais positifs avec les faux positifs.

P = 0,99M / (0,99M + 0,001(1 – M)

donc :    P = Pm×M / ((Pm×M) + (Ps×(1 – M))) si on utilise mes définitions dans l’énoncé de l’exercice.

 

Je suis ensuite allé dans la page Wikipedia sur le théorème de Bayes : http://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_de_Bayes

65b3cbf8dbf631bffab2ab8b0c650c54

Et en vérifiant cette opération, j’ai pu constater qu’il s’agit bien de la probabilité de vrais positifs sur l’ensemble des résultats positifs (somme des faux positifs et des vrais positifs).

 

En examinant le théorème de Bayes :

301fdd0cbc895d53bffc9a7e9b203ae9

Je constate que :

  • P(A) = M
  • P(B|A) = Pm
  • P(not A) = 1 – M
  • P(B| not A) = Ps

 

Exprimé sous forme littérale :

Probabilité que des personnes soient vraiment malades quand le test est positif = (probabilité que test soit positif si patient malade × proportion de malades) / ((probabilité que test soit positif si patient malade × proportion de malades) + (probabilité que test soit positif si patient sain × proportion de patients sains))

 

 

© 2014 John Philip C. Manson

 

Publicités