Coucou encore
Ça m’avait posé beaucoup de soucis en p1 et j’avais essayé d’expliquer ça à la tut rentrée, je vais essayer d’etre la plus claire possible ici
En fait, de base, on a
2 types de formules pour VPP et VPN : celles que tu viens d’ecrire et qui sont un peu degueu, ou bien celles qui se basent sur les résultats du tableau à 4 cases :
- VPP = VP/(VP+FP)
- VPN = VN/(VN+FN).Et là, le truc très important a comprendre, c’est que même si sur certaines formules ça ne se voit pas (celles que j’ai écrites au dessus), VPP et VPN sont
toujours extrinsèques et
prennent toujours en compte la valeur de la prévalence. Ça paraît relativement intuitif que la « probabilité d’etre malade/non malade sachant que... » dépense de la probabilité d’etre malade tout court, et cette proba c’est la prévalence !
Autrement dit, dans ces formules aussi, la prévalence est prise en compte,
recalculée à travers les valeurs du tableau.
Du coup, les deux formules que j’ai écrites ne sont en fait
que des approximations, pas les valeurs exactes de VPP et VPN. Et tu comprends bien qu’il faut impérativement que la population dans laquelle on a recueillli les donnes soit
représentative ! Si de base, elle a une prévalence qui n’est pas bonne, alors on recalculera cette prévalence fausse à travers le tableau, et on se basera dessus pour calculer nos VPP et VPN. Donc nos valeurs seront faussées.
Et si jamais
notre échantillon n’est pas représentatif, par exemple qu’on veut travailler sur un groupe où 100% des sujets sont malades ?
C’est là qu’entrent en jeu les formules dont tu parles toi : elles calculent la
valeur exacte (et non approchée) de VPP et VPN, et elles prennent directement en compte
la valeur chiffrée de la prévalence (qui est le « P » contenu plusieurs fois dans la formule), donc elles sont utilisables sur tous types d’échantillons,
même avec une prévalence non représentative.
Donc ces formules là servent à connaître la valeur exacte de la prévalence, et sont surtout utilisées quand l’echantillon n’est pas représentatif !
Dans les QCM, généralement :- si on te fait reconstruire le tableau à 4 cases et qu’on ne te donne aucune autre info, il faut utiliser les formules plus faciles que je t’ai écrites ci-dessus
- si on te donne directement dans l’énoncé la valeur de la prévalence et/ou qu’on te précise que l’echantillon n’a pas une prévalence représentative, il faut utiliser les formules que tu as données toi.
C’est plus clair pour toi ?
