(Si vous ne connaissez toujours pas cette référence, c'est que vous avez pas fait mon DM de l'avent et que vous ne connaissez pas LinksTheSun. Les zombies vous mangeront dans votre sommeil.)
Magnifique façon d'introduire ce problème majeur que sont les Variables.
Comme c'est un problème récurrent, et que des problèmes persistent encore je vais tenter de m'atteler à cette épineuse question. Tout d'abord je vais faire un résumé des variables, car au final, le prof retient les définitions qu'ils donnent pour définir les variables.
Une variable est une Caractéristique mesurée ou observée chez un individu
- Une Variable Quantitative : est un caractère mesuré ou dénombré.
Une Variable quantitative est discrète (discontinue) si elle ne peut prendre que des valeurs isolées, généralement entières. Valeurs issus d'un dénombrement.
Une variable quantitative est continue si elle est susceptible de prendre toute valeur dans un certain intervalle. Valeurs issues d'une mesure.
-> L'échelle de variation Par Intervalle :
Variable quantitative dont la particularité est d'avoir une valeur nulle arbitraire
La distance qui sépare deux données ou deux catégories est connue
-> Par exemple, la température mesuré grâce à l'échelle de variation par degrés Celcius
-> L'échelle de variation Relative :
L'égalité d'intervalles et de rapports peut être déterminée
Sur cette échelle, le zéro n'est pas arbitraire et signifie effectivement l'absence ou la nullité.
->Par exemple, la température mesuré grâce à l'échelle de variation par degrés Kelvin
- Une Variable Qualitative : ne peut être mesurée MAIS est susceptible de classement.
-> L'échelle de variation Nominale :
sont des données qualitatives,
collectivement exhaustives et mutuellement exclusives
L'ordre des catégories et les distances existant entre elles sont ignorés
Chaque valeur / catégorie doit être bien définie
-> Concrètement, ce sont donc des variables qui ne peuvent appartenir qu'à UNE SEULE catégorie dans l'échelle de variation.
-> L'échelle de variation Ordinale :
sont des données qualitatives
les valeurs possibles sont classées en rang ou ordonnées selon un critère connu
la distance existant entre deux catégories adjacentes n'est pas connue et peut varier d'une paire de catégorie adjacente à l'autre
-> On "mesure" un seul type de donnée qu'on ordonne
Par exemple : on "mesure" la douleur par palier, on mesure le critère douleur et on essaye de le quantifier avec une échelle
Petite subtilité :
-> la Discrétisation de variable continue : c'est découper en classes, de manière pas trop arbitraire. C'est à dire un juste milieu entre un découpage trop fin et trop grossier.
Donc variables quantitatives continues -> variables qualitatives ordinales
Jusque là, je ne me suis pas trop foulé, car ce sont les définitions du cours.
Il faut respecter les définitions données.
Lorsque vous allez chercher à définir une variable, il faut d'abord savoir si elle est quantitative ou qualitative. C'est le contexte de l'énoncé qui vous le donnera.
Exemple : On compare la qualité de vie des patients en hôpital et en clinique, d'après un questionnaire à choix multiples. Pour chaque question, on peut répondre "mauvais (donne 1 point) - pas bien (donne 2 points) - bien (donne 3 points) - excellent (donne 4 points)". Les points sont comptabilisés à la fin. On considère que la qualité de vie des patients est considéré comme mauvaise si le cumul de points est inférieur à 40, et bonne si le cumul des points est supérieur à 40.
Voici les résultats :
Maintenant, Questions :
- quelle est la nature de la variable "lieu d'hospitalisation" ?
- quelle est la nature de la variable "mauvais - pas bien - bien -excellent" ?
- quelle est la nature de la variable "1 - 2 - 3 - 4" ?
- quelle est la nature de la variable "cumul des points" ?
Réponses :
- quelle est la nature de la variable "lieu d'hospitalisation" ?
-> c'est une variable qualitative binaire. Oui on compte le nombre de personnes en hôpital et en clinique, mais la variable est bien le lieu, et pas le nombre de personnes. Attention à cette petite subtilité !
- quelle est la nature de la variable "mauvais - pas bien - bien -excellent" ?
-> c'est une variable qualitative ordinale, on mesure les différents points de la qualité de vie
- quelle est la nature de la variable "1 - 2 - 3 - 4" ?
-> c'est une variable qualitative ordinale, car c'est ici un codage numérique. Les chiffres ici ne correspondent à aucune mesure ou dénombrement. On transcrit juste des mots en chiffres (pour preuve on aurait pu dire "0-1-2-3", donc les chiffres sont complètement arbitraires)
- quelle est la nature de la variable "cumul des points" ?
-> c'est une variable qualitative ordinale binaire -> on passe de la variable "nombre de points" à "points < 40 - points > 40"
- D'autres petites subtilités :
-> l'âge : c'est une variable quantitative continue, car c'est une mesure (du temps). On a pas 12 ans, on a 12 ans 5 mois 17 jours...
CEPENDANT, il existe une convention, l'âge civil, en nombre d'année. La variable est alors discrète. Le professeur fait la distinction entre les deux dans son diapo mais c'est là la seule exception.
-> la température : c'est une variable quantitative continue, qui le restera peut importe l'unité ou la précision. On a pas 37°, on a 37,26545°. C'est une mesure, donc ce n'est pas discret.
-> la PA en cmH20 : c'est une variable quantitative continue. Oui on dit -10 cmH20, mais c'est une mesure, donc continue
ÉDIT : -> Les Pourcentages : les pourcentages, tout comme l'IMC ou une densité (nombre de cellules/cm2) sont des Variables SEMI QUANTITATIVES. Seul le professeur Lupi Pérugier les définit, dans son cours "Statistiques descriptives et indicateurs en épidémiologie". Pour les autres professeurs il faut les considérer comme des Variables QUALITATIVES.
Pourquoi ?
Exemple de variables quantitatives : nombres de cellules. Si Saumon à 14*10^14 cellules et que Rock en a 12*10^14, alors le nombre de cellules est de 26*10^14. Ici je peux additionner les cellules.
Si je prends l'exemple de la densité, je prends deux morceaux de tissus : un fait 5 cm2 pour 140 000 cellules, et un autre 3cm2 pour 93 000 cellules.
-> densité du tissu 1 : 140 000/5 = 28 000
-> densité du tissu 2 : 93 000/3 = 31 000
-> addition des deux densités : 28 000 + 51 000 = 79 000 cellules /cm2
-> densité des deux tissus : 140 000 + 93 000/5+3 = 151 635 cellules/cm2
Ici vous voyez bien que la densité des deux tissus réunis est très différente de l'addition des deux densités calculées séparément. Donc la densité est une variable non additionnable. Donc cela ne peut pas être une variable quantitative.
Donc ici aussi il faut faire attention à la formulation de l'énoncé !!! (Fin de l'ÉDIT)
-> La seule possibilité pour qu'une variable soit discrète c'est qu'elle soit issu d'un dénombrement
(le nombre de bonbons dans un sachet, de fleurs dans un pot de fleurs, le nombre de mannequins défilant pour Victoria's Secret). On ne trouvera JAMAIS de nombre à virgule pour ces variables, donc elles sont discrètes.
Vous voyez donc qu'il faut en revenir vraiment aux définitions même du professeur!
Conseil du jour: bossez aussi la chimie G
EDIT : j'ai tué le tuteur qui m'a modifié mon post pour que ce truc clignotant au dessus qui vous arrache la rétine soit là..
Voili Voilou !
J'espère que ce (petit) post vous aura aidé à y voir plus clair dans les variables !! Ce post est aussi fait pour que vous postiez en masse tous vos problèmes sur les variables maintenant, si vous en avez bien sur
La Biostat vous aime



juste une petite question du coup la température on la considère comme une variable continue ? Ou bien discrète parceque elle est citée dans l exemple d une variable discrète .. Merci 

