Salut Ellie !
Navré de mon retard chronique !
Il est vrai que l’item ne parait parait pas évident au premier abord. Je pourrais aller plus dans le détail mais je vais
rester simple par souci d’efficacité.
La
variance est une
mesure de la dispersion des valeurs dans un échantillon. Dans ton cours de statistiques descriptives on te dit qu’elle indique la
dispersion des données autour de la moyenne.
On comprend ici dans le cadre de notre modèle de la régression linéaire simple que cette notion est liée à celle d’
erreur individuelle ε qu’on définit comme l’écart entre la valeur obtenue par ta fonction de régression (point rouge sur la droite) et la valeur observée (sur le schéma au point i).
Tout ça pour dire que
si ta variance augmente, alors tes données seront plus dispersées et inversement. Donc si le pourcentage de variance est faible alors on aura des données peu dispersées. C’est ce qu’on cherche à faire dans le cadre de la régression linéaire simple, il nous faut la droite qui résume au mieux les données c’est-à-dire qui minimise au mieux la somme des carrés des écarts (les erreurs).
Le modèle (de la régression linéaire simple ici) est adéquat si la dispersion est faible, sinon pas trop importante. Après il faudra s’orienter éventuellement vers d’autres modèles mais qui ne sont pas développés par le prof cette année.
Finalement j’ai fait plus long que prévu, j’espère que c’est plus clair, sinon je peux essayer de reformuler.
Bon courage en cette fin de semestre !
Bonne journée !