Salut !
L’ACP ou
Analyse en Composantes Principales est une
méthode de réduction de dimensions. En gros, dans ton modèle tu as de nombreuses variables, dont chacune est représentée par une dimension
(tu trouves les variables dans un gros tableau - exemple vert dans le cours). Il peut y avoir de nombreuses dimensions et il cela va devenir complexe à visualiser
(perso au-delà de 4 dimensions je comprends plus rien). On peut par exemple chercher à passer de 8 dimensions où visuellement c’est vraiment complexe à 2 dimensions avec la représentation que tu connais faite des axes x et y.
On va transformer ton grand nombre de variables qui sont dites
variables corrélées entre-elles en nouvelles variables non corrélées entre elles : ce sont les
axes/facteurs (F).
Pourquoi non corrélées ? Les facteurs forment des angles droits entre eux
(pas du tout même direction).
va donc te permettre de
résumer un maximum d’informations d’abord sous la forme d’une combinaison linéaire de
variables quantitatives qui correspond à tes axes/facteurs.
une combinaison linéaire de variables s’écrit sous cette forme :
Fi=A1X1+A2X2+...+APXP (avec F un facteur/axe, les Xi tes variables, les Ai les coefficients que tu trouves dans la matrice et qui donnent une idée de la part de chaque variable dans la constitution de l’axe F) et résume l’information d’un tableau qu’on appelle la
matrice d’informations (n,p).
en cela
l’information de tes variables a été
condensée dans les axes. Pour plus de détail, tu peux retenir que les axes ne contiennent pas la même quantité d’information, celle-ci est décroissante (premier axe contient le maximum d’informations).
Pour obtenir ton axe factoriel, il est important de
centrer-réduire les données, de calculer les
vecteurs propres et
valeurs propres.
DONC : on passe d’un
tableau de dimension importante à un
représentation simplifiée des données dans un plan défini par tes axes (hyperplan). Aussi tu te doutes qu’en réduisant les dimensions, il y a une perte d’information. Le but va être tout en simplifiant
(réduction des dimensions) de conserver un maximum d’informations.
Ensuite pour aller plus loin, tu n’as pas trop notion cette année mais c’est dans le cours des modèles multivariés complet.
La notion de cercle de corrélation qui traduit l'influence de chacune des variables sur les axes choisis par l’ACP.Bon courage pour demain !