Transcript
Compte Rendue de TP : Analyse multidimensionnelle avec SPSS
Résumé : Il s’agit de l’analyse multidimensionnelle appliquée avec le logiciel SPSS sur 2 bases de données, dans un premier temps on va étudier avec l’ACP les caractéristiques d’un ensemble de modèles de voiture, puis dans un deuxième temps on va étudier avec l’AFC les correspondances entre deux variables qualitatives (Les Couleurs de Yeux, et les Couleurs de Cheveux).
DATE : 15-01-2018 Réalisée par :
Encadré par :
-EL KHALDI Imane 2GC1 N°09
-Professeur : EL KHATRI Saïd
-HAFID Anas 2GC1 N°16
EL KHALDI IMANE
-
HAFID ANAS
Page 1
TP1 : Analyse des composantes principales L’objectif d’utiliser l’ACP dans cette exemple : C’est pour permettre aux fabricants de savoir sa position dans le marché et partant, avoir une idée sur les performances à améliorer dans son modèle.
Les données sont-t-ils factorisables ? Matrice de corrélation
Cylindrée
Puissance
Vitesse
Poids
Longueur
Largeur
Cylindrée
1,000
,861
,693
,905
,864
,709
Puissance
,861
1,000
,894
,746
,689
,552
Vitesse
,693
,894
1,000
,491
,532
,363
Poids
,905
,746
,491
1,000
,917
,791
Longueur
,864
,689
,532
,917
1,000
,864
Largeur
,709
,552
,363
,791
,864
1,000
Corrélation
1- Plusieurs variables sont corrélées (>0.5). Indice KMO et test de Bartlett
Mesure de précision de l'échantillonnage de Kaiser -MeyerOlkin. Khi-deux approximé Test de sphéricité de Bartlett ddl
,705 178,583 15
Signification de Bartlett
,000
2- 0 .71/p=17 %, c’està-dire uniquement le 1er axe (77.6% >17%), pour le 2éme axe (15%<17%). 2-si on fixe une variance résiduelle de 5% on retiendra 3 axes CP1, CP2 et CP3 qui donnent une variance expliquée de 96%>95%. 3-Critére de KAISSER : (applicable car les variables sont réduites) on retient les CP tel que λk >1, i.e. : on ne retient que la première CP. 4-Critére de CATTELL : d’après le graphe d’évolution des valeurs propres ci-dessus, on retient les 2 premiers axes.
C /C : les 2 premiers axes expliquent 92.854% de l’inertie totale, 2 axes suffisent.
Interprétation des axes :
Figure 1 : Plan de projection des variables 1-2
EL KHALDI IMANE
-
HAFID ANAS
Page 4
Figure 2: Plan de projection des variables 2-3
L’axe 1 est corrélé positivement avec toutes les variables initiales, donc l’axe 1 explique l’appréciation générale. L’axe 2 explique une opposition entre : -
Un groupe de variables avec lesquelles la corrélation est positive qui sont : vitesse, puissance et cylindrée qu’on peut résumer en performance technique du moteur. Un autre groupe de variables avec lesquelles la corrélation est négative qui sont : Poids, largeur et longueur, qu’on peut résumer en caractéristiques physiques (dimensions de la voiture).
L’axe 3 représente une opposition entre Largeur et Poids, mais ceci porte peu d’information, car la
variance expliquée par cet axe est faible.
Le meilleur plan d’ajustement : Le plan d’ajustement 1-2 explique 92,854 % de l’inertie totale, tandis que le plan 1-3 explique 81.607% et le plan 2-3 n’explique que 19.261%.
EL KHALDI IMANE
-
HAFID ANAS
Page 5
Donc le meilleur plan d’ajustement est le plan 1-2, expliquant ainsi 92.854% de l’inertie totale.
Vérification de la cohérence des valeurs de la corrélation entre les variables et la projection plane de ces derniers sur le plan 1-2 : -(On a pas bien compris la question)-
Les variables Longueur et Poids sont corrélées car l’angle entre les deux est presque nul. Les variables Largeur et Vitesse ne sont pas corrélées car l’angle entre eux tend vers pi/2.
Interprétation de la position des voitures sur le plan 1-2 :
On constate 5 zones : - La zone centrale : formée par les voitures à aspect général moyenne et performance moteur et dimension équilibrés
EL KHALDI IMANE
-
HAFID ANAS
Page 6
-
La zone Nord-Est : formée par les voitures à aspect général bien, performance moteur bonne et de petite dimension La zone Nord-Ouest : formée par les voitures à aspect général mauvais, performance moteur bonne et de petite dimension. La zone Sud-Est : formée par les voitures à aspect général bien, performance moteur mauvaise et de grande dimension. La zone Sud-Ouest : formée par les voitures à aspect général mauvais, performance moteur mauvaise et de grande dimension.
Remarque : -
-
Cette classification permet au producteur de faire une étude de marché selon les préférences du consommateur cible. Par exemple : Les habitant des pays de golf ont tendance à préférer des voiture esthétiquement distinguée et ne s’intéressent pas beaucoup aux performances techniques. Par contre les Allemands préférant des voitures à haute performances techniques et ne se soucient peu des dimensions. Cette étude permet également de tirer des informations sur les voitures à caractéristiques semblables. Graphiquement, elles se rapprochent comme c’est le cas par exemple de Renault 21 et Peugeot 405.
TP2 : Analyse Factorielle des correspondances : Y-a-t-il un lien entre la couleur des cheveux et la couleur des yeux ? Récapitulatif
Dimensio n
Valeur
Inertie
Khi-deux
Sig.
Proportion d'inertie
singulière
Valeur singulière de confiance
Expliqué
Cumulé
Ecart-type
Corrélation 2
1
,457
,209
,894
,894
,032
2
,149
,022
,095
,989
,042
3
,051
,003
,011
1,000
1,000
1,000
Total
,234
138,290
a
,000
,134
a. 9 degrés de liberté
On à un degré de signification α tend vers 0, on peut donc accepter que D² soit non nulle, donc la liaison entre Couleur de Cheveux et Couleur des Yeux est significative au risque α. On est loin de l’indépendance. EL KHALDI IMANE
-
HAFID ANAS
Page 7
Le nombre d’axe factoriels qu’on aura au maximum : C’est
= min( − 1 ; − 1)
Avec p=n=4 nombre de modalité de chacune des variables. On aura donc au maximum 3 axes factoriels.
Quel sont les axes à retenir ? On va retenir les deux premiers axes factoriels, car donne 98.9% de l’inertie expliquée. L’axe 3 ne donne que 1.1% de l’inertie expliquée.
Représentation des différentes modalités dans le plan 1-2 : Pour la Variable Couleur des C heveux :
Caractéristiques des points lignes
cheveux
Masse
Score dans la
Inertie
Contribution
dimension 1
2
De point à inertie de
De dimension à inertie de point
dimension 1
2
1
2
Total
Noir
,182
-,746
,556
,055
,222
,379
,838
,152
,990
Châtain
,483
-,219
-,085
,012
,051
,023
,864
,042
,906
Roux
,120
-,192
-,828
,015
,010
,551
,133
,812
,945
Blond
,215
1,236
,180
,151
,717
,047
,993
,007
1,000
,234
1,000
1,000
Total actif
1,000
a. Normalisation principale symétrique
L’information qui sort du plan est très faible, les cosinus carrés sont tous >0.5, toutes les modalités de la variable couleur des cheveux sont bien représentées dans le plan 1-2.
Pour la Vari able Couleur des Yeux :
Caractéristiques des points colonnes
yeux
Masse
Score dans la
Inertie
Contribution
dimension
EL KHALDI IMANE
-
HAFID ANAS
Page 8
1
2
De point à inertie de
De dimension à inertie de
dimension
point
1
2
1
2
Total
Marron
,372
-,728
,229
,093
,431
,130
,967
,031
,998
Noisette
,157
-,315
-,434
,013
,034
,198
,542
,336
,879
Vert
,108
,239
-,878
,016
,014
,559
,176
,773
,948
Bleu
,363
,810
,215
,111
,521
,112
,977
,022
1,000
,234
1,000
1,000
Total actif
1,000
a. Normalisation principale symétrique
L’information qui sort du plan est très faible, les cosinus carrés sont tous >0.5, toutes les modalités de la variable couleur des yeux sont bien représentées dans le plan 1-2.
Les couleurs des cheveux qui contribuent bien à l’axe 1 : Blond contribue avec 71.7% et noir avec 22.2%.
Les couleurs des yeux qui contribuent bien à l’axe 1 : Bleu contribue avec 52.1% et Marron avec 43.1%.
Les couleurs des cheveux qui contribuent bien à l’axe 2 : Roux contribue avec 55.1% et noir avec 37.9%.
Les couleurs des yeux qui contribuent bien à l’axe 2 : Vert contribue avec 55.9%, Noisette avec 19.8% et Marron avec 13%
EL KHALDI IMANE
-
HAFID ANAS
Page 9
Le lien entre la couleur des cheveux et la couleur des yeux :
Sur l’axe 1 (explique 89.4% de la liaison) qui représente le maximum d’inertie, on observe un lien fort entre Blond et Bleu , puis entre Noir et Marron avec une contribution moindre.
Sur l’axe 2 (explique 9.5% de la liaison), on observe un lien fort entre Roux et Vert, puis entre Noir et Marron avec une contribution moindre.
Remarque : Ces résultats sont tirés du tableau de contribution de chaque point à l’inertie d’une dimension donnée, mais on peut tout de même tirer la même information à partir de graphe. On constate également en étudiant les angles entre l es modalités des variables Couleur de Yeux et Couleur de Cheveux que : -
Les gens qui ont des yeux bleus ont tendance à avoir des cheveux blonds.
EL KHALDI IMANE
-
HAFID ANAS
Page 10
-
Les gens qui ont des yeux marron ont tendance à avoir des cheveux noirs.
-
Les gens qui ont des yeux noisette ont tendance à avoir des cheveux roux.
EL KHALDI IMANE
-
HAFID ANAS
Page 11