[Skip Global Navigation]

Bienvenue sur le site de SPSS Maghreb
SPSS Correspondances

Prdire les rsultats et rvler les relations dans les donnes catgoriques

Librez tout le potentiel de vos donnes via lanalyse prdictive, lapprentissage statistique, le mapping perceptuel, le dimensionnement des prfrences et les techniques de rduction de dimensions, dont le dimensionnement optimal de vos variables. SPSS Categories dispose de tous les outils ncessaires pour une visibilit parfaite sur vos donnes catgoriques et numriques complexes ainsi que les donnes nombre de dimensions lev.

Vous pouvez par exemple utiliser SPSS Categories pour dterminer quelle caractristique les consommateurs associent le plus troitement votre produit ou votre marque ou pour dterminer la perception qua le client de vos produits par comparaison avec dautres produits proposs par vous-mmes ou par vos concurrents.

Avec SPSS Categories, vous pouvez utiliser la rgression lorsque les prdicteurs et les variables de sortie sont numriques, ordinaux ou nominaux et interprter visuellement les donnes pour voir comment les lignes et les colonnes sassocient dans les grands tableaux de notes, de dcomptes, destimations, de classements ou de similarits. Vous disposez ainsi de la capacit :

  • Travailler avec les donnes ordinales et nominales et les comprendre en utilisant des procdures similaires la rgression conventionnelle, les composants principaux et les analyses de corrlation canonique.
  • Travailler avec des valeurs rsiduelles non normales dans les donnes numriques ou des relations non linaires entre les variables de prdicteur et la variable de sortie. Utilisez les options Ridge Regression, Lasso, Elastic Net, la slection de variable et la slection de modle pour les donnes numriques comme pour les donnes catgoriques.
  • Utiliser des biplots et des triplots (diagrammes double ou triple projection) pour reprsenter la relation entre les objets (cas), les catgories et les (jeux de) variables dans les analyses de corrlation.
  • Reprsenter les similarits entre un ou deux jeux dobjets sous la forme de distances sur les cartes perceptuelles.


Transformez vos variables qualitatives en variables quantitatives

Les procdures avances disponibles sous SPSS Categories permettent dexcuter des oprations statistiques additionnelles sur les donnes catgoriques.

Utilisez les procdures de dimensionnement optimal (optimal scaling) de SPSS Categories pour assigner des units de mesure et des points zro vos donnes catgoriques. Cette approche vous ouvre un tout nouvel ensemble de fonctions statistiques et vous permet dexcuter des analyses sur les variables de niveaux de mesures mixtespar exemple, sur des combinaisons de variables nominales, ordinales et numriques.

Grce la capacit de SPSS Categories excuter la rgression multiple avec le dimensionnement optimal vous pouvez appliquer la rgression sur des mlanges de prdicteurs numriques, ordinaux et nominaux et de variables de sortie. La dernire version de SPSS Categories inclut des procdures ltat de lart pour la slection de modle et la rgularisation. Vous pouvez excuter des analyses de correspondances et de correspondances multiples pour valuer numriquement les relations entre deux ou plusieurs variables nominales prsentes dans vos donnes. Vous pouvez galement utiliser lanalyse de correspondance pour analyser tout tableau ayant des entres non ngatives.

Avec la procdure danalyse des composantes principales, vous pouvez rduire vos donnes aux composants importantes. Les biplots et triplots des objets de type catgorie et variable montrent leur relation. Ces options sont galement disponibles pour les donnes numriques. Avec dimensionnement optimal vous disposez dune matrice de corrlation base sur les quantifications de vos variables ordinales et nominales. Ou bien vous pouvez fractionner vos variables en diffrents ensembles, puis analyser les relations entre ces ensembles avec lanalyse de corrlation canonique non linaire.

Afficher graphiquement les relations sous-jacentes

Quel que soit le type de catgorie tudi : segment de march, diagnostics mdicaux, sous cultures, partis politiques ou espces biologiques, les procdures de dimensionnement optimal vous librent des restrictions associes aux tableaux double entre, en plaant les relations entre vos variables dans un cadre de rfrence plus grand. Vous pouvez consulter une carte de vos donneset non pas simplement un rapport statistique.

Les techniques de rduction de dimension de SPSS Categories permettent de surmonter les difficults lies aux tableaux encombrants. En effet, vous pouvez clarifier les relations dans vos donnes en utilisant des cartes perceptuelles et des biplots.

  • Les cartes perceptuelles sont des graphiques rsums haute rsolution qui montrent les variables similaires ou les catgories proches les unes des autres. Elles fournissent une visibilit unique sur les relations entre plus de deux variables catgoriques.
  • Avec les biplots et les triplots vous pouvez observer les relations entre les cas, les variables et les catgories. Par exemple, vous pouvez dfinir des relations entre les produits, les clients et les caractristiques dmographiques.


En utilisant la procdure de dimensionnement des prfrences (preference scaling), vous pouvez visualiser encore davantage les relations entre les objets. Lalgorithme de dpliage (unfolding algorithm) sur lequel est base cette procdure permet dexcuter des analyses non mtriques pour les donnes ordinales et dobtenir des rsultats significatifs. La procdure de dimensionnement des proximits permet danalyser les similarits entre les objets et dintgrer des caractristiques pour ces objets dans la mme analyse.

Les possibilits de SPSS Categories

Les procdures suivantes sont disponibles pour rendre vos analyses de donnes plus significatives.

La rgression nominale (CATREG) prdit les valeurs dune variable de rsultat nominale, ordinale ou numrique partir dune combinaison de variables de prdicteur numriques et catgoriques (non)ordonnes. Vous pouvez utiliser la rgression avec le dimensionnement optimal pour dcrire par exemple la faon dont la satisfaction au travail peut tre prdite partir de catgorie de tache, de rgion gographique et de la quantit de trajet li au travail.

Les techniques de dimensionnement optimal quantifient les variables de telle sorte que le R Multiple soit maximis. Le dimensionnement optimal peut tre appliqu aux variables numriques lorsque les valeurs rsiduelles sont non normales ou lorsque les variables de prdicteur ne sont pas lies linairement la variable de rsultat. Trois nouvelles mthodes de rgularisation : Ridge Regression, Lasso, et Elastic Net, amliorent la prcision de prdiction en stabilisant les estimations de paramtre. La slection automatique de variables permet danalyser des ensembles de donnes fort volume (davantage de variables que dobjets). Avec le niveau de dimensionnement numrique, vous pouvez effectuer la rgularisation dans la rgression en utilisant les mthodes Lasso ou Elastic Net pour vos donnes numriques.

Vous pouvez galement utiliser CATREG pour appliquer des Modles Additifs Gnraliss (GAM) particuliers, la fois pour vos donnes numriques et pour vos donnes catgoriques.

Lanalyse des correspondances (CORRESPONDANCE) permet danalyser les tableaux double entre qui contiennent des mesures de correspondance entre lignes et colonnes et dafficher les lignes et les colonnes sous forme de points sur une carte. Un tableau crois dans lequel les cellules contiennent les frquences de jointures de deux variables nominales serait un exemple dun type trs courant de tableau de correspondances. SPSS Categories affiche de faon visuelle les relations entre les catgories de ces variables nominales.

Lanalyse des correspondances multiples (MULTIPLE CORRESPONDENCE) diffre de lanalyse des correspondances en ceci quelle permet dutiliser plus de deux variables dans lanalyse. Avec cette procdure, toutes les variables sont analyses au niveau nominal.

Par exemple, vous pouvez utiliser lanalyse des correspondances multiples pour tudier les relations entre les missions favorites, le groupe dge et le sexe. Sur une carte dimension rduite cre avec SPSS Categories, vous pourriez voir quels groupes gravitent autour de quelles missions tout en apprenant galement quelles missions sont les plus similaires.

Lanalyse en composantes principales qualitatives (CATPCA) utilise le dimensionnement optimal pour gnraliser la procdure danalyse des composants principaux de faon ce quelle puisse accepter les variables des niveaux de mesures mixtes. Elle est similaire lanalyse de correspondance multiple mais vous pouvez spcifier un niveau danalyse variable par variable.

Par exemple, vous pouvez afficher les relations entre diffrentes marques et caractristiques de voitures telles que le prix, le poids, la consommation, etc. Ou bien vous pouvez dcrire les voitures par classes (compactes, moyennes, convertibles, 4x4, etc.) et CATPCA utilise ces classifications pour grouper les points pour les voitures. En assignant une pondration importante la variable de classification, les voitures vont tre regroupes de faon troite autour des points de leur classe. SPSS Categories affiche les relations complexes entre les objets, les groupes, les variables dans une carte dimension rduite qui simplifie la comprhension de leurs relations.

Lanalyse canonique non linaire (OVERALS) utilise le dimensionnement optimal pour gnraliser la procdure danalyse des corrlations canoniques de faon ce quelle accepte les variables de niveaux de mesures mixtes. Ce type danalyse permet de comparer plusieurs jeux de variables dans le mme graphique aprs suppression de la corrlation entre les jeux.

Par exemple, vous pourriez analyser les caractristiques de produits telles que des soupes, dans une tude de got. Les juges reprsentent les variables lintrieur des ensembles tandis que les soupes reprsentent les cas. OVERALS tablit une moyenne des valuations des juges aprs suppression des corrlations et combine les diffrentes caractristiques pour afficher les relations entre les soupes. Ou bien, chaque juge peut avoir utilis un ensemble spar de critres pour juger les soupes. Dans ce cas, chaque juge forme un ensemble et OVERALS tablit la moyenne des critres, aprs suppression des corrlations, puis combine les notes des diffrents juges.

La procdure OVERALS peut galement tre utilise pour la rgression multiple gnralise lorsque vous avez plusieurs variables de rsultat qui doivent tre prdites de faon conjointe partir dun ensemble de variables de prdicteur.

Le positionnement multidimentionnel (PROXSCAL) sapplique une ou plusieurs matrices contenant des similarits ou des dissimilarits (proximits). Ou bien, vous pouvez calculer les distances entre les cas dans les donnes multivaries en tant quentres PROXSCAL. PROXSCAL affiche les proximits sous forme de distances sur une carte afin de fournir une comprhension spatiale de la faon dont les objets sont lis. Dans le cas des matrices de proximits multiples, PROXSCAL analyse les communauts et trace les diffrences entre elles. Par exemple, vous pouvez utiliser PROXSCAL pour afficher les similarits entre les diffrentes saveurs de colas prfres par les consommateurs dans diffrents groupes dge. Vous pourriez dcouvrir que les adolescents mettent laccent sur les diffrences entre saveurs traditionnelles et saveurs nouvelles tandis que les adultes mettent laccent sur les colas dittiques par opposition aux sodas non dittiques.

Le dpliage multidimentionel (PREFSCAL) examine visuellement les relations entre deux ensembles dobjets, par exemple, les consommateurs et les produits. Le Preference scaling excute le dpliage multidimensionnel afin de trouver une carte qui reprsente les relations entre ces deux ensembles dobjets sous forme de distances entre deux ensembles de points.

Par exemple, si un groupe de conducteurs estimait 26 modles de voitures sur dix attributs selon une chelle six points, vous pourriez trouver une carte avec des clusters montrant quels modles sont similaires et quelles personnes aiment le plus ces modles. Cette carte est un compromis bas sur les dix attributs diffrents et un trac des dix attributs diffrents montre comment ils pondrent de faon diffrentielle les dimensions de la carte.

Mieux comprendre les perceptions du consommateur

En Australie du Sud, des spcialistes des tudes de march cherchaient dterminer comment les consommateurs percevaient six marques de caf glac. Ils ont interrog des consommateurs pour estimer chacune des marques (notes de AA FF sur la figure 1) pour 16 attributs catgoriques diffrents. Sur le tableau 96 cellules qui en a rsult il tait difficile de voir clairement les relations entre les marques et les attributs perus.

Les analystes ont utilis la procdure de correspondance de SPSS Statistics pour identifier les deux facteurs sousjacents les plus forts dans les relations entre les marques et les attributs. En assignant chaque marque et attribut un chiffre spcifique lintrieur de chaque dimension, linformation a t affiche selon un graphique facilement comprhensible, appel carte perceptuelle. Par exemple, il est clair sur la figure 1 que la marque AA est la marque la plus troitement identifie par le march comme ayant lattribut populaire . De mme les analystes peuvent rapidement constater que les consommateurs intresss par des produits favorisant la bonne sant et comportant peu de matire grasse peroivent les produits CC et DD de faon plus positive tandis que FF est perue comme une marque riche et sucre.*

* Source des donnes et de lexemple : Kennedy, R., C. Riquier et Byron Sharp. 1996. Pratical Applications of Correspondence Analysis to Categorical Data in Market Research, Journal of Targeting, Measurement and Analysis for Marketing, Vol. 5, No. 1, pp. 56-70.

Tlchargement brochure SPSS Correspondances