[Skip Global Navigation]

Bienvenue sur le site de SPSS Maghreb
SPSS Correspondances

Prédire les résultats et révéler les relations dans les données catégoriques

Libérez tout le potentiel de vos données via l’analyse prédictive, l’apprentissage statistique, le mapping perceptuel, le dimensionnement des préférences et les techniques de réduction de dimensions, dont le dimensionnement optimal de vos variables. SPSS Categories dispose de tous les outils nécessaires pour une visibilité parfaite sur vos données catégoriques et numériques complexes ainsi que les données à nombre de dimensions élevé.

Vous pouvez par exemple utiliser SPSS Categories pour déterminer quelle caractéristique les consommateurs associent le plus étroitement à votre produit ou à votre marque ou pour déterminer la perception qu’a le client de vos produits par comparaison avec d’autres produits proposés par vous-mêmes ou par vos concurrents.

Avec SPSS Categories, vous pouvez utiliser la régression lorsque les prédicteurs et les variables de sortie sont numériques, ordinaux ou nominaux et interpréter visuellement les données pour voir comment les lignes et les colonnes s’associent dans les grands tableaux de notes, de décomptes, d’estimations, de classements ou de similarités. Vous disposez ainsi de la capacité à :

  • Travailler avec les données ordinales et nominales et les comprendre en utilisant des procédures similaires à la régression conventionnelle, les composants principaux et les analyses de corrélation canonique.
  • Travailler avec des valeurs résiduelles non normales dans les données numériques ou des relations non linéaires entre les variables de prédicteur et la variable de sortie. Utilisez les options Ridge Regression, Lasso, Elastic Net, la sélection de variable et la sélection de modèle pour les données numériques comme pour les données catégoriques.
  • Utiliser des biplots et des triplots (diagrammes à double ou triple projection) pour représenter la relation entre les objets (cas), les catégories et les (jeux de) variables dans les analyses de corrélation.
  • Représenter les similarités entre un ou deux jeux d’objets sous la forme de distances sur les cartes perceptuelles.


Transformez vos variables qualitatives en variables quantitatives

Les procédures avancées disponibles sous SPSS Categories permettent d’exécuter des opérations statistiques additionnelles sur les données catégoriques.

Utilisez les procédures de dimensionnement optimal (optimal scaling) de SPSS Categories pour assigner des unités de mesure et des points zéro à vos données catégoriques. Cette approche vous ouvre un tout nouvel ensemble de fonctions statistiques et vous permet d’exécuter des analyses sur les variables de niveaux de mesures mixtes–par exemple, sur des combinaisons de variables nominales, ordinales et numériques.

Grâce à la capacité de SPSS Categories à exécuter la régression multiple avec le dimensionnement optimal vous pouvez appliquer la régression sur des mélanges de prédicteurs numériques, ordinaux et nominaux et de variables de sortie. La dernière version de SPSS Categories inclut des procédures à l’état de l’art pour la sélection de modèle et la régularisation. Vous pouvez exécuter des analyses de correspondances et de correspondances multiples pour évaluer numériquement les relations entre deux ou plusieurs variables nominales présentes dans vos données. Vous pouvez également utiliser l’analyse de correspondance pour analyser tout tableau ayant des entrées non négatives.

Avec la procédure d’analyse des composantes principales, vous pouvez réduire vos données aux composants importantes. Les biplots et triplots des objets de type catégorie et variable montrent leur relation. Ces options sont également disponibles pour les données numériques. Avec dimensionnement optimal vous disposez d’une matrice de corrélation basée sur les quantifications de vos variables ordinales et nominales. Ou bien vous pouvez fractionner vos variables en différents ensembles, puis analyser les relations entre ces ensembles avec l’analyse de corrélation canonique non linéaire.

Afficher graphiquement les relations sous-jacentes

Quel que soit le type de catégorie étudié : segment de marché, diagnostics médicaux, sous cultures, partis politiques ou espèces biologiques, les procédures de dimensionnement optimal vous libèrent des restrictions associées aux tableaux à double entrée, en plaçant les relations entre vos variables dans un cadre de référence plus grand. Vous pouvez consulter une carte de vos données–et non pas simplement un rapport statistique.

Les techniques de réduction de dimension de SPSS Categories permettent de surmonter les difficultés liées aux tableaux encombrants. En effet, vous pouvez clarifier les relations dans vos données en utilisant des cartes perceptuelles et des biplots.

  • Les cartes perceptuelles sont des graphiques résumés à haute résolution qui montrent les variables similaires ou les catégories proches les unes des autres. Elles fournissent une visibilité unique sur les relations entre plus de deux variables catégoriques.
  • Avec les biplots et les triplots vous pouvez observer les relations entre les cas, les variables et les catégories. Par exemple, vous pouvez définir des relations entre les produits, les clients et les caractéristiques démographiques.


En utilisant la procédure de dimensionnement des préférences (preference scaling), vous pouvez visualiser encore davantage les relations entre les objets. L’algorithme de dépliage (unfolding algorithm) sur lequel est basée cette procédure permet d’exécuter des analyses non métriques pour les données ordinales et d’obtenir des résultats significatifs. La procédure de dimensionnement des proximités permet d’analyser les similarités entre les objets et d’intégrer des caractéristiques pour ces objets dans la même analyse.

Les possibilités de SPSS Categories

Les procédures suivantes sont disponibles pour rendre vos analyses de données plus significatives.

La régression nominale (CATREG) prédit les valeurs d’une variable de résultat nominale, ordinale ou numérique à partir d’une combinaison de variables de prédicteur numériques et catégoriques (non)ordonnées. Vous pouvez utiliser la régression avec le dimensionnement optimal pour décrire par exemple la façon dont la satisfaction au travail peut être prédite à partir de catégorie de tache, de région géographique et de la quantité de trajet lié au travail.

Les techniques de dimensionnement optimal quantifient les variables de telle sorte que le R Multiple soit maximisé. Le dimensionnement optimal peut être appliqué aux variables numériques lorsque les valeurs résiduelles sont non normales ou lorsque les variables de prédicteur ne sont pas liées linéairement à la variable de résultat. Trois nouvelles méthodes de régularisation : Ridge Regression, Lasso, et Elastic Net, améliorent la précision de prédiction en stabilisant les estimations de paramètre. La sélection automatique de variables permet d’analyser des ensembles de données à fort volume (davantage de variables que d’objets). Avec le niveau de dimensionnement numérique, vous pouvez effectuer la régularisation dans la régression en utilisant les méthodes Lasso ou Elastic Net pour vos données numériques.

Vous pouvez également utiliser CATREG pour appliquer des Modèles Additifs Généralisés (GAM) particuliers, à la fois pour vos données numériques et pour vos données catégoriques.

L’analyse des correspondances (CORRESPONDANCE) permet d’analyser les tableaux à double entrée qui contiennent des mesures de correspondance entre lignes et colonnes et d’afficher les lignes et les colonnes sous forme de points sur une carte. Un tableau croisé dans lequel les cellules contiennent les fréquences de jointures de deux variables nominales serait un exemple d’un type très courant de tableau de correspondances. SPSS Categories affiche de façon visuelle les relations entre les catégories de ces variables nominales.

L’analyse des correspondances multiples (MULTIPLE CORRESPONDENCE) diffère de l’analyse des correspondances en ceci qu’elle permet d’utiliser plus de deux variables dans l’analyse. Avec cette procédure, toutes les variables sont analysées au niveau nominal.

Par exemple, vous pouvez utiliser l’analyse des correspondances multiples pour étudier les relations entre les émissions favorites, le groupe d’âge et le sexe. Sur une carte à dimension réduite créée avec SPSS Categories, vous pourriez voir quels groupes gravitent autour de quelles émissions tout en apprenant également quelles émissions sont les plus similaires.

L’analyse en composantes principales qualitatives (CATPCA) utilise le dimensionnement optimal pour généraliser la procédure d’analyse des composants principaux de façon à ce qu’elle puisse accepter les variables des niveaux de mesures mixtes. Elle est similaire à l’analyse de correspondance multiple mais vous pouvez spécifier un niveau d’analyse variable par variable.

Par exemple, vous pouvez afficher les relations entre différentes marques et caractéristiques de voitures telles que le prix, le poids, la consommation, etc. Ou bien vous pouvez décrire les voitures par classes (compactes, moyennes, convertibles, 4x4, etc.) et CATPCA utilise ces classifications pour grouper les points pour les voitures. En assignant une pondération importante à la variable de classification, les voitures vont être regroupées de façon étroite autour des points de leur classe. SPSS Categories affiche les relations complexes entre les objets, les groupes, les variables dans une carte à dimension réduite qui simplifie la compréhension de leurs relations.

L’analyse canonique non linéaire (OVERALS) utilise le dimensionnement optimal pour généraliser la procédure d’analyse des corrélations canoniques de façon à ce qu’elle accepte les variables de niveaux de mesures mixtes. Ce type d’analyse permet de comparer plusieurs jeux de variables dans le même graphique après suppression de la corrélation entre les jeux.

Par exemple, vous pourriez analyser les caractéristiques de produits telles que des soupes, dans une étude de goût. Les juges représentent les variables à l’intérieur des ensembles tandis que les soupes représentent les cas. OVERALS établit une moyenne des évaluations des juges après suppression des corrélations et combine les différentes caractéristiques pour afficher les relations entre les soupes. Ou bien, chaque juge peut avoir utilisé un ensemble séparé de critères pour juger les soupes. Dans ce cas, chaque juge forme un ensemble et OVERALS établit la moyenne des critères, après suppression des corrélations, puis combine les notes des différents juges.

La procédure OVERALS peut également être utilisée pour la régression multiple généralisée lorsque vous avez plusieurs variables de résultat qui doivent être prédites de façon conjointe à partir d’un ensemble de variables de prédicteur.

Le positionnement multidimentionnel (PROXSCAL) s’applique à une ou plusieurs matrices contenant des similarités ou des dissimilarités (proximités). Ou bien, vous pouvez calculer les distances entre les cas dans les données multivariées en tant qu’entrées à PROXSCAL. PROXSCAL affiche les proximités sous forme de distances sur une carte afin de fournir une compréhension spatiale de la façon dont les objets sont liés. Dans le cas des matrices de proximités multiples, PROXSCAL analyse les communautés et trace les différences entre elles. Par exemple, vous pouvez utiliser PROXSCAL pour afficher les similarités entre les différentes saveurs de colas préférées par les consommateurs dans différents groupes d’âge. Vous pourriez découvrir que les adolescents mettent l’accent sur les différences entre saveurs traditionnelles et saveurs nouvelles tandis que les adultes mettent l’accent sur les colas diététiques par opposition aux sodas non diététiques.

Le dépliage multidimentionel (PREFSCAL) examine visuellement les relations entre deux ensembles d’objets, par exemple, les consommateurs et les produits. Le Preference scaling exécute le ‘dépliage’ multidimensionnel afin de trouver une carte qui représente les relations entre ces deux ensembles d’objets sous forme de distances entre deux ensembles de points.

Par exemple, si un groupe de conducteurs estimait 26 modèles de voitures sur dix attributs selon une échelle à six points, vous pourriez trouver une carte avec des clusters montrant quels modèles sont similaires et quelles personnes aiment le plus ces modèles. Cette carte est un compromis basé sur les dix attributs différents et un tracé des dix attributs différents montre comment ils pondèrent de façon différentielle les dimensions de la carte.

Mieux comprendre les perceptions du consommateur

En Australie du Sud, des spécialistes des études de marché cherchaient à déterminer comment les consommateurs percevaient six marques de café glacé. Ils ont interrogé des consommateurs pour estimer chacune des marques (notées de AA à FF sur la figure 1) pour 16 attributs catégoriques différents. Sur le tableau à 96 cellules qui en a résulté il était difficile de voir clairement les relations entre les marques et les attributs perçus.

Les analystes ont utilisé la procédure de correspondance de SPSS Statistics pour identifier les deux facteurs sousjacents les plus forts dans les relations entre les marques et les attributs. En assignant à chaque marque et attribut un chiffre spécifique à l’intérieur de chaque dimension, l’information a été affichée selon un graphique facilement compréhensible, appelé ‘carte perceptuelle’. Par exemple, il est clair sur la figure 1 que la marque AA est la marque la plus étroitement identifiée par le marché comme ayant l’attribut « populaire ». De même les analystes peuvent rapidement constater que les consommateurs intéressés par des produits favorisant la bonne santé et comportant peu de matière grasse perçoivent les produits CC et DD de façon plus positive tandis que FF est perçue comme une marque riche et sucrée.*

* Source des données et de l’exemple : Kennedy, R., C. Riquier et Byron Sharp. 1996. « Pratical Applications of Correspondence Analysis to Categorical Data in Market Research, » Journal of Targeting, Measurement and Analysis for Marketing, Vol. 5, No. 1, pp. 56-70.

Téléchargement brochure SPSS Correspondances