[Skip Global Navigation]

Bienvenue sur le site de SPSS Maghreb

Amliorez l'tape de prparation des donnes pour obtenir des rsultats plus prcis

Avant de procder lanalyse, tous les chercheurs doivent prparer leurs donnes. Bien que PASW Statistics Base propose des outils pour cette prparation, il arrive cependant que des techniques plus sophistiques soient ncessaires. Le module PASW Data Preparation identifie facilement les obersvations inhabituelles ou non valides, les variables et les valeurs de donnes ; visualise les donnes manquantes, affiche la distribution des variables et travaille de faon plus prcise avec les algorithmes en utilisant des variables nominales. Cette approche optimise donc le processus de prparation de donnes. Vous tes prt analyser vos donnes plus rapidement et vous aboutissez des conclusions plus prcises.

PASW Data Preparation peut tre install dans une configuration client uniquement, mais, pour de meilleures performances, vous pouvez galement l'utiliser dans une configuration client/serveur, avec PASW Statistics Server.

Vrification des donnes

La validation des donnes reste encore largement aujourdhui un processus manuel. Vous pouvez par exemple analyser la frquence de vos donnes, imprimer ces frquences, dterminer ce qui doit tre corrig et vrifier toutes les observations. Il va sans dire que toutes ces oprations prennent du temps. De plus, tant donn que chaque analyste au sein de l'entreprise peut utiliser une mthode lgrement diffrente, maintenir la cohrence dun projet lautre peut savrer important.

Pour liminer les vrifications manuelles, utilisez la procdure validation des donnes. Elle vous permet dappliquer des rgles de validation de donnes quelque soit le type de la variable (quil sagisse de variables nominales ou continues). Par exemple, si vous analysez des donnes issues denqute contenant des questions de type chelle Likert cinq points, utilisez la procdure de validation des donnes pour appliquer une rgle ces questions et donc marquer tous les cas situs en dehors de cette plage de 1 5 (1 5). Vous pouvez recevoir des rapports sur les observations non invalides et des rsums sur les violations de rgles indiquant le nombre d'observations concernes. Vous pouvez spcifier des rgles de validation pour chacune des variables (par exemple des vrifications de plage) ainsi que des rgles de validationet entre plusieurs variables (par exemple les variables "hommes" et "enceintes").

Grce ces informations, vous pouvez dterminer la validit des donnes et liminer ou corriger les observations inhabituelles, avant analyse.

Trouver rapidement les valeurs aberrantes multivaries

Empchez les valeurs aberrantes de dformer vos analyses grce la procdure de dtection danomalies. Cette procdure recherche les observations inhabituelles en fonction des carts, avec des obsvervations similaires et vous explique ces carts. En crant une nouvelle variable, vous pouvez marquer les valeurs aberrantes. Lorsque vous avez identifi les observations inhabituelles, vous pouvez les examiner et dterminer si elles doivent ou non tre inclus dans vos analyses.

Pr-traitement des donnes avant construction du modle

Afin dutiliser les algorithmes destins des variables nominals (tels que les modles de Bayes et de logit), vous devez regrouper ces variables quantitatives par catgorie avant la construction du modle. Si ces variables ne sont pas regroupes en catgories, les algorithmes tels que la rgression logistique multinominale prendront beaucoup de temps s'excuter ou ne se termineront pas. C'est tout particulirement le cas si vous utilisez un grand ensemble de donnes. De plus les rsultats obtenus peuvent s'avrer difficiles lire ou interprter.

La foctionnalit de recodage dfinit les points de rupture afin d'obtenir le meilleur rsultat possible des algorithmes utilisant des variables nominales.

Avec cette procdure vous pouvez choisir parmi trois types de recodage pour le prtraitement des donnes avant de construire le modle :

  • Non supervis Crer des groupes avec des mme d'observation
  • Supervis Prendre le mme nombre d'observations en compte la variable cible pour dfinir les points de recodage. Cette mthode est plus prcise que la mthode non supervis. Cependant elle ncessite beaucoup de calcul.
  • Approche hybride Combine les approches de recodage non supervis et supervis. Cette mthode est particulirement utile si vous avez une grande quantit de valeurs distinctes.


Tlchargement brochure SPSS Prparation des donnes