[Skip Global Navigation]

Bienvenue sur le site de SPSS Maghreb
Processus CRISP-DM

CRoss Industry Standard Process for Data mining

CRISP-DM, qui signifie Cross-Industry Standard Process for Data Mining, est une méthode mise à l'épreuve sur le terrain permettant d'orienter vos travaux de Data mining.

  • En tant que méthodologie, CRISP-DM comprend des descriptions des phases typiques d'un projet et des tâches comprises dans chaque phase, et une explication des relations entre ces tâches.
  • En tant que modèle de processus, CRISP-DM offre un aperçu du cycle de vie du Data mining.


Le modèle de cycle de vie comporte six phases dotées de flèches indiquant les dépendances les plus importantes et les plus fréquentes entre les phases. La séquence des phases n'est pas strictement établie. De fait, les projets, pour la plupart, passent d'une phase à l'autre en fonction des besoins.

Adaptable, le modèle CRISP-DM peut être aisément personnalisé. Ainsi, si votre entreprise cherche à repérer un blanchiment d'argent, vous examinerez certainement une grande quantité de données sans objectif précis concernant la modélisation. Votre travail sera ciblé non sur la modélisation, mais sur l'exploration et la visualisation de données avec pour objectif de découvrir des configurations suspectes parmi les données financières. CRISP-DM vous permet de créer un modèle de Data mining adapté à vos besoins.

Dans une telle situation, les phases de modélisation, d'évaluation et de déploiement peuvent s'avérer d'un intérêt moindre que les phases de préparation et de compréhension des données. Toutefois, certaines des questions soulevées durant ces dernières phases sont tout de même à prendre en considération pour les planifications à long terme et les futurs objectifs de Data mining.

Les Phases de CRISP-DM
Phases
Tâches
Compréhension du problème
  • Déterminer les objectives commerciaux.
  • Evaluater de la situation.
  • Déterminer les objectives du Data Mining.
  • Produire d'un plan du projet.
Compréhension des données
  • Collecte des données initiales
  • Description des données
  • exploration des données
  • Vérification de la qualité des données
Préparation des données
  • Sélection des données
  • Nettoyage des données
  • Construction de nouvelles données
  • Intégration des données
  • Formatage des données
Modélisation
  • Sélection des techniques de modélisation.
  • Génération d'une conception de test.
  • Création des modèles.
  • Evaluation de modèles.
Evaluation
  • Evaluation de résultats
  • Processus de révision
  • Détermination des étapes suivantes
Déploiement
  • Planification du déploiemnt
  • Planification de surveillance et maintenance
  • Production de rapport final
  • Exécution d'une révision de projet final