[Skip Global Navigation]

Bienvenue sur le site de SPSS Maghreb
Processus CRISP-DM

CRoss Industry Standard Process for Data mining

CRISP-DM, qui signifie Cross-Industry Standard Process for Data Mining, est une mthode mise l'preuve sur le terrain permettant d'orienter vos travaux de Data mining.

  • En tant que mthodologie, CRISP-DM comprend des descriptions des phases typiques d'un projet et des tches comprises dans chaque phase, et une explication des relations entre ces tches.
  • En tant que modle de processus, CRISP-DM offre un aperu du cycle de vie du Data mining.


Le modle de cycle de vie comporte six phases dotes de flches indiquant les dpendances les plus importantes et les plus frquentes entre les phases. La squence des phases n'est pas strictement tablie. De fait, les projets, pour la plupart, passent d'une phase l'autre en fonction des besoins.

Adaptable, le modle CRISP-DM peut tre aisment personnalis. Ainsi, si votre entreprise cherche reprer un blanchiment d'argent, vous examinerez certainement une grande quantit de donnes sans objectif prcis concernant la modlisation. Votre travail sera cibl non sur la modlisation, mais sur l'exploration et la visualisation de donnes avec pour objectif de dcouvrir des configurations suspectes parmi les donnes financires. CRISP-DM vous permet de crer un modle de Data mining adapt vos besoins.

Dans une telle situation, les phases de modlisation, d'valuation et de dploiement peuvent s'avrer d'un intrt moindre que les phases de prparation et de comprhension des donnes. Toutefois, certaines des questions souleves durant ces dernires phases sont tout de mme prendre en considration pour les planifications long terme et les futurs objectifs de Data mining.

Les Phases de CRISP-DM
Phases
Tches
Comprhension du problme
  • Dterminer les objectives commerciaux.
  • Evaluater de la situation.
  • Dterminer les objectives du Data Mining.
  • Produire d'un plan du projet.
Comprhension des donnes
  • Collecte des donnes initiales
  • Description des donnes
  • exploration des donnes
  • Vrification de la qualit des donnes
Prparation des donnes
  • Slection des donnes
  • Nettoyage des donnes
  • Construction de nouvelles donnes
  • Intgration des donnes
  • Formatage des donnes
Modlisation
  • Slection des techniques de modlisation.
  • Gnration d'une conception de test.
  • Cration des modles.
  • Evaluation de modles.
Evaluation
  • Evaluation de rsultats
  • Processus de rvision
  • Dtermination des tapes suivantes
Dploiement
  • Planification du dploiemnt
  • Planification de surveillance et maintenance
  • Production de rapport final
  • Excution d'une rvision de projet final