O CRISP-DM ( Cross Industry Standard Process for Data Mining ) é um modelo de processo de mineração de dados que descreve uma abordagem comumente usada para resolver problemas de domínio .
Pesquisas realizadas em 2002, 2004, 2007, 2014 e 2020 mostram que este é o principal método utilizado pelos mineradores de dados. Este método foi criado por um consórcio formado pelas empresas NCR, SPSS e Daimler-Benz. O processo define uma hierarquia que consiste em fases principais, tarefas gerais, tarefas especializadas e instâncias de processo.
O CRISP-DM divide o processo de mineração de dados em seis fases principais:
O método CRISP-DM foi desenhado em 1996. Em 1997, desenvolveu-se como um projeto da União Europeia financiado pelo programa ESPRIT . O projeto é liderado por quatro empresas: ISL, NCR Corporation , Daimler-Benz e OHRA. Este núcleo do consórcio traz diferentes experiências para o projeto: a ISL, posteriormente adquirida e integrada à SPSS Inc., produz seus pacotes de software de análise preditiva de mesmo nome, agora integrados ao grupo IBM. A gigante da computação NCR Corporation criou a divisão Teradata especializada em data warehouses e seu próprio pacote de software de mineração de dados. A Daimler-Benz tinha uma grande equipe de mineradores de dados. OHRA , uma seguradora, tinha acabado de começar a explorar o potencial de uso de mineração de dados.
A primeira versão do método foi lançada com o número de versão CRISP-DM 1.0 em 1999.
Dentro julho de 2006, o consórcio anuncia que começará a trabalhar em uma segunda versão do CRISP-DM. O26 de setembro de 2006, CRISP-DM SIG se reúne para discutir melhorias para CRISP-DM 2.0 e o roteiro resultante. Desde a22 de junho de 2011, o site redireciona para uma página no site da IBM dedicada ao SPSS.