los Cruz-industria de procesos estándar para la minería de datos (CRISP-DM) Es el marco de proceso de minería de datos dominante. Se trata de una cualquiera de normas abiertas puede utilizarlo. La siguiente lista describe las distintas fases del proceso.

  • La comprensión de negocios: Obtener una comprensión clara del problema que está fuera de resolver, cómo afecta a su organización y sus objetivos para abordarlo. Las tareas en esta fase son:

  • La identificación de sus objetivos de negocio

  • La evaluación de su situación

  • La definición de sus objetivos de minería de datos

  • Producir el plan del proyecto

  • La comprensión de los datos: Revise los datos que usted tiene, documentarlo, identificar a la gestión de datos y los problemas de calidad de datos. Tareas para esta fase son:

    • Reuniendo datos

    • Describiendo

    • Explorar

    • Verificación de la calidad

    • Preparación de datos: Obtener los datos listos para usar para el modelado. Tareas para esta fase son:

      • Selección de los datos

      • Limpieza de datos


      • Construcción

      • Integración

      • Formateo

      • Modelado: Utilice técnicas matemáticas para identificar patrones en los datos. Tareas para esta fase son:

        • Selección de las técnicas

        • Pruebas de Proyectos

        • La construcción de modelos

        • La evaluación de los modelos

        • Evaluación: Revise los patrones que has descubierto y evaluar su potencial para uso empresarial. Tareas para esta fase son:

          • La evaluación de los resultados

          • Revisar el proceso

          • Determinar los próximos pasos

          • Despliegue: Ponga sus descubrimientos a trabajar en el negocio todos los días. Tareas para esta fase son:

            • Despliegue Planificación (sus métodos para integrar los descubrimientos de minería de datos en uso)

            • Reporte los resultados finales

            • Revisión de los resultados finales