Curso de Analítica Predictiva y Minería de Textos con RapidMiner y CRIPS-DM

El objetivo del curso es transmitir a los interesados las bases conceptuales y practicas (complementadas con casos de uso) de los procesos de Analitica Predictiva y Mineria de Textos utilizando la plataforma de Mineria de Datos RapidMiner y la metodologia CRISP-DM sobre datos estructurados y no estructurados.

El Análisis Predictivo o Minería de Datos, es el proceso de seleccionar, explorar, y modelar grandes volúmenes de datos que develen información previamente desconocida para beneficio del negocio. Dicho en otras palabras, es descubrir por medio de un proceso cíclico nuevas correlaciones, patrones y tendencias significativas, filtrando y depurando grandes volúmenes de datos, utilizando técnicas de reconocimiento de comportamiento, así como modelos matemáticos y estadísticos.

Descargue el silabo del curso:

El análisis predictivo permite mejorar el conocimiento del negocio tal como el comportamiento de los clientes, empleados, pacientes, estudiantes y ciudadanos. Los dominios de aplicación pueden estar en empresas comercializadoras, de producción, finanzas, energía, gobierno, etc.

De otro lado la minería de textos es el proceso para descubrir conocimiento almacenado en documentos (datos no estructurados). Comprende las siguientes actividades fundamentales: Clasificación de documentos para la asignación automática a clases pre-definidas; Agrupamiento de documentos para la identificación de documentos similares; Recuperación de información (similar a un buscador); Extracción de la información incluida en esos textos (hechos); y Extracción de asociaciones entre los hechos extraídos.

Un modelo predictivo se compone de un número de predictores, que son factores variables que pueden influir en el comportamiento o resultados futuros. En la comercialización, por ejemplo, el genero de un cliente, la edad, su ingreso medio y el historial de compras podrían predecir la probabilidad de una futura venta.

En modelos de predicción, se recopilan los datos para los indicadores relevantes, se formula un modelo estadístico, se hacen las predicciones  y se valida el modelo con los datos adicionales que estén disponibles. El modelo puede emplear una ecuación lineal simple, series de tiempo, arboles de decision, clustering  o una red neuronal compleja, trazada por software sofisticado.

Otras aplicaciones de los modelos de predicción incluyen adicionalmente al modelo de comercializacion anterior son:

  1. Gestión de relaciones con clientes (CRM)
  2. Planificación de capacidad
  3. Gestión del cambio
  4. Recuperación de desastres
  5. Gestión de la seguridad
  6. Aplicaciones de  ingeniería
  7. Meteorología
  8. Planificación de la ciudad.

*

Como se habia mencionado en los procesos de Prediccion es muy importante la herramienta de procesamiento que facilita la implementacion del modelo. RapidMiner es una herramienta de Minería de Datos ampliamente usada y probada a nivel internacional en aplicaciones empresariales, de gobierno y academia. Implementa más de 500 técnicas de pre-procesamiento de datos, modelación predictiva y descriptiva, métodos de prueba de modelos, visualización de datos, etc.

Rapid-i, con base en Dormunt – Alemania, nació en 2006 como Spin-Off de la Universidad de Dortmund, donde se inauguró la primera versión del software en 2001.

RapidMiner ha sido utilizada en más de cuarenta países y en compañías como Ford, Honda, E.ON, Nokia, IBM, Cisco, Hewlett Packard, Elexso, Akzo Nobel, PharmaDM, Bank of America, Merrill Lynch, entre muchas otras.

En la encuesta anual (2010) del prestigioso portal internacional de Minería de Datos KDnuggets (www.KDnuggets.com), RapidMiner obtuvo el primer lugar como la herramienta de Data Mining más utilizada (37.8%) en el mundo. El liderazgo de RapidMiner se ha mantenido en forma consistente y creciente desde el año 2007

 

De otro lado la metodologia de modelamiento CRISP-DM , de Cross Industry Standard Process for Data Mining.1 Se trata de un modelo de proceso de minería de datos que describe los enfoques comunes que utilizan los expertos en minería de datos. Encuestas realizadas en 2002, 2004 y 2007 muestran que es la principal metodología utilizada para esta tarea.

Fases principales

CRISP-DM divide el proceso de mineria de datos en seis fases principales.

  • Comprensión del negocio
  • Comprensión de Datos
  • Preparación de datos
  • Modelado
  • Evaluación
  • Despliegue
Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s