COLEGIO OFICIAL GRADUADOS EN INGENIERIA DE LA RAMA INDUSTRIAL E INGENIEROS TÉCNICOS INDUSTRIALES DE ALAVA
ARABAKO INDUSTRIA ADARREKO INGENIARITZAKO GRADUDUNEN ETA INGENIARI TEKNIKO INDUSTRIALEN ELKARGO OFIZIALA
CURSO PRACTICO AVANZADO: INTELIGENCIA ARTIFICIAL CON RAPIDMINER
Objetivo:
En este curso se ahondaran en los conceptos de analítica avanzada, en base a la plataforma RapidMiner, que permite genera modelos de forma visual sin necesidad de conocimientos en programación, en casos ya reales de aplicación, y con modelos complejos de análisis.
Programa:
Tema 1: ETL y Calidad de los Datos.
- Conocer las diferentes librerías que facilitan las tareas de ETL dentro de la plataforma RapidMiner
- Aprender a capturar datos provenientes de diferentes fuentes y formatos (ficheros planos, bases de datos, scraping-web, redes sociales, dropbox, etc...)
- Aprender a tratar con tipos de datos especiales, fechas, lenguaje natural, expresiones regulares, xml, json, xpath...
- Aprender a trabajar con atributos (renombrar, cálculos, metadatos, transformaciones, trasposiciones, binomización, discretización, eliminación de atributos no relevantes, resolución de "missing values", ....)
- Aprender a trabajar con ejemplos (filtros, modificaciones, concatenaciones, agregaciones, pivotados, operaciones, agrupaciones, uniones y generación de dataset final)
- Aprender a detectar problemas en la calidad de los datos y modelado de la cuantificación de las dimensiones en la calidad de los datos.
- Metodología de control y generación del cuadro de mando en la calidad de los mandos, visualizaciones gráficas, y estadístico general de calidad de dato.
- Detección de outliers por métodos analíticos.
- Análisis previo de potencia estadística, potencia predictiva, y primeras investigaciones sobre la convergencia de los datos (pca, svd, correlación y clustering), y ajuste sobre las hipótesis previas de necesidades funcionales del negocio.
Tema 2: Metodología CRISP-DM: Cómo abordar un proyecto de analítica predictiva y su metodología
- Objetivos de Negocio
- Objetivos Funcionales
- Calidad de los Datos
- Problemas y Resolución
- Desarrollo de los Modelos
- Evaluación
- Despliegue
Tema 3: Modelado no Supervisado complejo
- Clústering Básico
- Clústering Jerárquico
- Optimizaciones con Algoritmos Genéticos
- Clústering SOM
- Metodología de aplicación y modelos escalados y jerarquía
Tema 4: Modelado Supervisado complejo
- Modelado Básico
- Boosting, Bagging, Vote....
- Modelado Jerárquico en Escala
- DeepLearning
- ProcessMining
Tema 5: Lenguaje Natural
- Análisis del Corpus
- Aplicación del Corpus en modelos supervisados y no supervisados
- Caso de uso; Buscadores, Chatbots, etc...
- Iniciación a la semántica.
Datos Generales
- Ponente: Aitor Moreno Fernandez de Leceta
- Fecha: 14,15,16,21,22 y 23 de mayo
- Horario: 17:30 a 20:30
- Precio Matrícula: 175 € Col (145 € no col) y 220 € externos.
Inscripciones