Objetivos:
Apropiar los conceptos fundamentales, técnicas básicas, herramientas de software y aspectos metodológicos propios de la Minería de Datos.
Contenido:
- Conceptos de Aprendizaje Automático.
- Técnicas, algoritmos, metodología y software para la predicción a partir de evidencia digital.
- Aspectos metodológicos propios de la Minería de Datos.
Metodología:
Clases sincrónicas teórico-prácticas, con ejercicios y con asistencia de herramientas específicas sobre máquinas.
Requisitos previos:
- Los asistentes deben haber aprobado el curso de Análisis y visualización de datos o poseer un conocimiento equivalente.
- Acceso a PC.
Herramientas:
- Planilla de cálculo (Excel o Google Sheets)
- Weka (https://www.cs.waikato.ac.nz/ml/weka/downloading.html)
- Orange (https://orangedatamining.com)
Nucleos temáticos y programa:
Objetivos específicos: Introducción a la inducción y la predicción a partir de evidencia digital.
Clases 1-2: Predicción basada en evidencia digital. Ejercicio de inducción. Introducción a la Inteligencia Artificial y el Aprendizaje Automático. Introducción a Weka.
Clases 3-4: Inducción de árboles de decisión. Metodología básica para la inducción de modelos predictivos. Práctica de J48 en Weka. Técnicas de validación de modelos. Concepto de sobreajuste.
Clases 5-6: Introducción a las probabilidades Bayesianas. Modelos probabilísticos de predicción. Práctica de Validación de modelos. Práctica de Naive Bayes en Weka.
Clase 7-8: Métodos de predicción basados en semejanza. Concepto de distancia y semejanza. Práctica de IBK en Weka.
Objetivos específicos: Práctica de proyecto de Data Mining. Técnicas avanzadas.
Clase 9: Formulación de proyectos para desarrollo de modelos predictivos. Preparación de dataset. Presentación de TF.
Clase 10: Presentación de Orange.
Clase 11: Introducción al ensamble de modelos y metaalgoritmos. Desarrollo de experimentos.
Clase 12: Práctica de ensamble de modelos.
Clase 13: Predicción de variable continua. Métodos de regresión.
Clase 14: Práctica de modelos de regresión.
Clase 15: Introducción al Aprendizaje No Supervisado. Ejemplos de métodos de Clustering.
Clase 16: Presentación de TF por parte de los participantes.
Evaluación:
Asistencia al 80% de las clases sincrónicas.
Elaboración del 80% de los ejercicios entregados en clase.
Aprobación del trabajo final.
Con certificación universitaria.