Sábado, 30 de noviembre de 2019, de 09.00 a 14.00 hs Horario de Ohio (US)
Webinar en español
Varias sesiones.
Curso Online en formato webinar con el profesor.
Se dará una certificación al final del mismo si se superan las pruebas.
Inicio del curso previso para el sábado 30 de noviembre 2019.
Se irán coordinando fechas con los alumnos.
Puede ser que el curso se atrase.
ANÁLISIS EXPLORATORIO DE DATOS
Explorar los datos mediante técnicas de la estadística y Visualización.
1. Instalación de SPARK, PYSPARK en modo Local, Azure cloud.
2. Importación de datos y tipos de Fuentes de datos en Pyspark
3. Metodología para proyectos de Analytics como CRISP, SEMMA.
4. Tipos de datos, Estadística descriptiva,Correlaciones, Missing, Outliers.
5. Visualización de datos
MACHINE LEARNING
El tercer módulo, tiene como objetivo, desarrollar modelos predictivos usando algoritmos de machine learning en ambientes Big Data como es PySpark
1. PYSPARK, ÁRBOLES DE DECISIÓN, ENSAMBLE, SELECCIÓN DE VARIABLES, BAYES, REGRESIÓN LOGÍSTICA, REDUCCIÓN DE DIMENSIONALIDAD.
2. CLUSTERING, WORD2VECT, SISTEMAS DE RECOMENDACIÓN
3. REDES NEURONALES, Validación, Presentación de Resultados y Propuesta de A/B Testing.