Diplomado en Análisis de Datos
Big Data
100% clases en vivo
OBJETIVOS
Generales:
- Describir Datos: Resumir y presentar datos de manera comprensible, usando estadísticas descriptivas como medias, medianas, modas, y desviaciones estándar.
- Descubrir Patrones: Identificar tendencias, relaciones y patrones en los datos que pueden no ser obvios a simple vista.
- Hacer Predicciones: Usar modelos estadísticos o de aprendizaje automático para predecir futuros.
Específicos:
- Entender la problemática de gestión del big data y sus especificidades.
- Identificar las características más relevantes en la gestión de datos que deben guiarla elección de una solución arquitectónica.
- Conocer el paradigma de datos abiertos.
- Practicar con las principales herramientas de gestión de big data que hay actualmente en el mercado (Hadoop, MongoDB, Neo4J, GraphDB, Spark, etc.).
- Entender cuándo un problema empresarial puede ser formalizado como un problema de aprendizaje automático (Machine Learning).
- Identificar los modelos estadísticos o de aprendizaje automático (Machine Learning) más adecuados para un problema dado.
- Saber efectuar el pre-proceso de los datos (sean estructurados o no estructurados).
- Saber evaluar la tasa de acierto de los modelos propuestos.
- Adquirir conocimientos específicos sobre el uso de big data para la toma de decisiones en la empresa.
- Identificar las buenas prácticas en la aplicación de big data para la creación de un negocio.
- Emplear herramientas de modelización de negocio.
- Conocer los principios económicos, éticos y legales del funcionamiento de una empresa.
La Big Data presenta nuevos desafíos para las organizaciones en dos aspectos tecnológicos principales: la gestión y el análisis de los datos. Desde el punto de vista de la gestión, el big data requiere tanto nuevas arquitecturas (principalmente basadas en cloud computing y la gestión distribuida de los datos y la memoria) como nuevos modelos de datos (como los documentos grafs, key-value o streams). Desde el punto de vista del análisis, hay que considerar nuevos tipos de datos semi-estructurados o no estructurados (como texto o imagen), que hoy en día representan una fracción importante de los nuevos datos que se generan. Además, hay que adaptar las técnicas de análisis tradicionales a las características del big data, y esto complica la preparación, el entrenamiento y la validación de los modelos.
CONTENIDO DEL PROGRAMA
Módulo I:
Introducción al Análisis de Datos
Módulo II
Conceptos básicos y definición de análisis de datos.
Módulo III
Importancia y aplicaciones del análisis de datos en diferentes industrias.
Módulo IV:
Tipos de datos: estructurados y no estructurados.
CLASES EN VIVO
lunes y miércoles de 6.30 pm a 9:30pm