Un curso de ingeniería de dato online completo y enfocado en el actual mercado laboral.
Durante el curso de data engineer abordaremos los principales temas y habilidades más demandados por las empresas y organizaciones.
Este módulo se centra en las mejores prácticas para organizar y compartir código Python de manera eficiente y colaborativa. Se explorará la creación de paquetes reutilizables, la gestión de dependencias y el uso de Git y plataformas como para el control de versiones y el trabajo en equipo, habilidades esenciales para cualquier ingeniero de datos.
Este módulo aborda las técnicas y principios para diseñar esquemas de bases de datos y estructuras de almacenamiento que optimicen el rendimiento, la escalabilidad y la facilidad de análisis de los datos.
Se explorarán desde el modelado relacional hasta el dimensional, incluyendo consideraciones para datos no estructurados y semi-estructurados, preparando al estudiante para construir sistemas de datos robustos y eficientes.
Este módulo proporciona una inmersión profunda en el mundo de las bases de datos NoSQL, explorando sus diferentes paradigmas, casos de uso y las ventajas que ofrecen frente a las bases de datos relacionales tradicionales en escenarios de Big Data y alta disponibilidad.
Se analizarán las principales tecnologías NoSQL, sus modelos de datos y cómo interactuar con ellas, preparando al estudiante para seleccionar e implementar la solución de almacenamiento adecuada para cada necesidad.
Este módulo se enfoca en las arquitecturas y tecnologías necesarias para procesar datos a medida que se generan, permitiendo análisis y respuestas casi instantáneas.
Se explorarán los principios del procesamiento de streaming, las plataformas de mensajería en tiempo real y los frameworks para construir pipelines de datos que manejen grandes volúmenes de eventos con baja latencia, habilitando casos de uso críticos como la detección de anomalías o la personalización en tiempo real.
Este módulo profundiza en las arquitecturas y herramientas que permiten procesar y analizar volúmenes masivos de datos aprovechando la potencia de múltiples máquinas en paralelo.
Se explorarán los conceptos fundamentales del procesamiento distribuido, desde el modelo MapReduce hasta los frameworks modernos que facilitan la computación a escala, preparando al estudiante para diseñar e implementar soluciones eficientes para el Big Data.
Este módulo proporciona una visión integral de las diversas tecnologías de almacenamiento de datos, desde las bases de datos tradicionales hasta los sistemas distribuidos y soluciones en la nube.
Se explorarán las características, ventajas y desventajas de cada tecnología, así como sus casos de uso óptimos, permitiendo al estudiante tomar decisiones informadas sobre cómo almacenar eficientemente diferentes tipos de datos para su posterior procesamiento y análisis.
Este módulo se centra en el diseño e implementación de pipelines de datos utilizando los servicios nativos y las mejores prácticas de las principales plataformas de nube (AWS, Google Cloud, Azure).
Se explorará cómo aprovechar la escalabilidad, la elasticidad y la gestión de recursos de la nube para construir flujos de ingesta, procesamiento y almacenamiento de datos robustos, eficientes y coste-optimizados, tanto en batch como en streaming.
Este módulo proporciona una introducción esencial a los conceptos, algoritmos y flujos de trabajo de Machine Learning (ML) y Deep Learning (DL), con un enfoque en cómo el Data Engineering soporta y habilita estas disciplinas.
Se cubrirán los tipos de aprendizaje, las etapas clave en la construcción de modelos y la importancia de la preparación y gestión de los datos para entrenar y desplegar soluciones de inteligencia artificial.
Este módulo explora las prácticas y la cultura de MLOps (Machine Learning Operations), unificando el desarrollo de modelos de Machine Learning con las operaciones de producción.
Se enfoca en cómo los principios del Data Engineering, DevOps y Data Science se combinan para construir, desplegar, monitorear y mantener modelos de ML de manera fiable y eficiente en entornos de producción, asegurando la escalabilidad y la gobernanza del ciclo de vida del ML.
Este módulo introduce los conceptos, principios y patrones de diseño de la arquitectura de microservicios, contrastándolos con las arquitecturas monolíticas.
Se explorará cómo los microservicios permiten la construcción de sistemas distribuidos, escalables y resilientes, así como las implicaciones en la gestión de datos, la comunicación entre servicios y la infraestructura de despliegue, elementos cruciales para que un ingeniero de datos pueda interactuar y contribuir eficazmente en entornos modernos.
Como culminación del máster de data engineering, desarrolla un proyecto que integrará todos los conocimientos adquiridos siempre con la tutela de los profesores del máster de data engineering demostrando tu competencia en ingeniería de datos.
Este programa está diseñado para ofrecerte una formación completa y práctica preparándote para enfrentar los desafíos como ingeniero de datos.
*NTIC Master se reserva el derecho de modificar, suprimir y actualizar el programa del máster.