Tarea 3 curso 23-24
Tarea online BDA03.
Título de la tarea: Almacenamiento y procesamiento en Hadoop.
Curso de especialización y módulo: Especialización en Inteligencia Artificial y Big Data - Big Data Aplicado
¿Qué contenidos o resultados de aprendizaje trabajaremos?
Resultados de aprendizaje
- RA5.Valida las técnicas de Big Data para transformar una gran cantidad de datos en información significativa, facilitando la toma de decisiones de negocios.
Contenidos
- Introducción al ecosistema Hadoop.
- Componentes de acceso y procesamiento de datos.
- Apache Pig.
- Apache Hive.
- Conceptos generales.
- Arquitectura.
- HQL.
- Apache Impala.
- Apache HBase.
- Apache Phoenix.
- Apache Spark.
- Arquitectura y componentes.
- Detalle de los componentes de Apache Spark.
- Ventajas y desventajas.
- Componentes de ingesta de datos y flujos de trabajo.
- Apache Sqoop.
- Apache Flume.
- Apache Oozie.
- Interfaces y herramientas de trabajo.
- Hue.
- Apache Zeppelin.
- Apache Ambari y Cloudera Manager.
- Procesamiento en streaming: Apache Spark (Structured Streaming), Apache Flink y Apache Storm.