Ingeniería de datos con Apache Hadoop

Inicio:
29-01-2018 / 16:00
Fin:
08-02-2018 / 20:00
Horas:
32
Días:

lunes a jueves

Precio:
960€

La libreria de software Apache Hadoop es un framework que permite el procesamiento distribuido de grandes conjuntos de datos a través de clusters de ordenadores que utilizan modelos de programación simples. Está diseñado para pasar de servidores individuales a miles de máquinas, cada una ofreciendo computación y almacenamiento local. En lugar de depender de hardware para ofrecer alta disponibilidad, la libreria en sí está diseñada para detectar y controlar los errores en la capa de aplicación, por lo que entrega un servicio de alta disponibilidad a traves de un conjunto de ordenadores, cada uno de los cuales puede ser propenso a fallos.

Dirigido a:

Analistas y/o desarrolladores que se quieran implementar y analizar en las diferentes herramientas de Cloudera y Hadoop para el análisis de datos (HDFS, Hive, Pig, Impala,…).

Objetivos:

Al finalizar el curso el alumno habrá adquirido los conocimientos y la solvencia necesaria para capturar, manejar, almacenar, transformar, buscar y visualizar un conjunto de datos de gran volumen y complejidad y relacionarlos entre sí, para extraer información de valor a partir de ellos, mediante una solución Big Data de código abierto como Cloudera.

Contenidos:

Módulo 1: Fundamentos de SQL con PostgreSQL
    • Introducción.
    • Base de datos básica.
    • Estructura de base de datos.
    • El uso de SQL.
    • Creación de una base de datos.
    • Las consultas básicas.
    • Mantenimiento de la Base de datos.
    • Copia de tablas y modificaciones de columnas.
    • Índices y restricciones.
    • Eliminar o modificar filas de la tabla de datos.
    • Funciones: uso y tipos.
    • Funciones específicas.
    • Joins.
    • Exportación de datos, consultas y utilidades.
    • Importación de datos y de archivos de datos.
    • Importación con sentencias y utilidades.
    • Subconsultas generales y básicas.
    • Subconsulta no correlacionada y correlacionada.
    • Tipos de subconsultas.
    • Modificación de la tabla con subconsultas.
    • Motores de almacenamiento.
    • Creación de Vistas.
    • Transacciones.
    • Recuperación de Metadatos.
    • Conclusiones.

Módulo 2: Fundamentos de Cloudera Apache Hadoop
    • Acerca de Apache Hadoop.
    • Acerca de Cloudera.
    • La motivación para Hadoop.
    • Problemas con los sistemas tradicionales de gran escala.
    • Cómo Hadoop aborda estos desafíos.
    • HDFS: El sistema de ficheros distribuidos de Hadoop.
    • El funcionamiento de MapReduce.
    • Anatomía de un cluster Hadoop.
    • Aplicaciones comunes y usos especiales de la solución Hadoop.
    • El ecosistema Hadoop.
       - Almacenamiento de datos: Hbase.
       - Integración de datos: Flume y Sqoop.
       - Procesamiento de datos: Spark.
       - Análisis de los datos: Hive, Pig e Impala.
       - Exploración de datos: Cloudera Search.
    • Integración de Hadoop en el CPD.
    • Herramientas para gestionar Hadoop.
    • Planificación del proyecto.

Módulo 3: Análisis de Datos Big Data
    • Introducción a Pig.
    • Análisis de datos básico con Pig.
    • Procesado de datos complejos con Pig.
    • Operaciones con multiconjuntos de datos con Pig.
    • Troubleshooting y optimización de Pig.
    • Introducción a Hive e Impala.
    • Consultas con Hive e Impala.
    • Administración de datos.
    • Almacenamiento y datos de rendimiento.
    • Análisis de datos relacional con Hive y Impala.
    • Trabajo con Impala.
    • Análisis de texto y datos complejos con Hive.
    • Optimización de Hive.
    • Extensión de Hive.

Módulo 4: Cloudera Apache HBase
    • Introducción.
    • Introducción a HBase .
    • Conceptos básicos de HBase.
    • Administración de APIs HBase.
    • Acceso a datos con la API HBase, Parte 1.
    • Acceso a datos con la API HBase, Parte 2.
    • Arquitectura HBase, Parte 1.
    • Arquitectura HBase, Parte 2.
    • Instalación y configuración.
    • Diseño ROW KEY en HBase.
    • Diseño de Schemas en HBase.
    • Ecosistema HBase.
    • Conclusión.

Utilizamos cookies propias, analizando sus hábitos de navegación en nuestra página web, con la finalidad de garantizar la calidad, seguridad y mejora de los servicios ofrecidos a través de la misma. En los casos en que el usuario no manifieste expresamente si acepta o no la instalación de las cookies, pero continúe utilizando nuestra página web, se entenderá que éste ha dado su consentimiento, informándole expresamente de la posibilidad de bloquear o eliminar las cookies instaladas en su equipo mediante la configuración de las opciones del navegador. Para saber más sobre las cookies, su uso y eliminación, ver política de cookies.

Acepto las cookies para estes sitio.

EU Cookie Directive