Curso práctico de Big Data con Hadoop y Spark desde cero
What you'll learn
- Las principales tecnologías Big Data para aprender y mejorar tu currículum
- Crear aplicaciones con Spark, el framework de desarrollo más utilizado del mundo Big Data.
- Crear aplicaciones para procesar Big Data utilizando las principales herramientas del ecosistema Hadoop
- Almacenar grandes volúmenes de datos con HDFS
- Procesar grandes volúmenes de datos con MapReduce
- Procesar grandes volúmenes de datos en tiempo casi real con Spark
- Acceder a las herramientas del clúster mediante el interface Hue o la linea de comandos
- Volcar datos al clúster usando Sqoop
- Trabajar con datos estructurados en Hive
- Hacer consultas SQL interactivas con Impala
- Planificar los trabajos del clúster con Oozie
- Para qué sirve un gestor de recursos del clúster como YARN
Requirements
- Ordenador de 64 bits con más de 8GB de RAM, capaz de ejecutar máquinas virtuales. En caso de que tu ordenador no cumpla estos requisitos podrías seguir el curso pero sin realizar las prácticas
- Acceso a Internet y poder descargar ficheros grandes
- Es recomendable cierta experiencia previa en programación, especialmente con Python y algo de Java, para seguir algunas de las prácticas
- Es recomendable, aunque no imprescindible, cierta familiaridad con la linea de comandos de Linux
Description
Este curso te dará una visión amplia, clara y práctica de todas las tecnologías que necesitas para introducirte en el mundo big data. Explicaremos cada una de ellas y haremos prácticas para que entiendas cómo encajan entre sí a la hora de construir una solución completa que resuelva problemas reales.
Los perfiles big data están entre los más buscados y mejor pagados del mercado y este curso es la introducción ideal para empezar en este campo apasionante y darle un impulso a tu carrera.
Veremos las principales tecnologías relacionadas con Hadoop (HDFS, MapReduce, YARN, Spark, Hive, Impala, Pig, Oozie, Sqoop, etc.) y con Spark, el framework de desarrollo más utilizado en el mundo Big Data por su gran velocidad de procesamiento.
Hemos seleccionado cuidadosamente todo lo que necesitas saber para introducirte rápidamente en el mundo Big Data. Nuestra experiencia en formación y en desarrollo de este tipo de proyectos para grandes empresas nos ha permitido diseñar el curso teniendo en cuenta lo que necesitan conocer los profesionales y lo que demanda el mercado.
El curso incluye diversos casos y prácticas que, además de permitir poner en práctica lo aprendido, sirven como introducción a problemas y situaciones del mundo real.
Al terminar el curso serás capaz de:
Crear aplicaciones y analizar datos usando las tecnologías más importantes del mundo Big Data: Hadoop, Hive, Impala, Pig, Sqoop, Oozie, etc.
Crear aplicaciones con Spark, un framework de desarrollo que es cada vez más utilizado en el mundo Big Data.
Instalar una máquina virtual en tu ordenador y practicar con un clúster virtualizado muy similar al que te vas a encontrar en la mayoría de las empresas que utilizan big data
Iniciar un portfolio de proyectos similares a los que te encontrarás en el mundo real, con código que podrás utilizar para tus propios proyectos
En el curso hablaremos de algunos aspectos relevantes de la configuración de un clúster aunque no se incluye la instalación del mismo desde cero ya que el curso está orientado a ingenieros de software, desarrolladores y consultores más que a administradores de sistemas.
Who this course is for:
- Ingenieros de software y programadores que quieran conocer las principales tecnologías Big Data, basadas en Hadoop y Spark, para procesar grandes volúmenes de información
- Analistas y administradores de bases de datos que quieran entender la diferencia entre las tecnologías Big Data y las tecnologías tradicionales
- Responsables de proyectos que quieran entender los conceptos técnicos fundamentales de las tecnologías Big Data
- Arquitectos, administradores o responsables de sistemas de información que necesitan entender las piezas que forman parte de un clúster Big Data
- En general, perfiles técnicos que quieran mejorar sus perspectivas laborales iniciando una carrera como ingenieros o arquitectos Big Data
Instructor
Laura tiene más de 10 años de experiencia en desarrollo y consultoría IT. Gran parte de ellos liderando proyectos de big data y machine learning para grandes empresas, en especial para bancos como Santander y BBVA. Ha desempeñado diferentes roles como desarrolladora, arquitecta de soluciones y manager de proyectos.
Su experiencia técnica junto a su conocimiento del mercado, le permiten crear este tipo de cursos adaptados a lo que los profesionales necesitan.
Laura es ingeniera y tiene un máster en ciencia de datos.