Udemy
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
Turn what you know into an opportunity and reach millions around the world.
Learn More
Your cart is empty.
Keep shopping
Docker Engenharia de Dados Com Apache Spark
Rating: 4.7 out of 5(21 ratings)
494 students

Docker Engenharia de Dados Com Apache Spark

DOCKER Completo do Zero ao Avançado
Last updated 2/2026
Portuguese

What you'll learn

  • Engenheiros de Dados iniciantes ou em transição
  • Analistas de Dados
  • Profissionais que querem aprender Docker aplicado a dados
  • Prepararação para o mercado de trabalho

Course content

12 sections62 lectures8h 21m total length
  • Sobre o curso2:52
  • Objetivo do curso2:46
  • Recomendações - O que preciso para continuar4:43
  • Material Para Download2:44
  • Recomendaçoes e Avaliação do Curso2:03
  • Extraindo o máximo do curso5:17

Requirements

  • Noções básicas de programação

Description

Do Zero à Prática

Este curso foi criado para profissionais e estudantes da área de dados que querem aprender Docker de forma prática, aplicando a tecnologia em ambientes reais de engenharia de dados.

Aqui o Docker não é tratado de forma genérica.
Ele é usado como ferramenta para criar, padronizar e executar pipelines de dados, rodando Apache Spark em containers, integrando com storages S3, Azure Storage e PostgreSQL, e finalizando com deploy em servidor VPS real.


O Que Você Vai Aprender

  • Fundamentos de Docker aplicados à engenharia de dados

  • Diferenças práticas entre containers e máquinas virtuais

  • Criação de ambientes com Docker Desktop, Dockerfile e docker-compose

  • Uso de Docker integrado ao VSCode para produtividade

  • Fundamentos de Linux aplicados a containers

  • Execução de Apache Spark em containers

  • Uso de spark-submit em ambiente distribuído

  • Integração do Spark com MinIO (S3)

  • Integração do Spark com Azure Storage (Azurite)

  • Leitura e escrita de dados do Spark para PostgreSQL via JDBC

  • Versionamento e publicação de imagens no Docker Hub

  • Execução de projetos em VPS real

  • Simulação de ambientes DEV e PROD

Objetivo do Curso

Capacitar você a criar ambientes completos de dados usando Docker, desde o desenvolvimento local até a simulação de produção, com foco em:

  • Padronização de ambientes de dados

  • Execução de jobs Spark em containers

  • Integração com múltiplas fontes de dados

  • Organização de projetos de engenharia de dados

  • Simulação de cenários reais de mercado


Integrações de Dados

Você irá trabalhar com:

  • MinIO (S3 compatível) para data lake local

  • Azure Storage (Azurite) simulando cloud

  • PostgreSQL como banco relacional

  • Integração completa entre Spark, storage e banco

Resultado Final

Ao concluir este curso, você será capaz de:

  • Criar ambientes de dados completos com Docker

  • Rodar pipelines Spark em containers

  • Integrar múltiplas fontes de dados

  • Trabalhar com padrões usados no mercado

  • Levar projetos de dados do local para produção

Who this course is for:

  • Interesse em dados e engenharia de dados
  • Não é necessário conhecimento prévio em Docker