
Nesta aula abordamos uma introdução geral sobre o curso e o que vamos aprender.
Nesta aula trazemos dicas importantes para melhor aproveitamento da Udemy.
Nesta aula abordamos alguns requisitos para o curso e algumas recomendações de conteúdos gratuitos para você aprimorar seus conhecimentos, tirando um melhor proveito do curso.
Nesta aula abordamos uma revisão rápida sobre SQL.
Nesta aula abordamos uma revisão sobre Python.
Nesta aula revisamos o PySpark.
Nesta aula entendemos a função de uma pessoa engenheira de dados.
Nesta aula abordamos a explicação teórica do que é um Data Lake.
Nesta aula abordamos a teoria do projeto que vamos criar no decorrer do curso.
Nesta aula abordamos a introdução do serviço da AWS.
Nesta aula abordamos a introdução da ferramenta Apache Airflow.
Nesta aula abordamos a introdução da ferramenta AWS S3.
Nesta aula abordamos a introdução da ferramenta AWS EMR.
Nesta aula abordamos a introdução da ferramenta Databricks.
Nesta aula abordamos a introdução da ferramenta AWS Glue.
Nesta aula abordamos a introdução da ferramenta Metabase.
Nesta aula abordamos a teoria do que são APIs.
Nesta aula abordamos a teoria do que são bancos relacionais.
Neste tutorial abordamos o passo a passo de criação de uma conta gratuita na AWS.
Nesta aula fazemos um overview geral do console da AWS.
Nesta aula abordamos a instação do Git.
Nesta aula abordamos a criação de uma instância do Apache Airflow localmente.
Lembrete!
Nesta aula configuramos localmente nossas credenciais da AWS.
Lembrete!
Neste tutorial abordamos o passo a passo de criação de uma conta gratuita no Databricks.
Lembrete.
Nesta aula abordamos a criação de um cluster Databricks.
Nesta aula criamos uma instância do Apache Airflow na nuvem AWS.
Neste artigo abordamos o passo a passo para liberação do acesso à UI do Apache Airflow.
Nesta aula abordamos a criação de um bucket S3.
Neste artigo abordamos um teste para validar o acesso configurado na aula anterior.
Nesta aula abordamos a API exemplo que vamos utilizar.
Nesta aula abordamos a criação de um banco de dados PostgreSQL exemplo.
Nesta aula abordamos a criação de um banco de dados MongoDB exemplo.
Neste artigo dou um recado sobre os buckets S3 utilizados no curso.
Lembrete.
Nesta aula vamos criar o código Python que extrai dados da API Pokémon.
Neste artigo vamos aprender a instalar o VSCode.
Nesta aula vamos abordar as configurações iniciais para permissionar o Apache Airflow conseguir utilizar o AWS EMR.
Lembrete!
Nesta aula vamos criar a dag de extração de dados da API do Pokémon, no Apache Airflow.
Nesta aula vamos testar a nossa dag de extração de dados da API do Pokémon.
Recado!
Nesta aula extra, abordamos um pouco como buscar logs no EMR.
Nesta aula vamos criar um código de extração de dados do banco de dados PostgreSQL.
Correção de trecho do código.
Recado!
Recado sobre o Secrets Manager.
Nesta aula criamos a dag de extração de dados do PostgreSQL.
Nesta aula testamos a dag de extração de dados do PostgreSQL.
Nesta aula criamos o código de extração de dados do MongoDB.
Nesta aula criamos a dag de extração de dados do MongoDB.
Nesta aula testamos a dag de extração de dados do MongoDB.
Nesta aula criamos o código de limpeza dos dados.
Nesta aula criamos a dag de limpeza de dados.
Nesta aula testamos a dag de limpeza dos dados.
GANHE DESCONTO!!! ADICIONE ?referralCode=4FF45AC2F99EAF908C9F&couponCode=INSTRUTOR17 na URL do curso no navegador após a última / (se tiver algo depois dela apague), dê enter e garanta no preço mínimo com indicação do instrutor.
Engenharia de Dados: Aprenda a Criar um Data Lake do Zero!
Esse não é um curso de teoria. Aqui você vai construir um Data Lake completo do zero, passo a passo, usando as ferramentas mais utilizadas no mercado.
Ao longo do curso, você vai:
Aprender os fundamentos essenciais:
Revisar rapidamente SQL, Python e PySpark.
Entender o papel do(a) Engenheiro(a) de Dados no mercado.
Projetar seu Data Lake:
Compreender o conceito de Data Lake e como planejar seu projeto de dados.
Conhecer e configurar as ferramentas do mercado:
Aprender a usar AWS, S3, EMR, Databricks, Apache Airflow, Glue, Athena e Metabase.
Configurar o ambiente de desenvolvimento e nuvem:
Criar conta na AWS e configurar credenciais locais.
Criar conta e cluster no Databricks.
Subir uma instância do Apache Airflow local e na AWS (MWAA).
Criar um bucket S3 para armazenar seus dados.
Construir pipelines de dados na prática:
Camada Bronze: extrair dados de APIs, PostgreSQL e MongoDB.
Camada Silver: limpar e padronizar os dados com PySpark e Python.
Camada Gold: curar e transformar os dados para consumo final.
Catalogar e consultar os dados:
Criar catálogo no AWS Glue e consultar dados usando Athena.
Visualizar dados e criar dashboards:
Subir uma instância do Metabase na AWS.
Conectar o Metabase ao seu Data Lake para criar dashboards e gráficos profissionais.
Tudo isso de forma direta ao ponto e sem enrolação, construindo na prática cada etapa — da extração até a visualização.
No final do curso, você terá um projeto completo em nuvem, pronto para ser usado como portfólio ou aplicado no dia a dia de trabalho como Engenheiro(a) de Dados.
Se você quer aprender fazendo, construindo cada parte do Data Lake na prática, esse curso é para você.