
Esteja preparado para o exame de certificação Databricks Data Engineer Associate.
Preparei um excelente material com aulas práticas + Material para Download e explicações detalhadas além de links de referências para estudo que estão disponíveis para prepará-lo para o exame real
Após passar por estes conteúdos, você estará pronto para fazer o exame de certificação.
Temas Abordados
Os testes práticos abrangem os seguintes tópicos do exame com explicações detalhadas:
1. Plataforma Databricks Lakehouse
Arquitetura e benefícios do Data Lakehouse
Espaço de trabalho de Ciência e Engenharia de Dados (clusters, notebooks, armazenamento)
Delta Lake (criação e gerenciamento de tabelas, otimizações, logs e transações)
Histórico e restauração de versões de tabelas
2. Otimização e Governança
Optimize e otimização preditiva
Limpeza de tabelas (Vacuum)
Controle de metadados e schemas avançados
Criação de tabelas particionadas
Create Table As Select (CTAS)
Tipos e usabilidade de Views
3. Pipelines ETL com Spark SQL e Python
Criação e manipulação de bancos de dados, tabelas e visualizações
Processos de ELT (limpeza, remodelagem e combinação de tabelas)
SQL
Integração PySpark + Spark SQL (strings, fluxo de controle, troca de dados)
4. Processamento de Dados em Streaming
Conceitos de streaming estruturado (gatilhos, marcas d’água)
Auto Loader (carga incremental em fluxo contínuo)
Arquitetura multi-hop (bronze, prata, ouro)
Delta Live Tables (recursos e benefícios)
5. Pipelines de Produção e Visualização
Criação e agendamento de Jobs no Databricks
Orquestração de tarefas
Criação de painéis SQL (endpoints, alertas, agendamento, atualização)
projeto prático
6. Segurança e Boas Práticas
Permissões e privilégios de objetos de dados
Boas práticas de governança no Unity Catalog