Udemy
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
Turn what you know into an opportunity and reach millions around the world.
Learn More
Your cart is empty.
Keep shopping
Data Lakehouse com Delta Lake, DuckDB e Azure Data Lake-Gen2
Rating: 4.7 out of 5(27 ratings)
304 students

Data Lakehouse com Delta Lake, DuckDB e Azure Data Lake-Gen2

Criando um Lakehouse de baixo custo com Python e SQL utilizando as tecnologias mais modernas do mercado.
Created byCharles Lima
Last updated 10/2024
Portuguese

What you'll learn

  • Projetar e implementar soluções de Lakehouse combinando Data Lakes e Data Warehouses.
  • Gerenciar e processar dados no Azure Data Lake de maneira segura e eficiente.
  • Implementar Delta Lake para garantir a confiabilidade e integridade dos dados.
  • Processar dados com DuckDB.
  • Criar um Data Lakehouse com Python e SQL.
  • Armazenamento no Azure Data Lake Storage Gen2.
  • Arquitetura Medalhão. (Bronze, Silver e Gold)

Course content

13 sections43 lectures4h 54m total length
  • Data Warehouse x Data Lake x Lakehouse12:04
  • Introdução ao DuckDB5:34
  • Material do curso0:54

Requirements

  • Lógica de programação em Python
  • Básico de SQL
  • Um PC com internet e no mínimo 8gb de Ram

Description

O curso Criando Lakehouse com Delta Lake, DuckDB e Azure Data Lake é projetado para profissionais de dados que desejam dominar o conceito de Lakehouse, combinando a flexibilidade dos Data Lakes com a estrutura e a performance dos Data Warehouses. Este curso aborda o uso de tecnologias de ponta, como Python, Delta Lake, DuckDB e Azure Data Lake, proporcionando uma compreensão profunda e prática das melhores práticas em gerenciamento de dados e análise avançada.


  1. Delta Lake:

    • Benefícios: Delta Lake é uma camada de armazenamento que traz confiabilidade ao Data Lake, oferecendo transações ACID, gerenciamento de tempo de dados e capacidade de escalabilidade. Ele permite a criação de pipelines de dados robustos e de alta performance, garantindo a integridade e a consistência dos dados ao longo do tempo.

  2. DuckDB:

    • Benefícios: DuckDB é um sistema de banco de dados embutido voltado para análise de dados. Sua arquitetura otimizada para consultas analíticas permite processamento de dados em memória com alta velocidade. Além disso, DuckDB pode ser facilmente integrado com Python, oferecendo uma solução poderosa e leve para análises complexas sem a necessidade de infraestrutura pesada.

  3. Azure Data Lake:

    • Benefícios: Azure Data Lake é um serviço de armazenamento em nuvem que oferece soluções escaláveis e seguras para o gerenciamento de grandes volumes de dados. Com integração nativa com outras ferramentas da Azure, ele facilita o processamento de dados em larga escala, permitindo análises mais rápidas e insights mais profundos. Além disso, Azure Data Lake garante a conformidade e a segurança dos dados armazenados.


Who this course is for:

  • Qualquer pessoa da área de dados que deseje aprender sobre Data Lakehouse