PENTAHO PDI e APACHE SUPERSET: ETL e visualização de dados
What you'll learn
- PENTAHO PDI: O que é o Pentaho PDI
- PENTAHO PDI: Entendendo sobre fluxos de trabalho e pipelines
- PENTAHO PDI: Entendendo sobre projetos e ambientes
- PENTAHO PDI: Instalando o Pentaho PDI
- PENTAHO PDI: Criando pipelines com arquivos texto
- PENTAHO PDI: Realizando tratamento de dados para entendimento do processo de engenharia de dados
- PENTAHO PDI: O que são transformações, Jobs e ações dentro de um pipeline
- PENTAHO PDI: Construindo um workflow com Jobs, orquestrador da sequência das operações
- PENTAHO PDI: Entendendo os menus principais e o seu GUI e seus componentes
- PENTAHO PDI: Comp. pipelines: Sort, Select value, CSV file input, Value mapper, Filter rows, Dummy, Unique rows, Merge Join, Text File Output, Row Normaliser
- PENTAHO PDI: Entendendo como podem ser depurados os dados via output, logs
- PENTAHO PDI: Number Range, Concat Field, String Operations, Replace in String, IF Field Value is Null, Split Fields, CSV File Input, Mail, File Exist
- PENTAHO PDI: Leitura de dados em uma API: Rest Client, JSON Input, JSON Output
- PENTAHO PDI: Construindo Workflow com execução de pipelines
- PENTAHO PDI: Entendo o uso de variáveis globais no PENTAHO PDI
- PENTAHO PDI: Automatização de pipeline ou workflow
- PENTAHO PDI: Construindo pipelines em banco de dados Postgresql: Table Input, Table Output, Configurando conexão
- PENTAHO PDI: Instalação de banco de dados Postgresql, uso do PGAdmin
- PENTAHO PDI: Automatização de JOBs e Transformações com o Kitchen e Pan
- PENTAHO PDI: Construção do projeto de dados a sua escolha e correção com o uso do Pentaho PDI
- SUPERSET: Plataforma de exploração e visualização de dados criada com base no Apache Superset de código aberto
- SUPERSET: Permite a criação de gráficos e dashboards, permitindo a construção de visualização sem código
- SUPERSET: É possível executar uma análise mais profunda usando o editor SQL nativo
- SUPERSET: Permite a conexão com diversas fontes de dados como Data Warehouse, Data Lake, planilhas, tudo 100% na nuvem
- SUPERSET: Possui um ambiente fácil de usar, onde você cria uma workspace de trabalho e constrói seus projetos
- SUPERSET: Permite carregar seus dados de diversos bancos de dados e origens diferentes, acessando os dados de forma transparente
- SUPERSET: Permite a criação de gráficos (CHART) dos mais variados e com requisitos de filtros e ajustes de campos, podendo gerar novos atributos
- SUPERSET: Permite que você utilize o SQL LAB para explorar seus dados via SQL
- SUPERSET: Possui um fluxo de trabalho que organiza a construção das análises de dados
- SUPERSET: Preset - APACHE Superset é possível conectar seus dados, criar um conjunto de dados, criar gráficos, construir um painel e compartilhar seus insights
- SUPERSET: Possui um espaço de trabalho para armazenamento das informações a serem desenvolvidas
- SUPERSET: Permite a construção de gráficos diversos: tabela, setores, heatmap, treemap, box plot, linha, sunburst, dentre outros
- SUPERSET: Permite a construção de previsões utilizando técnicas como FORECAST
- SUPERSET: Permite a colaboração e compartilhamento de gráficos e dashboard
Requirements
- Importante ter conhecimento sobre banco de dados, arquivos de dados
- Importante que você conheça lógica de programação
- Conhecimento elementar de SQL
Description
Você é apaixonado por análise de dados e busca por uma ferramenta completa que possibilite criar dashboards dinâmicos e ter acesso a informações precisas em tempo real? Então, você não pode perder a oportunidade de realizar o curso de Pentaho PDI e Apache Superset!
Com essa solução incrível, você poderá integrar dados de diferentes origens e simplificar a gestão do processo de integração, além de criar gráficos, tabelas e mapas de forma simples e intuitiva. Com o Apache Superset, você terá acesso a um mundo de possibilidades para personalizar suas visualizações de dados de acordo com as necessidades da sua empresa ou projeto.
O curso de Pentaho PDI e Apache Superset irá te ensinar tudo o que você precisa saber sobre essas ferramentas fantásticas. Você aprenderá desde a instalação e configuração das ferramentas até a criação de dashboards avançados, utilizando recursos como drill-down, filtros e outras funcionalidades, tais como:
O Pentaho PDI é uma ferramenta ETL (Extract, Transform and Load) open source, que permite a integração de dados de diversas fontes em um ambiente centralizado. Suas principais funções são:
Extração de dados: permite extrair dados de diferentes fontes, como bancos de dados, planilhas e arquivos;
Transformação de dados: possibilita realizar transformações nos dados extraídos, tais como limpeza, enriquecimento e alteração de formatos;
Carregamento de dados: permite carregar os dados transformados em um ambiente centralizado, como um data warehouse ou um ambiente de análise de dados.
Já o Apache Superset é uma plataforma de visualização de dados, que permite criar dashboards interativos e personalizados. Suas principais funções são:
Criação de dashboards: possibilita criar dashboards personalizados com gráficos, tabelas e mapas;
Exploração de dados: permite explorar as informações presentes nos dashboards de forma intuitiva, utilizando recursos como drill-down e filtros;
Compartilhamento de informações: possibilita compartilhar as informações contidas nos dashboards com outras pessoas, garantindo que todos tenham acesso às informações relevantes.
Em conjunto, essas duas ferramentas oferecem uma solução completa para integração e visualização de dados, permitindo que as empresas possam tomar decisões mais assertivas e baseadas em informações precisas.
Com aulas teóricas e práticas, você poderá se capacitar e ampliar seus conhecimentos em análise de dados, tornando-se um especialista em integração de dados e visualização de informações. Não perca mais tempo e inscreva-se agora mesmo para realizar esse curso empolgante que vai mudar completamente a forma como você realiza a análise de dados!
Who this course is for:
- Estudantes e profissionais de computação, Informática, estatística, data science, analista de dados, engenheiro de dados
- Pessoas interessadas em aprender os conceitos sobre ferramentas de ingestão de dados, ou que gostariam adentrar na área de engenharia de dados
- Profissionais que, de alguma forma, utilizam dados no seu dia a dia
- Profissionais que desejam construir dashboards e gráficos
Instructor
Quem sou
Fui escolhido como um dos 50 profissionais mais influentes em dados no ano de 2023 pela Gama Academy, uma organização que estabelece um Rank dos profissionais com mais destaque na área de Dados/BI.
Por que estudar na área de dados comigo?
Sou profissional da área com diversos projetos desenvolvidos, tanto na área privada como na área pública, tenho um skill muito forte em atender meus alunos com alguma dúvida no máximo em 24 horas. Procuro alinhar conhecimento teórico e prático.
O que trago em meus cursos?
Acho que a área de dados é bem rica e vasta, mas ter um direcionamento do que deve ser estudado com cursos passo a passo é o que busco nas minhas aulas, fiz um mestrado na área de educação para criar aulas sob medida aos meus alunos. Estou diariamente aprimorando e trazendo novidades na área, afinal criar + de 150 cursos envolve dedicação e foco.
O que faço hoje
Sou professor das pós-graduações das universidades UNIFACS, CATÓLICA DO SALVADOR e ISL Wyden. Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC). Possui Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 20 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente sou editor do blog BI com Vatapá. Autor do Livro: BI COMO DEVE SER - professor EAD de diversos cursos de BI na Aprenda Virtual. Idealizador do BI PRO - O maior e mais completo conteúdo sobre BI da internet.