Apache Hop e Data Factory: Integração de Dados Simplificada
What you'll learn
- O que é Hop Orchestration Platform
- Entendendo sobre fluxos de trabalho e pipelines
- Entendendo sobre projetos e ambientes
- Instalação do APACHE HOP
- Criando pipelines com arquivos texto
- Realizando tratamento de dados para entendimento do processo de engenharia de dados
- O que são transformações, links e ações dentro de um pipeline
- Construindo um workflow, orquestrador da sequência das operações
- Entendendo o HOP GUI e seus componentes
- Entendendo menu barras, principal e perspectivas
- Criando sua área de projetos
- Componentes pipelines: Sort, Select value, CSV file input, Value mapper, Filter rows, Dummy, Unique rows, Merge Join, Text File Output
- Entendendo o que é : View output, Preview output , Debug output
- Componentes pipelines: Number Range, Concat Field, String Operations, Replace in String, IF Field Value is Null, Split Fields, CSV File Input, Mail, File Exist
- Leitura de dados em uma API: Rest Client, JSON Input, JSON Output
- Construindo Workflow com execução de pipelines
- Entendo o uso de variáveis globais no APACHE HOP
- Automatização de pipeline ou workflow pelo HOP-RUN
- Construindo pipelines em banco de dados Postgresql: Table Input, Table Output, Configurando conexão
- Instalação de banco de dados Postgresql, usando PGAdmin
- Funcionalidades do Azure Data Factory
- Casos de Uso do Azure Data Factory
- Entender na prática o uso de Pipeline de Dados
- Construir pipelines com fluxos e transformações de dados na nuvem
- Utilizar das atividades e componentes principais do Azure Data Factory na construção de integrações e ETL de dados
- Programar a execução automática de pipelines
- Monitorar a execução com Sucesso/Erro de pipelines
Requirements
- Importante ter conhecimento sobre banco de dados, arquivos de dados
- Importante que você conheça lógica de programação
Description
No cenário atual, os dados desempenham um papel fundamental em todas as organizações, impulsionando decisões estratégicas e fornecendo insights valiosos. Nesse contexto, é essencial que profissionais de dados estejam preparados para enfrentar os desafios e aproveitar as oportunidades oferecidas pela era da informação. Dois cursos de destaque que merecem sua atenção são o Apache Hop e o Azure Data Factory.
À medida que o volume de dados aumenta exponencialmente, as empresas demandam profissionais altamente qualificados para gerenciar, transformar e orquestrar seus fluxos de dados. Tanto o Apache Hop quanto o Azure Data Factory são soluções renomadas que auxiliam nessa tarefa.
O Apache Hop é uma poderosa ferramenta de ETL (Extração, Transformação e Carregamento) de código aberto, que oferece uma abordagem visual e modular para a manipulação de dados. Com o Hop, é possível criar pipelines de dados complexos, automatizar processos e garantir a qualidade e integridade dos dados. Sua natureza versátil e escalável faz do Hop uma escolha estratégica para profissionais que desejam estar à frente da curva e se destacar no mercado de dados.
Por outro lado, o Azure Data Factory é uma solução de orquestração de dados na nuvem, oferecida pela Microsoft. Com a crescente adoção da nuvem e o uso de serviços de armazenamento e processamento de dados como o Azure, dominar o Azure Data Factory se torna crucial. Essa ferramenta permite a criação de fluxos de dados complexos, a integração com outras ferramentas do ecossistema Azure e o gerenciamento eficiente de processos de ETL e ELT (Extração, Transformação, Carregamento). Profissionais que dominam o Azure Data Factory se destacam como especialistas em orquestração de dados em ambientes em nuvem, sendo altamente requisitados no mercado de trabalho.
O Apache Hop se destaca pela sua abordagem visual, que permite aos profissionais construir pipelines de dados de maneira intuitiva e eficiente. A ferramenta oferece um vasto conjunto de transformações pré-construídas, que podem ser combinadas e customizadas para atender a diversas necessidades. Além disso, o Hop possui recursos avançados, como a execução paralela de tarefas e a integração com outras tecnologias do ecossistema de Big Data, tornando-o uma opção versátil e completa.
Portanto, convidamos você a se juntar a nós nessa jornada de aprendizado e aprimoramento. Explore o Apache Hop e o Azure Data Factory, adquira habilidades técnicas valiosas e esteja preparado para as oportunidades que a era dos dados oferece. Não perca tempo, comece seu treinamento hoje mesmo e abra portas para uma carreira de sucesso no universo dos dados.
Who this course is for:
- Estudantes e profissionais de computação, Informática, estatística, data science, analista de dados, engenheiro de dados
- Pessoas interessadas em aprender os conceitos sobre ferramentas de ingestão de dados, ou que gostariam adentrar na área de engenharia de dados
- Profissionais que, de alguma forma, utilizam dados no seu dia a dia
- Profissional de Dados que deseja entrar para mundo CLOUD
- Estudantes e Profissionais que queiram conhecer uma das principais soluções em nuvem para ETL/Integração de dados
- Analistas de BI, de Dados, Data Warehouse,ETL
- Engenheiro de Dados
- Você que se interessa por tecnologia que envolvam GRANDES DADOS (BIG DATA)
Instructors
Professor das pós-graduações das universidades CATÓLICA DO SALVADOR, UFBA, UNIRUY e ESTÁCIO FIB em disciplinas das áreas de Business Intelligence e Banco de Dados.
Especialista em Banco de Dados com Enfâse em Alta Disponibilidade pela Universidade Salvador(UNIFACS) e em Projetos de Business Intelligence desde 2007, já atuei como DBA e atualmente como Consultor Business Intelligence participo de projetos utilizando tecnologias Oracle (OWB/OBIEE), Microsoft (SSIS/SSRS), Postgres e outras. Atualmente participo de projetos envolvendo todas as etapas do processo de BI, desde levantamento de requisitos, análise de viabilidade, projeto e desenho, modelagem dimensional, construção de ETL, Cubos e relatórios OLAP, envolvendo bases heterogêneas e diversas tecnologias. Também tenho me interessado muito e participado de algumas práticas e estudos sobre BIG DATA e Aprendizagem de Maquina.
Quem sou
Fui escolhido como um dos 50 profissionais mais influentes em dados no ano de 2023 pela Gama Academy, uma organização que estabelece um Rank dos profissionais com mais destaque na área de Dados/BI.
Por que estudar na área de dados comigo?
Sou profissional da área com diversos projetos desenvolvidos, tanto na área privada como na área pública, tenho um skill muito forte em atender meus alunos com alguma dúvida no máximo em 24 horas. Procuro alinhar conhecimento teórico e prático.
O que trago em meus cursos?
Acho que a área de dados é bem rica e vasta, mas ter um direcionamento do que deve ser estudado com cursos passo a passo é o que busco nas minhas aulas, fiz um mestrado na área de educação para criar aulas sob medida aos meus alunos. Estou diariamente aprimorando e trazendo novidades na área, afinal criar + de 150 cursos envolve dedicação e foco.
O que faço hoje
Sou professor das pós-graduações das universidades UNIFACS, CATÓLICA DO SALVADOR e ISL Wyden. Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC). Possui Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 20 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente sou editor do blog BI com Vatapá. Autor do Livro: BI COMO DEVE SER - professor EAD de diversos cursos de BI na Aprenda Virtual. Idealizador do BI PRO - O maior e mais completo conteúdo sobre BI da internet.