
Nessa aula o aluno irá compreender os conceitos do Big Data, aplicabilidades, vantagens e desvantagens do mundo massivo de dados.
O aluno deverá compreender a arquitetura macro do Hadoop, seus principais módulos e, os principais distribuidores de soluções de Big Data.
O aluno deverá entender a história, as vantagens/desvantagens do Hadoop e, dos sistemas distribuídos.
Nessa aula o aluno irá compreender que, somente o Hadoop não atenderá tudo o que se precisa fazer em um ambiente de Big Data e, que existe um ecossistema de ferramentas de apoio para resolução dos problemas de negócio.
Nesta aula o aluno aprenderá mais conceitos avançados do Ecossistema Hadoop
Nessa aula o aluno irá apreender como desenhar uma solução de Hadoop, como definir o hardware adequado além de compreender como as informações são processadas dentro da infraestrutura.
Nessa aula o aluno irá compreender os conceitos de uma sistema de arquivos distribuído e como o HDFS cria um lago de dados para armazenamento dos dados estruturados, não estruturados e, semi-estruturados na infraestrutura do cluster de Big Data.
O aluno deverá compreender como funciona com um pouco mais de profundidade o processo do framework MapReduce além de como os jobs são orquestrados (submissão, controle, coleta de informações, tolerância a falhas, dentre outros) via YARN no cluster de Hadoop.
Nessa aula iremos preparar a instalação padrão a ser usada em nosso cluster de Hadoop
Nessa aula iremos executar as configurações iniciais mandatórias para as imagens de nossos nodos
Nessa aula iremos configurar o processo de autenticação unificada de usuários através do NIS - Network Information Services - ou Sun Yellow Pages.
Nessa aula aprenderemos como acessar os nodos sem pedir usuário/senha no SSH
Nessa aula iremos aprender a implementar a ferramenta de gerenciamento Ganglia
Os alunos conseguirão o Java em todos os Nós do Cluster
O aluno deverá aprender como implementar o Apache Maven para gestão de projetos envolvendo a ferramenta no ecossistema do Hadoop.
Os alunos aprenderão como inserir os discos no Linux para compor o Data Lake
Nesta aula o aluno irá instalar, configurar e testar o ambiente com Hadoop Cluster
O aluno irá aprender como submeter jobs no hadoop em python através do recurso de streaming
Nessa aula o aluno irá conhecer como funciona na prática os processos de leitura/escrita no HDFS.
Nessa aula iremos aprender os conceitos de backup no hadoop, comandos administrativos importantes e, outros sistemas proprietários que podem substituir o HDFS puro do hadoop.
Nessa aula o aluno aprenderá alguns métodos específicos de Benchmarking do Hadoop.
Nessa aula iremos aprender os conceitos importantes no módulo que manipula todos os processos entre as aplicações que fazem parte do ecossistema do Hadoop e, utilizam os serviços de coordenação.
Nessa aula o aluno irá aprender como implementar um Assemble de Zookeeper em três nodos para manter o conceito de Quorum em máquinas.
Nessa aula iremos aprender como funciona o Pig e como aplicamos ela no contexto de Big Data
Nessa aula prática iremos selecionar dois times de jogadores e Pokemons para uma batalha entre eles.
Nessa aula iremos aplicar funcionalidades de limpeza e ajustes no dataset e calcular a média do tempo médio entre falhas de lâmpadas.
Nessa aula vamos aprender técnicas de parser para converter um XML para formato CSV com o PIG
Nessa aula o aluno irá aprender como converter formatos JSON para CSV e vice-versa.
Nessa aula iremos aprender como analisar que as pessoas estão mais comentando no Twitter baseado em Análise de Sentimentos com Big Data.
Nessa aula iremos executar análises em cima de um dataset de direção e motoristas mas, usando script latin para acionar as funcionalidades ao invés do grunt.
Nessa aula aprenderemos a teoria envolvida no entendimento e manipulação do DataWareHouse para Hadoop.
Nessa aula o aluno irá aprender a construir a instalação do Hive e HCatalog
Nessa aula o aluno irá aprender a como trabalhar com uma base de dados de vôos em uma visão de HQL no Hive
Nessa aula o aluno irá aprender a como criar um database via cliente Hive Beeline
Nessa aula iremos aprender como criar sistemas de recomendações com o apoio do Hive
Nessa aula o aluno irá aprender os processos de instalação e testes do SQOOP.
O aluno deverá aprender como importar um banco de dados de varejo (retail) em diferentes formatos binários para o HDFS.
Nessa aula o aluno aprenderá como fazer a integração do Sqoop com Hive e mais comandos e procedimentos avançados com o Sqoop
O aluno irá aprender a teoria que envolve o Banco de Dados Colunar No-SQL HBase
Nessa aula o aluno irá aprender como implementar o HBase no ecossistema do Hadoop
Nessa aula o aluno irá aprender como executar as operações básicas no HBase e, operar o WebUI HBase
Nessa aula o aluno irá aprender como executar a integração entre o Apache Pig e o HBase
Nessa aula o aluno irá aprender como migrar Dataset do Pig para o Hbase
Nessa aula o aluno irá aprender como se implementa o Flume
Nessa aula iremos compreender as funções do Flume e uma implementação prática para captura de dados do sistema de arquivos do Linux para o HDFS.
Nesta aula o aluno irá capturar tweets no Twitter e carregá-los dentro do Apache Hive para execução de consultas HQL.
Nessa aula aprenderemos como capturar logs de servidores WEB apache e levar para o HDFS via FLUME.
Nessa aula o aluno irá aprender como executar um contador de acesso a sites de informações provenientes dos Logs do Apache que podem ter sido capturados via Flume.
Nessa aula o aluno irá aprender todos os conceitos relacionados a Machine Learning
Nessa aula o aluno irá aprender todos os conceitos relacionados a Machine Learning
Nessa aula o aluno irá aprender todos os conceitos relacionados a Machine Learning
Nessa aula o aluno será capaz de implementar, configurar e testar o Apache Mahout
Nessa aula o aluno será capaz de executar uma análise preditiva com newsgroup
Nessa aula o aluno irá executar uma análise preditiva com Naive Bayes para Spam / Ham
Nessa aula o aluno irá aprender como executar uma análise não-supervisionada com o Apache Mahout
Nessa aula o aluno deverá aprender os conceitos relacionados aos sistemas de mensageria.
O mundo do Big Data vem ganhando força a cada dia. Os dados agora passaram a ser o petróleo do mundo da tecnologia. O mercado cada vez mais vem necessitando de profissionais que saibam manipular grandes quantidades de dados. E, aonde faltam profissionais, com certeza teremos uma maior valorização desse perfil técnico.
Nesse treinamento objetivo principal é, ensinar ao aluno como construir um supercomputador com hardware de prateleira para atender ao mundo do Big Data com o Hadoop e seu Ecossistema. Poucos são os profissionais que dominam essa tecnologia, pois o que é ensinado em cursos do mercado, não condizem com a realidade prática de uma solução corporativa. Nenhuma empresa vai usar uma única máquina com tudo pois, a realidade dessa tecnologia é ser distribuída e escalável.
Pois bem, essa é a nossa proposta verdadeira, criar uma solução na "unha" para que o aluno entenda como se faz na realidade pois, produtos vão e vem mas, o domínio do conhecimento é o que diferencia no mercado cada vez mais competitivo.
Nesse treinamento você irá aprender a implementar a infraestrutura necessária a um supercomputador para Big Data envolvendo Hadoop, Zookeeper, Flume, Sqoop, Kafka, Hive, HBase, Pig, Mahout, HUE, criando a estrutura necessária para atuar de forma objetiva no mundo do Big Data Analytics.
Sejam muito bem vindos ao mundo da supercomputacao em clusters Linux de alto desempenho do ecossistema Hadoop.