Elasticsearch e ORANGE Data Science - Descoberta de Dados
What you'll learn
- Elasticsearch sobre o seu mecanismo criado para análise de dados e busca
- Entender como é realizada a combinação de muitos tipos de buscas — estruturadas, não estruturadas
- Compreender Elasticsearch usa APIs RESTful e JSON padrão
- Aprendizado sobre Elasticsearch, Logstash e Kibana
- Elasticsearch banco de dados NoSQL
- Logstash ferramenta para ingestão de dados
- Kibana ferramenta para criação de visualização de dados e Dashboards
- Canvas utilizado para criação de infográficos, documentos e projetos gráficos com os dados
- Compreender sobre como são armazenados os documentos
- Entender a estrutura JSON de armazenamento
- Entender sobre índices, tipos de documentos, documentos e campos
- Entendimento do que são shards, conhecimento sobre partição de índices, conhecimento sobre réplica de shards
- O que é um NÓ
- Como utilizar e o que significa um Request Body
- Como funciona a busca URI
- Trabalhando com as aplicações Discover, Viazualize
- Exploração de Dados
- Visualização de Dados
- Machine Learning
- Agrupamento, descoberta de grupos em dados
- Classificação e modelagem preditiva
- Algoritmos de Mineração
- Análise Estatística
- Trabalhando Widget: Color, Distributions, Pivot Table
- Trabalhando Widget: Feature Statistics, Data Sample
- Trabalhando com Widget: Paint Data
- Trabalhando com Widget: Outliers ,Scatter Plot
- Trabalhando com: Create Class
- Trabalhando com: Select By data index
- Trabalhando com: Edit Domain
- Trabalhando com: Freeviz
- Trabalhando com: Árvore de Decisão
- Trabalhando com: Cluster - Imagens
- Trabalhando com: Correlação
- Trabalhando com: Cluster – K-means
- Trabalhando com: Cluster - Imagens
- Trabalhando com Widget Predictions (realizando previsões)
- Trabalhando com Widget Confusion Matrix (analisando matriz de score)
- Trabalhando com Widget Test and Score (avaliando modelos)
- Criando um modelo estatístico
- Estimando pelo modelo estatístico
- Salvando modelos estatísticos em python e executando em bases de teste para previsões
- Trabalhando com o algoritmo de associação APRIORI
- Trabalhando com Widget MDS
- Trabalhando com Widget Mosaic Display
- Trabalhando Widget CN2 Rules
- Trabalhando Widget Box Plot
- Criando modelos por Redes Neurais
Requirements
- Pessoas interessadas em aprender os conceitos sobre Elasticsearch e ORANGE, ou que gostariam de adentrar na área de bancos NoSQL
- Desenvolvedores iniciantes de R e Python que desejam conhecer o ORANGE como uma nova ferramenta
- Profissionais que, de alguma forma, utilizam dados no seu dia a dia
Description
Neste treinamento você contará com as principais ferramentas do mercado, as que estão crescendo de forma rápida nas suas principais funções. O Elasticsearch é um produto que incorpora banco de dados, ferramenta de ingestão de dados, visualização e criação de dashboards, além de possuir uma linguagem própria para geração de scripts de consulta, alteração e deleção dos seus dados, o produto trabalha com o conceito chave-valor que é característica dos banco de dados orientado a documentos. O processo é realizado pela carga de documentos (ou registros de arquivos txt, csv,json) e que são indexados, para dar o máximo de velocidade ao consultar seus dados. As suas principais ferramentas são:
Banco de Dados : Elasticsearch
Ingestão de Dados: Logstash
Visualização e Construção de Dashboards: Kibana
Linguagem de Manipulação de Dados: DSL
Em seguida, aprenderemos a trabalhar com o ORANGE DATA SCIENCE, uma das principais ferramentas visuais do mercado para que você possa criar os seus modelos de dados, ou modelos de Machine Learning. O ORANGE é totalmente construído em python e permite a inserção de objetos gráficos que geram um flow de execução ao modelo de dados que você está construindo. É muito fácil e prático alterar qualquer objeto dentro do ORANGE, permitindo que você veja tudo real time.
Então o que está esperando, venha aprender comigo e torne-se membro de um grupo que não para de crescer.
Who this course is for:
- Estudantes e profissionais de computação, Informática, estatística, data science, analista de dados, engenheiro de dados
Instructor
Quem sou
Fui escolhido como um dos 50 profissionais mais influentes em dados no ano de 2023 pela Gama Academy, uma organização que estabelece um Rank dos profissionais com mais destaque na área de Dados/BI.
Por que estudar na área de dados comigo?
Sou profissional da área com diversos projetos desenvolvidos, tanto na área privada como na área pública, tenho um skill muito forte em atender meus alunos com alguma dúvida no máximo em 24 horas. Procuro alinhar conhecimento teórico e prático.
O que trago em meus cursos?
Acho que a área de dados é bem rica e vasta, mas ter um direcionamento do que deve ser estudado com cursos passo a passo é o que busco nas minhas aulas, fiz um mestrado na área de educação para criar aulas sob medida aos meus alunos. Estou diariamente aprimorando e trazendo novidades na área, afinal criar + de 150 cursos envolve dedicação e foco.
O que faço hoje
Sou professor das pós-graduações das universidades UNIFACS, CATÓLICA DO SALVADOR e ISL Wyden. Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC). Possui Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 20 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente sou editor do blog BI com Vatapá. Autor do Livro: BI COMO DEVE SER - professor EAD de diversos cursos de BI na Aprenda Virtual. Idealizador do BI PRO - O maior e mais completo conteúdo sobre BI da internet.