
Visão geral do curso, indicando como o conteúdo foi distribuído entre as seções.
Contextualização do atual cenário de Ciência de Dados.
Apresentação de cases de sucesso da utilização de Big Data.
Direcionamentos sobre como se tornar um cientista de dados e indicação dos tipos de cientistas de dados.
Indicação das vantagens competitivas de organizações Data Driven. O dado transformado em informação e conhecimento para a tomada de decisão.
A cadeia de valor da transformação de dados em ação e valor. O processo que utiliza dados para ajudar na tomada de decisões que geram resultados mais positivos.
As características que o dado deve ter para permitir uma boa análise de dados.
Os diferentes tipos de análises que podem ser conduzidas: descritiva, exploratória, inferencial, preditiva, causal e mecanicista.
Linguagens de programação, ferramentas e bibliotecas para análises de dados.
Necessidades e desafios da computação distribuída, além dos principais modelos utilizados para abstrair este problema.
Apresentação do modelo MapReduce, seguido de uma explicação de seu funcionamento e indicação dos problemas mais adequados para sua utilização.
| Apresentação do modelo Dremel, explicação de seu funcionamento e indicação dos problemas mais adequados para sua utilização. |
Apresentação dos modelos BSP e Pregel, explicação de seus funcionamentos e indicação dos problemas mais adequados para a utilização deles.
Apresentação da Ferramenta Spark, indicação da sua importância e de alguns exemplos de uso.
Apresentação das considerais finais sobre data engineering e sobre modelos de computação distribuída.
O que é, e quando utilizamos Aprendizado de Máquina.
Os componentes dos algoritmos de Aprendizado de Máquina: representação, avaliação e otimização.
Como funcionam alguns dos algoritmos de Aprendizado Supervisionado.
Como funcionam alguns dos algoritmos de Aprendizado Não Supervisionado.
Quais as formas de se avaliar um modelo aprendido e como realizar o tuning de hiper-parâmetros.
Ferramentas e bibliotecas que podem ser utilizadas para o treinamento e uso de modelos de Aprendizado de Máquina.
Definição sobre o que é Storytelling, além de descrever sua importância e sua ligação com ciência de dados.
Explicação sobre como é a estrutura de uma história e de como utilizá-la em Data Science, além de exemplos e diretrizes para um bom storyteling.
Descrição dos princípios de uma boa visualização e vários exemplos de gráficos, animações e mapas que seguem esses princípios.
Não existe crise no mercado de Data Science e Big Data. Pelo contrário: as empresas estão começando a entender como os processos de coleta e análise de dados são cruciais para que tomem melhores decisões de negócios. Por isso, só aumenta a busca por cientistas de dados, profissionais especializados em analisar dados e construir algoritmos e modelos que geram conhecimento valioso para as empresas.
Se você é um desenvolvedor interessado em dar os primeiros passos para se tornar um cientista de dados, profissão tão valorizada (e rara!) no mercado, este curso é perfeito para você. Fizemos um detalhado guia sobre os conceitos, processos e ferramentas que um cientista de dados precisa dominar.
Aprenda as Principais Técnicas de Data Science neste Passo a Passo para Iniciantes
Estrutura do Curso e Carga Horária
O curso tem duração de 3 horas e é dividido em 5 seções:
Além disso, ao final de cada seção é proposto um exercício para que você coloque em prática todo o aprendizado adquirido com as aulas.