Data Science: do Dado à Tomada de Decisão

Guia para iniciantes em Big Data. Aqui você compreenderá todo o processo de geração de insights a partir de dados.

Created byHekima Big Data Analytics

Last updated 7/2016

Portuguese

Portuguese [Auto],

What you'll learn

Entender qual é o processo de Data Science do início ao fim
Ser capaz de explorar e analisar bases de dados
Construir e avaliar modelos preditivos
Contar histórias a partir de dados e envolver audiências
Identificar oportunidades de carreira em Data Science

Course content

5 sections • 24 lectures • 3h 8m total length

1.1 Introdução ao Curso de Data Science4:22
Visão geral do curso, indicando como o conteúdo foi distribuído entre as seções.
1.2 O que é Data Science?5:28
Contextualização do atual cenário de Ciência de Dados.
1.3 Aplicações de Data Science5:47
Apresentação de cases de sucesso da utilização de Big Data.
1.4 Que profissão é essa?5:10
Direcionamentos sobre como se tornar um cientista de dados e indicação dos tipos de cientistas de dados.
1.5 Organizações Data Driven5:48
Indicação das vantagens competitivas de organizações Data Driven. O dado transformado em informação e conhecimento para a tomada de decisão.

2.1 Introdução / Cadeia de Valor em Analytics11:32
A cadeia de valor da transformação de dados em ação e valor. O processo que utiliza dados para ajudar na tomada de decisões que geram resultados mais positivos.
Cadeia de valor em Analytics
2.2 Qualidade dos Dados7:58
As características que o dado deve ter para permitir uma boa análise de dados.
Qualidade dos dados
2.3 Tipos de Análises9:14
Os diferentes tipos de análises que podem ser conduzidas: descritiva, exploratória, inferencial, preditiva, causal e mecanicista.
Tipos de análises
2.4 Ferramentas4:46
Linguagens de programação, ferramentas e bibliotecas para análises de dados.

3.1 Introdução / Modelos de Computação Distribuída5:17
Necessidades e desafios da computação distribuída, além dos principais modelos utilizados para abstrair este problema.
Modelos de computação distribuída - Introdução
3.2 Map Reduce8:09
Apresentação do modelo MapReduce, seguido de uma explicação de seu funcionamento e indicação dos problemas mais adequados para sua utilização.
MapReduce
3.3 Dremel6:31

Apresentação do modelo Dremel, explicação de seu funcionamento e indicação dos problemas mais adequados para sua utilização.
Dremel
3.4 BSP e Pregel10:36
Apresentação dos modelos BSP e Pregel, explicação de seus funcionamentos e indicação dos problemas mais adequados para a utilização deles.
BSP e Pregel
3.5 Spark8:38
Apresentação da Ferramenta Spark, indicação da sua importância e de alguns exemplos de uso.
Spark
3.6 Considerações Finais / Modelos de Computação Distribuída2:29
Apresentação das considerais finais sobre data engineering e sobre modelos de computação distribuída.

4.1 - O que é Aprendizado de Máquina9:15
O que é, e quando utilizamos Aprendizado de Máquina.
O que é aprendizado de máquina?
4.2 - Os Componentes do Aprendizado8:35
Os componentes dos algoritmos de Aprendizado de Máquina: representação, avaliação e otimização.
Os componentes do aprendizado
4.3 - Aprendizado Supervisionado20:00
Como funcionam alguns dos algoritmos de Aprendizado Supervisionado.
Aprendizado supervisionado
4.4 - Aprendizado Não Supervisionado13:45
Como funcionam alguns dos algoritmos de Aprendizado Não Supervisionado.
Aprendizado não supervisionado
4.5 - Avaliação10:35
Quais as formas de se avaliar um modelo aprendido e como realizar o tuning de hiper-parâmetros.
Avaliação
4.6 - Ferramentas3:51
Ferramentas e bibliotecas que podem ser utilizadas para o treinamento e uso de modelos de Aprendizado de Máquina.

5.1 Introdução5:41
Definição sobre o que é Storytelling, além de descrever sua importância e sua ligação com ciência de dados.
5.2 Princípios do Storytelling9:06
Explicação sobre como é a estrutura de uma história e de como utilizá-la em Data Science, além de exemplos e diretrizes para um bom storyteling.
5.3 Visualizações6:18
Descrição dos princípios de uma boa visualização e vários exemplos de gráficos, animações e mapas que seguem esses princípios.
Exercícios sobre storytelling

Requirements

Programação básica em Python (desejável)

Description

Não existe crise no mercado de Data Science e Big Data. Pelo contrário: as empresas estão começando a entender como os processos de coleta e análise de dados são cruciais para que tomem melhores decisões de negócios. Por isso, só aumenta a busca por cientistas de dados, profissionais especializados em analisar dados e construir algoritmos e modelos que geram conhecimento valioso para as empresas.

Se você é um desenvolvedor interessado em dar os primeiros passos para se tornar um cientista de dados, profissão tão valorizada (e rara!) no mercado, este curso é perfeito para você. Fizemos um detalhado guia sobre os conceitos, processos e ferramentas que um cientista de dados precisa dominar.

Aprenda as Principais Técnicas de Data Science neste Passo a Passo para Iniciantes

Entenda qual é o processo de Data Science do início ao fim;
Compreenda os diferentes tipos de análise de dados (descritiva, exploratória, preditiva);
Aprenda a construir e avaliar modelos preditivos (Aprendizado de Máquina);
Descubra como contar histórias a partir de dados e envolver audiências (Storytelling);
Identifique oportunidades de carreira em Data Science.

Estrutura do Curso e Carga Horária

O curso tem duração de 3 horas e é dividido em 5 seções:

Introdução – O que é Data Science? / Aplicações de Data Science / Que profissão é essa? / Organizações Data Driven
Análise exploratória – Introdução / Qualidade dos dados / Estatística básica / Visualização de resultado / Ilustração do processo
Engenharia de Dados – Modelo de computação distribuída / MapReduce / Dremel / BSP + Pregel / Spark
Aprendizado de máquina – Introdução / Supervisionado e não supervisionado / Modelos e aplicações / Avaliação / Sci-kit
Storytelling – Introdução / Princípios de storytelling / Visualização de dados

Além disso, ao final de cada seção é proposto um exercício para que você coloque em prática todo o aprendizado adquirido com as aulas.

Who this course is for:

Qualquer pessoa que possua uma noção básica de programação e deseje entender de forma ampla o que é Data Science, quais seus benefícios e aplicações
Interessados em adquirir um conhecimento mais aprofundado sobre Data Science para interagir com profissionais da área
Profissionais de computação ou estatística que desejam se atualizar

Data Science: do Dado à Tomada de Decisão

What you'll learn

Explore related topics

Course content

1. Introdução5 lectures • 27min

2. Cadeia de Valor em Analytics4 lectures • 34min

3. Data Engineering6 lectures • 42min

4. Aprendizado de Máquina6 lectures • 1hr 6min

Storytelling3 lectures • 21min

Requirements

Description

Who this course is for: