Data Science Overview

Visão geral
Portuguese
Introdução Data Science

Requirements

  • Não

Description

Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados econômicos, financeiros e sociais, estruturados e não-estruturados, que visa a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão. Ciência de dados enquanto campo existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como o surgimento e popularização de grandes bancos de dados e o desenvolvimento de áreas como machine learning. Cientistas de Dados podem trabalhar no setor privado, por exemplo, transformando grande quantidade de dados brutos em insights de negócios, auxiliando empresas em tomadas de decisões para atingir melhores resultados ou na academia e terceiro setor como pesquisadores quantitativos interdisciplinares.


Relação com a Estatística

A popularidade do termo "ciência de dados" explodiu nos ambientes de negócios e na academia, alavancado pelas vagas de emprego. No entanto, muitos acadêmicos e jornalistas críticos não vêem distinção entre Ciência de Dados e Estatística. Em artigo na Forbes, por Gil Press, argumenta que a ciência de dados é uma buzzword sem uma definição clara e simplesmente substituiu "analista de negócios" no contextos das programas de graduação. Na seção de perguntas e respostas de seu principal discurso na Reuniões Estatísticas da American Statistical Association, o notório estatístico aplicado Nate Silver disse: “Eu acho que cientista de dados é um termo sexualizado para um estatístico .... A estatística é um ramo da ciência. O cientista de dados é um pouco redundante de alguma forma e as pessoas não devem repreender o termo estatístico." Similarmente, no setor de negócios, vários pesquisadores e analistas afirmam que os cientistas de dados, por si só, estão longe de ser suficientes para conceder às empresas uma vantagem competitiva real e considere os cientistas de dados como apenas uma das quatro maiores famílias de empregos que as empresas precisam para usar grandes dados com eficiência, a saber: analistas de dados, cientistas de dados, desenvolvedores e engenheiros de dados.

Existe uma polêmica envolvendo a ciência de dados, no que se refere ao fato desta se confundir com a estatística. Em 2015, a American Statistical Association fez uma declaração através de um comunicado de imprensa que procura apaziguar essa questão. Basicamente ela afirma que as ciências são complementares, e a estatística procura fomentar um relacionamento mais próximo à ciência de dados para benefício mútuo.



Who this course is for:

  • Interessado em data science

Course content

1 section5 lectures1h 59m total length
  • Introdução
    21:57
  • Aula 2
    37:17
  • Aula 3
    29:57
  • Aula 4
    27:33
  • Aula 5 - bônus
    02:55

Instructor

Rodolfo Augusto da Silva Arruda
  • 4.7 Instructor Rating
  • 30 Reviews
  • 424 Students
  • 3 Courses

Professional with experience in Statistical Modeling, Data Science, Big Data and Machine Learning.


Data Scientist Manager

> Growth Hacking
> Team management
> Structuring of the modeling area
> Interaction with suppliers for Machine Learning solutions
> Project management for creating features for machine learning models
> R&D - Performance evaluation of ML models
> Pipeline creation to deploy models via python in container
Results: Reduced time to put the model into production (From 6 months to 1 month)
Technologies: HortonWorks Platform
Languages: Spark / HIVE / Python / R