Computação em R

Computação no ambiente R para métodos quantitativos
4.5 (193 ratings) Instead of using a simple lifetime average, Udemy calculates a
course's star rating by considering a number of different factors
such as the number of ratings, the age of ratings, and the
likelihood of fraudulent ratings.
1,905 students enrolled
Free
Start Learning Now
  • Lectures 37
  • Length 3 hours
  • Skill Level Intermediate Level
  • Languages Portuguese
  • Includes Lifetime access
    30 day money back guarantee!
    Available on iOS and Android
    Certificate of Completion
Wishlisted Wishlist

How taking a course works

Discover

Find online courses made by experts from around the world.

Learn

Take your courses with you and learn anywhere, anytime.

Master

Learn and practice real-world skills and achieve your goals.

About This Course

Published 10/2013 Portuguese

Course Description

O mercado de trabalho demanda profissionais que tenham desenvoltura em ambientes computacionais para resolução de problemas. Destacam-se entre estas habilidades, dominar o poder de processamento para explorar e analisar os dados disponíveis bem como uma linguagem de programação para otimizar e automatizar as análises.

Este curso deseja oferecer a vocês a base da programação em ambiente R bem como o desenvolvimento de soluções para análise e modelagem de dados.

A primeira versão deste curso foi ministrado em formato de disciplina condensada na Universidade Federal dos Vales do Jequitinhonha e Mucuri, na cidade de Diamantina, através do apoio do professor Márcio L. Romarco de Oliveira. Uma semana antes do curso, um colega também professor da UFVJM havia adquirido uma câmera de vídeo e para testar resolvemos gravar toda a semana de curso.

Com a experiência adquirida ministrando o curso presencial e com todo o material gravado, códigos e base de dados, recriamos as video-aulas e restruturamos o curso pensando numa versão MOOC. O produto deste esforço vc confere aqui. Agradecemos às centenas de alunos que já participaram deste curso e deram valiosas sugestões de melhoria.

Aproveitem o material e desejamos um excelente curso.

Bom divertimento,

Eric

What are the requirements?

  • Estatística básica
  • Noções básicas de informática

What am I going to get from this course?

  • Compreender o ambiente R
  • Conhecer os fundametos da programação em R
  • Apresentar as principais funções da área de métodos quantitativos

What is the target audience?

  • Estudante de graduação
  • Estudantes de pós-graduação
  • Interessados em geral

What you get with this course?

Not for you? No problem.
30 day money back guarantee.

Forever yours.
Lifetime access.

Learn on the go.
Desktop, iOS and Android.

Get rewarded.
Certificate of completion.

Curriculum

05:46

Seja bem vindo ao curso sobre R. Meu nome é Eric Gorgens. Sou formado em Engenharia Florestal e mestre em Recursos Florestais, ambos pela Universidade Federal de Viçosa. Este curso está dividido em 8 seções, das quais 6 contem video aulas sobre o uso do R. Espero que vc goste, este é sem dúvida um software fascinante!

Cada aula é composta por uma video aula (ou um texto) e tanto as bases de dados quanto os códigos de cada aula podem ser encontrados no link de materiais complementares. Em caso de problemas, vc também pode obter todos os códigos diretamente no meu site do Github (https://github.com/Gorgens/udemy).

A qualquer momento te convido para deixar sua dúvida, comentário, crítica e sugestão no nosso forum!

Bons estudos!

Section 1: O ambiente R
01:36

“O R é umalinguagem e um ambiente para análiseestatística e gráfica.” - About R.

“Derivado da linguagem e do ambiente S entãocriadospelopesquisador John Chambers e colegasdentro dos Laboratórios da Bell – atual Lucent Technology).” - About R.

“R é desponibilizadocomo Software Livre sob licença GNU-GPL e rodanasplataformas Windows, Unix e MacOS.” - About R.

“A linguagem R é a maisusada entre estatísticos e data miners(...)” - Wikipedia.

“R foicriadopor Ross Ihaka e Robert Gentleman naUniversidade de Auckland, Nova Zelândia.” - Wikipedia. Daí o nome R, iniciais dos doisautores.

“R usa a interface de linhas de comando, no entantodiversas interfaces gráficaspodemserencontradas.” - Wikipedia.

Article
Instalando o R

O R está disponível para todos os sistemas operacionais (Windows, Mac e Linux). Nosso passo a passo está baseado no Windows, que é o sistema operacional da maiores de vcs.

04:21
Introdução ao ambiente R

No caso do software R, a linguagem utilizada recebe o mesmo nome: linguagem R. A linguagem R possui regras, que chamamos de sintaxe. Estas regras precisam ser seguidas para que o programa consiga interpretar e processar as linhas de comandos com sucesso.

Uma série de comandos podem ser apresentados numa sequência de linhas, que chamamos de script. No entanto, o processamento ocorre linha por linha, sendo que o processamento de uma determinada linha depende de que as linhas anteriores tenham sido interpretadas e processadas corretamente.

03:28
Script

O script é um ambiente semelhante ao bloco de notas que permite a escrita se uma sequencia de linhas de comandos para futuro processamento. O produto é um arquivo de extensão .R que pode inclusive ser repassado para outras pessoas. O script não processa nenhum comando, ele apenas armazena. Para processar o script deve ser enviado em partes ou por inteiro para o console.

https://github.com/Gorgens/udemy/blob/master/primeiroScript.R

02:19
Espaço de trabalho

O espaço de trabalho é um artifício que vincula o R à uma pasta de trabalho dentro do computador do usuário. Este procedimento simplifica a vida do usuário uma vez que o R possa a enxergar todos os arquivos dentro desta pasta de forma direta assim como permite que sejam salvos o histórico de processamento, scripts, saídas, variáveis da memória e entre outros.

https://github.com/Gorgens/udemy/blob/master/espacoTrabalho.R

8 questions

Vamos ver se você aprendeu os conceitos básicos do R?

Section 2: Conceitos básicos
15:08
Tipos de objetos

O R é uma linguagem orientada a objetos. Na prática, cada objeto possui atributos comuns que definem limites e propriedades. Assim, funções podem ser criadas para um determinado objeto com base nesses atributos comuns. Os principais tipos de objetos no R são: vetores, matrizes, data frames e listas.

https://github.com/Gorgens/udemy/blob/master/tiposObjetos.R

05:38
Operadores matemáticos

Os operadores matemáticos é muito semelhante à outras linguagens de propgramação. Para adição utiliza-se o sinal +:

2 + 2

a subtração utiliza-se o sinal -:

10 - 5

multiplicação utiliza-se o sinal *:

2 * 5

a divisão utiliza-se o sinal /:

6 / 2

a exponenciação utiliza-se o sinal ^:

2^4

a prioridade entre operação pode ser explicitada através do uso de ():

(2 + 5) * 3
06:42
Histórico

O R armazena todo o histórico digitado no console. Isto permite que você recupere a qualquer momento um ou mais comandos já processados. O histórico é obtido digitando diretamente no console o comando:

history()

https://github.com/Gorgens/udemy/blob/master/memoria.R

05:23

Operadores lógicos

Os operadores lógicos que podem ser utilizados no R são:

menor <

menor ou igual <=

maior >

maior ou igual >=

igualdade ==

diferente !=


OBS: Nosso colega Hitoshi encontrou um erro por volta de 2:30. No exemplo apresentado (x = 5 | x > 5), o correto é ( x == 5 | x > 5 ). Fique atento!

03:44
Sobre os pacotes

Os usuários podem criar soluções e salvá-las em forma de pacotes, que pode sua vez podem ser distribuídos e adicionados por outros usuários. Os pacotes podem ser construídos com outras linguagens como por exemplo o JAVA, o C e o Fortran.

Quando o pacote seguem um padrão mínimo, ele pode ser inclusive distribuído pelo repositório oficial do R, ficando disponível para download através dos espelhos do CRAN. Uma vez instalado, o pacote irá adicionar funcionalidades ao R. No entanto uma vez instalada, o pacote não é sempre carregado. Ele precisa ser ativado no início dos trabalhos dentro de um "Workspace".

Comandos mais utilizados para manipular pacotes:

install.packages()
require()

https://github.com/Gorgens/udemy/blob/master/pacotes.R

03:04
Onde procurar ajuda?
Se vc é iniciante procure:
Se vc já é um usuário avançado:
E ainda vc pode buscar:
  • Foruns especializados em R
  • Help do R (adicionando ? antes do nome do comando desejado!)
08:52
RStudio

O RStudio é um ambiente de desenvolvimento integrado para tornar a vida do usuário do R mais poderosa e produtiva. Ele é gratuito, código aberto e trabalha nas plataformas Windows, Mac e Linux.

No ambiente do RStudio encontraremos o console, o script e a janela de gráficos integrados. Além de acesso direto ao historico, memória do workspace, estrutura de pastas, pacotes e help.

07:04
Importando dados no R

Grande parte dos dados são salvos em planilhas eletrônicas como Excel, LibreOffice e outros. Para importar uma planilha eletrônica para dentro do R, recomendo que seja utilizado sempre a extensão genérica .csv (comma-separeted value). Todo arquivo do tipo csv possui dois elementos básicos que podem influenciar na importação: o separador decimal e a tabulação (ou separador de colunas).

No formato regional Brasileiro, o separador decimal é a vírgula e o separador de coluna é o ponto e vírgula. Já no formato regional americano, utiliza-se o ponto como separador decimal e a vírgula como separador de colunas.

https://github.com/Gorgens/udemy/blob/master/readcsv.R

06:17
Criando data frames

Data frame é o objeto do R usado para armazenar dados dispostos em forma de tabela. Na prática, o data frame é um conjunto de vetores combinados lado a lado nas colunas. É possível criar um data frame a partir do comando:

data.frame()

e a partir da importação de um arquivo de planilha eletrônica:

read.csv()

Funções úteis para trabalhar com data frames:

names()# retorna os nomes das variáveis do data frame
dim()# retorna as dimensões do data frame
head()# retornar as primeiras linhas do data frame
tail()# retorna as últimas linhas do data frame
nrow()# retorna o número de linhas do data frame
ncol()# retorna o número de colunas do data frame

https://github.com/Gorgens/udemy/blob/master/dataframe.R

07:32
Manipulando data frames

Sem dúvida o data frame será um dos objetos que você irá utilizar mais. Isto por que a maioria dos nossos dados são importados a partir de uma planilha eletrônica (ex: excel, libreoffice e outros). Uma vez importado o data frame é comum precisarmos filtrar e selecionar apenas parte dos dados. Este é o objetivo desta aula.

https://github.com/Gorgens/udemy/blob/master/autofiltro.R

6 questions

Avalie como foi seu aprendizado referente à segunda seção.

Section 3: Explorando os dados
12:52
Gráfico de dispersão

Os gráficos de dispersão são representações de duas ou mais variáveis em um gráfico de pontos, no qual uma variável está disposta em função da outra. Ele é muito utilizado para correlacionar dados e estudar o efeito de uma variável (X) sobre a outra (Y).

Linhas de tendência

Curvas de regressão, também conhecidas como linhas de tendência podem ser adicionadas aos gráficos de dispersão para melhor representação da relação entre as duas variáveis.

Diagrama de caixa

O Boxplot ou diagrama de caixa é uma representação para explorar um conjunto de dados organizador em fatores. Assim o eixo X representa as categorias dos fatores e o eixo Y representa a variável dependente dos fatores.Este gráfico apresenta a variação de uma variável dentro de cada fator através das seguintes estatísticas: mediana, 1º e 2º quartil e o máximo e mínimo dos dados desconsiderando outliers aqui definido como valores fora de + ou - 1,5 valor da distância interquartil.

Mais detalhes sobre o boxplot: https://www.r-bloggers.com/about-boxplot/

Obs: No video a explicação para o bigode (ou whiskers) está errada. Em breve atualizaremos o video.

Gráficos de barras

Os gráficos de barras são indicados para visualizar uma ou mais categorias de dados, mostrando visualmente a diferença entre uma determinada estatística de cada categoria.

Histograma

O histograma representa a distribuição de frequências. Os dados são agrupados em classes e a altura vertical da coluna da respectiva classe representa a frequência com que esta classe está presente nos dados.

Veja mais sobre estes e outros gráficos no: www.wikipedia.org

https://github.com/Gorgens/udemy/blob/master/plotBasico.R

11:47
Gráfico de dispersão

Os gráficos de dispersão são representações de duas ou mais variáveis em um gráfico de pontos, no qual uma variável está disposta em função da outra. Ele é muito utilizado para correlacionar dados e estudar o efeito de uma variável (X) sobre a outra (Y).

Diagrama de caixa

O Boxplot ou diagrama de caixa é uma representação para explorar um conjunto de dados organizador em fatores. Assim o eixo X representa as categorias dos fatores e o eixo Y representa a variável dependente dos fatores.Este gráfico apresenta a variação de uma variável dentro de cada fator através das seguintes estatísticas: mediana, 1º e 2º quartil e 95% do intervalo de confiança.

Histograma

O histograma representa a distribuição de frequências. Os dados são agrupados em classes e a altura vertical da coluna da respectiva classe representa a frequência com que esta classe está presente nos dados.

Veja mais sobre estes e outros gráficos no: www.wikipedia.org

https://github.com/Gorgens/udemy/blob/master/ggplot.R

5 questions

Veja aqui como foi sua assimilação do conteúdo apresentado na seção 3.

Section 4: Estatística Básica
04:00
Correlação

Correlação pode ir de -1 a 1 e indica a intensidade e o sentido da relação linear entre duas variáveis.

Existem duas formas de calcular a correlação. A correlação de Pearson que leva em consideração as médias e desvios das variáveis, sendo assim uma estatística paramétrica. E a correlação de Spearman que leva em consideração o posto das observações (posição da observação na série ordenada dos dados), e por isso é considerada um estatística não-paramétrica.

Covariância

A covariância é o grau de interdependência de duas variáveis, ou seja o é uma medida do grau de variação de uma variável quando outra a outra variável muda. Assim, duas variáveis com covariância igual a zero são independentes.

https://github.com/Gorgens/udemy/blob/master/correlacao.R

04:49
Correlogramas

Os correlogramas ajudam a visualizar de forma gráfica a matriz de correlação. Além representar a correlação por meio de cores, é possível também visualizar a significância da correlação, gráfico de dispersão, linha de tendência e intervalo de confiança. Tudo combinado em um mesmo gráfico.

https://github.com/Gorgens/udemy/blob/master/correlograma.R

04:30
Estatística descritiva

A Estatística descritiva fornece resumos simples sobre as observações que foram feitas. Tal resumo pode ser quantitativo ou visual. Esses resumos tanto podem formar a base da descrição inicial dos dados, como parte de uma análise estatística mais extensa. Entre as estatísticas mais comuns podemos citar: média, desvio padrão, variâncias, quartis, mediana e moda.

https://github.com/Gorgens/udemy/blob/master/descritiva.R

02:24
A família de funções apply()

No R, por usar uma linguagem vetorial, os "loops" tradicionais devem ser substituídos pelas funções da família apply sempre que possível. Dentre as alternativas encontramos as funções apply(), sapply(), tapply() e lapply() para implementar cálculos de forma mais eficiente.

https://github.com/Gorgens/udemy/blob/master/descSapply.R

06:19
Pressuposições estatísticas

Para se utilizar os testes de hipótese e outras inferências os modelos matemáticos devem ter as pressuposições atendidas. Dentre as principais pressuposições para a aplicação da estatísticas paramétrica estão a normalidade e homogeneidade de variâncias. O R permite realizar a verificação destes presssupostos.

https://github.com/Gorgens/udemy/blob/master/pressuposicoes.R

4 questions

Avalie como foi seu aprendizado durante nossa seção 4.

Section 5: Testes de hipótese
06:36
Sobre o teste:

O qui-quadrado é um teste que não depende de parâmetros populacionais, como média e desvio padrao, sendo portanto não-paramétrico. Sua estatística se baseia na divergências entre as frequências observadas e esperadas para um certo evento.

Quando utilizar o teste:

- Comparar a frequência observado com a frequência esperada ou teórica.

- Comprar a frequência entre grupos

Condições necessárias:

- Os grupos devem ser independentes,

- Indivíduos selecionados aleatoriamente,

- As observações devem ser frequências ou contagens,

- Categorias bem definidas e discretas,

- Número de observações por categoria deve ser superior a 10.

https://github.com/Gorgens/udemy/blob/master/quiQuadrado.R

02:28
Sobre o teste:

Comparar o formato de duas distribuição. Este também é um teste não paramétrico e é especialmente indicado para distribuições continuas.

Quando utilizar o teste:

- Para determinar se duas distribuições diferem uma da outra;

- Para determinar se uma distribuições difere da distribuição em hipótese

https://github.com/Gorgens/udemy/blob/master/kolmogorov.R

02:56
Sobre o teste:

Teste F é usado para comparar a variabilidade entre grupos em relação à variabilidade dentro dos grupos (ANOVA experimental), ou para comparar a variância explicada por um determinado modelo (quadrado médio do modelo) com a variância não explicada (quadrado médios dos residuos) (ANOVA da regressão), ou ainda para comparar as variâncias entre dois grupos de dados.

Pressuposições:

Exige tanto a normalidade dos dados quanto a homogeneidade de variâncias.

https://github.com/Gorgens/udemy/blob/master/test_F.R

02:56
Sobre o teste:

Teste t é um teste de médias, que em sua versão clássica foi desenvolvido para dados normais, independentes e de variâncias iguais. Mas existem inúmeras variantes que devem ser utilizadas conforme a situação de estudo: teste t para amostras pareadas e não pareadas, para 1 ou duas médias, para variâncias conhecidas ou desconhecidas, e para amostras balanceadas e desbalanceadas.

Pressuposições:

O ponto comum para todos eles é que as populações que estão sendo comparadas devem seguir a distribuição normal, uma vez que dependem de um parâmetro de escala (ex: desvio padrão) para que verificar a significância da média.

https://github.com/Gorgens/udemy/blob/master/test_t.R

4 questions

Veja como foi sua assimilação do conteúdo sobre testes de hitpóteses.

Section 6: Análise de regressão
05:40
Regressão linear

A regressão linear é um método para se estimar o valor esperado de uma variável Y, dados os valores de uma(s) variável(is) X. Os modelos que dependem de forma linear dos seus parâmetros desconhecidos, são fáceis de ajustar, isto faz com que o seu uso seja muito frequente na análise estatística em geral.

https://github.com/Gorgens/udemy/blob/master/linear.R

05:35
Regressão Não Linear

A regressão não-linear é uma forma de análise em que os dados são modelados por uma função que é uma combinação não-linear dos parâmetros, das variáveis, ou de ambos. Está incluído no R o pacote nls() que ajusta modelos não-lineares pelo método dos mínimos quadrados. A construção do comando é muito parecida com o pacote para ajuste de regressão linear.

https://github.com/Gorgens/udemy/blob/master/naoLinear.R

4 questions

Teste seu desempenho com relação à nossa seção 5.

Section 7: Loopings e funções
04:12
Looping while

Estrutura de repetição while é uma estrutura de desvio do fluxo de controle presente em linguagens de programação que repete um determinado algoritmos dependendo se uma condição é verdadeira ou falsa. Estão associados a uma estrutura de repetição uma condição e um bloco de código. Após o final da execução do bloco, a condição é verificada, e caso ela ainda seja verdadeira, o código é executado novamente. O objetivo do looping é repetir uma determinada tarefa até que uma condição seja atendida.

07:03

Um exemplo do looping 'while'.

https://github.com/Gorgens/udemy/blob/master/loopWhile.R

02:12
Looping For

Estrutura de repetição 'for' é uma estrutura de desvio do fluxo de controle presente em linguagens de programação que repete um determinado algoritmos durante uma condição. Estão associados a uma estrutura de repetição uma condição e um bloco de código. Antes da execução do bloco, a condição é verificada, e caso ela ainda seja verdadeira, o código é executado.

03:24

Em exemplo do looping 'for'.

https://github.com/Gorgens/udemy/blob/master/loopFor.R

03:14
Criando funções

Criar uma função significa encapsular um pedaço de código. Uma função pode contar com parâmetros que modificam sua forma de atuação de acordo com o valor que ele assume. As funções uma vez criadas podem ser requisitadas pelo programador a qualquer momento dentro do código, ou dentro do outra função.

https://github.com/Gorgens/udemy/blob/master/funcoes.R

05:42

Combinar funções e looping torna o seu código mais eficiente e potente. Vamos ver um exemplo de como é possível combinar estes dois recursos da programação.

https://github.com/Gorgens/udemy/blob/master/forFuncao.R

4 questions

Este é nosso último teste. Veja como foi seu desempenho na seção 6.

Section 8: Encerramento
01:49

E agora? Como aprofundar meus conhecimentos no R?

01:56

Obrigado por prestigiarem o Curso Computação em R.

Espero que vcs tenham gostado do R e que se tornem usuários frequentes desta ferramenta. Lembrem-se, desafiem-se sempre! Apenas o uso e o envolvimento constante lhe trará o domínio de qualquer ferramenta.

Sucesso e até breve.

Students Who Viewed This Course Also Viewed

  • Loading
  • Loading
  • Loading

Instructor Biography

Eric Görgens, Prof. Dr. Engenheiro Florestal

Eric Bastos Gorgens é engenheiro florestal nascido em Belo Horizonte. Gradou-se com louvor e obteve seu título de mestre em recursos florestais pela Universidade Federal de Viçosa. Obteve o título de doutor em Recursos Florestais pela Universidade de São Paulo. Sempre buscou aprimorar suas habilidades através de estágios e atividades complementares o que permitiu se envolver em projetos nas companhias CENIBRA, Arcelor Mittal, Suzano Papel e Celulose e TreeSoftware. De 2006 a 2011 trabalhou nas empresas Votorantim Metais e Companhia do Vale do Araguaia, exercendo atividades de engenheiro júnior até coordenador de área. De 2009 a 2011 atuou como professor em disciplinas dos cursos de administração e agronegócio das Faculdades Cathedral. Mantem contato com importantes centros de pesquisa dos quais destacam-se University of British Columbia, University Eastern of Finland and Swedish University of Agriculture Sciences. Mantêm dois cursos no estilo MOOC, na plataforma da Udemy (Computação em R e Introdução ao Sistema de Informações Geográficas). Atualmente é professor adjunto do Departamento de Engenharia Florestal da Universidade Federal dos Vales do Jequitinhonha e Mucuri em Diamantina, Minas Gerais, Brasil.

Ready to start learning?
Start Learning Now