Desembarcando en R

Desembarca en R, pisando tierra firme! Con este curso práctico e introductorio de R para Ciencia de Datos
Rating: 4.3 out of 5 (326 ratings)
7,390 students
Desembarcando en R
Rating: 4.3 out of 5 (326 ratings)
7,392 students
Nueva edición en: EscuelaDeDatosVivos. AI !
Uso de Rstudio (entorno de desarrollo)
Introducción al universo tidyverse y dplyr para análisis y preparación de datos
Introducción a crear un modelo machine learning (random forest)
Como cargar archivos txt/csv
Manejo de datos, filtrar y reemplazar valores (R base, filter y mutate)
Introducción al análisis exploratorio de datos (visual y numérico)
Introducción a gráficos con ggplot2
Ordenar y seleccionar columnas (arrange y select)
Identificar reemplazar valores nulos (NA)
Operadores aritméticos y lógicos
Agrupar y sumarizar datos (group_by y summarise)
Validar resultados del modelo con datos nuevos (curva gain)
Bonus track! (R Markdown)

Requirements

  • Se recomienda algunos conocimientos básicos de programación
Description

Actualización! Este curso migra con una 2da edición con más material a: EscuelaDeDatosVivos.AI :D


Bienvenid@s!

Este curso busca hacer una breve introducción, a los temas centrales de Ciencia de Datos, orientado a personas que nunca vieron nada de R.


A lo largo de 11 laboratorios, y 17 videos (más un bonus track), se le plantea al estudiante distintos métodos y funciones, para poder abordar eficientemente los temas comunes como son:

  1. Carga de datos

  2. Análisis exploratorio de datos

  3. Preparación de datos

  4. Creación y validación de un modelo predictivo


Los paquetes que usaremos serán: tidyverse (con dplyr y ggplot2), funModeling, corrr, Hmisc y randomForest.


Todos los laboratorios cuentan con su sección de ejercicios (y su correspondiente resolución), punto clave para poder fijar los conocimientos vistos.


Es un curso pensado para terminar en 5-días, incluyendo la parte de ejercicios. No es indispensable terminarlos todos, pero si intentarlo. La práctica y el error es la mejor manera de aprender.


Si hay algo que no se entiende, o pensás que se puede mejorar, mandame un mensaje y lo tendré en cuenta para agregar como anexo. Es el primer curso online que hago, y estoy aprendiendo a mejorar :)


Este curso es solo el primer paso en su formación como Cientific@s de Datos.


Who this course is for:
  • Personas con conocimientos básicos en programación, con ganas de iniciarse en ciencia de datos
  • Esta planteado de manera genérica, tanto para investigadores como personas de negocio
Curriculum
13 sections • 19 lectures • 1h 46m total length
  • Como usar el curso, descarga de material (labs), Instalar R y links útiles.
  • Introducción a RStudio
  • Acceso a los datos (R base)
  • Estructura de datos
  • Usando R base
  • Análisis exploratorio de datos - parte 1
  • Análisis exploratorio de datos - parte 2
  • Filtrando registros con {filter} del tidyverse
  • Ordenando datos con {arrange}
  • Seleccionando columnas con {select}
  • Creando columnas con {mutate}
  • Manejando nulos con {mutate}
  • Operaciones aritméticas básicas
  • Agrupando con {group_by} y {summarise}
  • Joins entre tabla con {inner/left/anti_join}
  • Graficando con {ggplot}

Instructor
Científico de Datos
Pablo Casas
  • 4.3 Instructor Rating
  • 326 Reviews
  • 7,392 Students
  • 1 Course

Empecé en el mundo de datos cuando data science se llamaba data mining. Atrapado por el hecho de que la temible derivada en matemáticas, servía para que una red neuronal aprenda.

Descubrí R hace aproximadamente 7 años, y desde entonces lo uso para aprender, investigar y trabajar en entornos corporativos. Actualmente me desempeño como Científico de Datos en una empresa de seguridad informática, utilizando modelos de Machine Learning e IA.


Estoy creando contenido para que otros puedan aprender sin las dificultades que me encontré al empezar:

- "Libro Vivo de Ciencia de Datos" (open-source).

- Librería de R `funModeling` (data prep y dataViz).

- Blog posts en "Data Science Heroes".

- Profesor de Machine Learning con R en la Universidad Tecnológica Nacional.