Introducción a Data Scientist programando en R
3.5 (275 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
1,094 students enrolled

Introducción a Data Scientist programando en R

Analiza Redes Sociales desde cero para convertirte en un Héroe del Dato
3.5 (275 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
1,094 students enrolled
Created by David Manero
Last updated 11/2019
Spanish
Spanish [Auto-generated]
Current price: $69.99 Original price: $99.99 Discount: 30% off
5 hours left at this price!
30-Day Money-Back Guarantee
This course includes
  • 6.5 hours on-demand video
  • 6 articles
  • 19 downloadable resources
  • Full lifetime access
  • Access on mobile and TV
  • Assignments
  • Certificate of Completion
Training 5 or more people?

Get your team access to 4,000+ top Udemy courses anytime, anywhere.

Try Udemy for Business
What you'll learn
  • Los estudiantes serán capaces de iniciarse en el uso del lenguaje R, desde la instalación del programa hasta la realización de los fundamentos de la Ciencia de los Datos, esto es, captación y limpieza de datos, análisis exploratorio, modelización y predicción y la visualización de los datos recogidos.
Course content
Expand all 53 lectures 06:27:10
+ Introducción
3 lectures 07:03

Presentación del curso. ¿Qué es la Ciencia de los Datos? ¿Qué hay en este curso? Todas las preguntas que necesites responder.

Preview 02:59

David Manero: Ingeniero de Telecomunicaciones, Consultor, Científico de Datos, Profesor de varias cosas, entre ellas, de Lindy Hop, y Héroe del Dato.

Preview 01:48

Presentación de todos los objetivos del curso: convertirte en un auténtico Héroe del Dato!!!

Preview 02:16
+ ¿Por qué R?
4 lectures 15:57

¿Qué es R? Una descripción de qué es el lenguaje de programación R y su principales características, así como la presentación de RStudio, el IDE principal de este lenguaje.

Preview 03:59

Video explicativo de como instalar R y RStudio en Mac, aunque es extensible a Linux y Windows.

Preview 02:48

En esta clase veremos el combate del siglo en el mundillo de la Ciencia de los Datos: Python vs R. 

A través de una Infografía realizada por DataCamp, vamos desbrozando todas las interioridades de estos dos lenguajes. Y veremos cuál es el ganador de un lugar entre tus herramientas de Científico de Datos.

Python vs R
09:09

Incluye todo el material complementario de la sección.

Material Complementario de la sección 2
00:01

Cuestionario de la sección 2, sobre qué es R y RStudio y sus diferencias con Python.

Cuestionario ¿Qué es R?
3 questions
+ Fundamentos de R
15 lectures 02:21:13

Comenzamos a familiarizarnos con RStudio y las primeras nociones de R. Donde están las cosas, para qué sirven los botones, etc...

Comenzamos también a manejarnos con las variables y su asignación en R.

Preview 10:47

Seguimos familiarizándonos con R y RStudio. 

Las operaciones más básicas con las variables numéricas y las alfanuméricas. 

También veremos las diferencias entre introducir comandos por consola, por fichero y ejecutándolo desde el editor de RStudio.

Preview 06:51

Comenzamos a realizar operaciones con variables en R.

Operaciones aritméticas y también operaciones lógicas, así como comandos condicionales para comprobar el uso de las operaciones lógicas.

Preview 07:58

El primer objeto que veremos en esta sección son los vectores.

Veremos cómo asignarlos, y aprenderemos a operar con ellos. Operaciones aritméticas sobre vectores y cómo actúa R con vectores de distintos tamaños.

Objetos: vectores parte I
07:01

Seguimos operando con vectores, comandos especiales para ellos, como sum, max, min, prod, etc...

Objetos: vectores parte II
09:47

El objeto más importa para un científico de datos es el dataframe, que es la forma que tendrán nuestros datasets. 

Un dataframe es una matriz en la que las filas son las distintas observaciones y las columnas son las variables que hay de cada observación.

En esta primera parte generamos un dataframe con el que operaremos.

Objetos: dataframe parte I
07:44

El objeto más importa para un científico de datos es el dataframe, que es la forma que tendrán nuestros datasets. 

Un dataframe es una matriz en la que las filas son las distintas observaciones y las columnas son las variables que hay de cada observación.

En la segunda parte vemos cómo hacer subsets del dataframe original y aprenderemos a acceder a cada uno de los datos.

Objetos: dataframe parte II
07:04

El objeto más importa para un científico de datos es el dataframe, que es la forma que tendrán nuestros datasets. 

Un dataframe es una matriz en la que las filas son las distintas observaciones y las columnas son las variables que hay de cada observación.

En la tercera parte veremos la operaciones principales que podemos realizar con nuestros dataframes.

Objetos: dataframe parte III
08:52

Las listas son un tipo especial de objeto que tiene una mejor performance en el uso dentro de R.

Permite guardar los datos de una forma más ordenada, y nos recuerda a formatos como JSON.

En la lección aprenderemos a generarlas en R y a operar con ellas.

Objetos: listas
09:28

El último objeto que veremos en este curso son las Series de Tiempo. Aunque no las utilicemos más adelante, conviene conocerlas, ya que son muy importantes para análisis de datos, por ejemplo, en el mundo del e-commerce, o para procesos en los que el tiempo es un factor muy importante.

Objetos: series de tiempo
06:31

Explicación de la "teoría" que hay detrás de los bucles.

Bucles Explicación
07:26

Veremos el funcionamiento de los bucles FOR, FOR anidados, y WHILE.

Bucles parte I
16:28

Seguimos con el bucle REPEAT, los comandos BREAK y NEXT y una consideración de cuando usar o no los bucles.

Bucles parte II
18:59

¿Cómo funcionan las funciones en R? En esta clase veremos con ejemplos cómo funcionan las funciones, sus parámetros y el retorno.

Funciones
16:16

Incluye todo el material complementario de la sección.

Material Complementario de la sección 3
00:01

Cuestionario de la sección 3 sobre las principales funciones de R

Cuestionario Fundamentos de R
10 questions
+ Origen y Limpieza de Datos
10 lectures 01:15:59

La fuente de los datos suele ser una de nuestras primeras preocupaciones. ¿De dónde los sacamos? ¿Cómo convertirlos en un dataframe u otro objeto que podamos utilizar en R?

Vamos a localizar un set de datos alojado en la página web de la ciudad de Baltimore, en EE.UU., y lo descargaremos en nuestro local, utilizando R para realizar este proceso.

Carga de Datos: Descarga de un fichero desde internet
04:08

Una vez tenemos un archivo en nuestro local, hay que cargarlo en R. En esta lección veremos cómo hacerlo de una manera sencilla.

Carga de Datos: Carga de un fichero en R
08:12

Conocemos el objeto dataframe, ahora vamos a pelearnos con él.

Con el archivo descargado de internet y cargado en nuestro RStudio, vamos a empezar a repasar las principales operaciones y funciones que podemos hacer con él.

Operaciones con Data Frames parte I
07:41

Conocemos el objeto dataframe, ahora vamos a pelearnos con él.

Seguimos con los operadores de resumen que nos proporcionan una información general del dataframe.

Operaciones con Data Frames parte II
06:00

Conocemos el objeto dataframe, ahora vamos a pelearnos con él.

Trabajamos ahora con otros sets de datos de ejemplo y veremos funciones de relaciones entre variables como xtabs.

Operaciones con Data Frames parte III
09:27

Twitter tiene una API pública desde la que se puede descargar información de usuarios, tweets, topics, etc.

En esta lección echaremos un vistazo a lo que nos ofrece y nos crearemos una cuenta como desarrollador. Es necesario tener una cuenta de usuario de Twitter para realizar esta y las siguientes lecciones, así que, si todavía no la tienes, ¡date de alta! 

Redes Sociales: API pública de Twitter
07:03

Cargaremos el paquete TwitteR, el más indicado para acceder a la API pública de Twitter.

Con los datos obtenidos al daros de alta como desarrolladores de Twitter, podéis conectaros a la API pública. 

También veremos los límites de la API pública, que será muy necesario tenerlos controlados para que no se nos bloquee el acceso de forma temporal.

Paquete TwitteR parte I
11:32

En esta lección veremos los comandos getUser, searchTwitter y getTrends del paquete TwitteR.

Paquete TwitteR parte II
14:03

En este apartado veremos algunas funciones específicas de los usuarios, como getFollowers o getFriends.

Paquete TwitteR parte III
07:52

Incluye todo el material complementario de la sección.

Material Complementario de la sección 4
00:01

Cuestionario sobre la sección 4, Origen de los Datos y Limpieza de los Datos.

Cuestionario Origen de los Datos y Limpieza
10 questions
+ Análisis Exploratorio
5 lectures 46:01

Vamos a enfrentarnos a un dataset descargado de internet y del que sabemos su estructura, pero no sabemos bien lo que contiene.

Descargaremos una serie de tweets mediante la API pública y lo aumentaremos con una serie de información adicional procedente de operaciones sobre los mismos datos.

Explorando tu data set
12:47

Comenzaremos a analizar algunas de las variables de nuestro dataset y hallaremos las principales funciones estadísticas que las caracterizan.

Principales Funciones Estadísticas parte I
14:07

Continuamos dando un repaso a las principales funciones estadísticas, llegando hasta la desviación estándar, la varianza, la covarianza y la correlación, que nos serán útiles para llegar a algunas conclusiones.

Principales Funciones Estadísticas parte II
12:06

Aunque en la última sección vemos un apartado específico para los datos, en esta lección veremos una serie de gráficos exploratorios útiles para nuestro estudio.

Gráficos Exploratorios
07:00

Incluye todo el material complementario de la sección.

Material Complementario sección 5
00:01

Cuestionario sobre la sección 5 de análisis exploratorio, principales funciones estadísticas, etc.

Cuestionario Análisis Exploratorio
10 questions
+ Modelización y predicción
7 lectures 50:27

Vamos a realizar un auténtico algoritmo de Científico de Datos.

Realizaremos un estudio de los sentimientos de los tweets sobre 500 tweets de la película "Wonder Woman". El análisis será mediante un algoritmo que nos hemos inventado y que compara las palabras con un diccionario de palabras en el que tenemos medidas su positividad o negatividad.

Mi primer análisis de sentimiento
11:03

Continuamos con el algoritmo sencillo de Análisis de Sentimiento, y veremos los resultados que nos proporciona.

Mi primer análisis de sentimiento parte II
09:37

En este apartado vamos a utilizar el Algoritmo de Naive Bayes para tratar de hacer una predicción del sentimiento de los tweets. Utilizaremos el resultado de nuestro algoritmo de Análisis de Sentimiento para entrenarlo, aunque se podrían utilizar otros métodos como el entrenamiento por agente (humano), es decir, coger una muestra y analizar uno a uno los tweets.

Mi primer algoritmo de Machine Learning
10:49

El paquete caret, Classification And REgression Training, es un paquete muy utilizado para realizar modelos de clasificación y clusterización en Machine Learning en R.

En esta lección veremos sus principales características.

Paquete caret
04:57

Utilizaremos el paquete caret para replicar de una forma más ordenada nuestro algoritmo de Machine Learning de sentimientos.

Paquete caret. Caso práctico: sentimientos
09:03

Volvemos a utilizar el paquete caret, esta vez para analizar un dataset que muestra una serie de características de un mail y nos dice si es spam o no lo es.

Con la ayuda de caret haremos un modelo de Machine Learning con la base del GLM, o Modelo Linear Generalizado.

Paquete caret. Caso práctico: spam
04:57

Incluye todo el material complementario de la sección.

Material Complementario sección 6
00:01

Cuestionario sobre la sección 6 de modelización de datos, el análisis de sentimientos y la modelización de datos con caret.

Cuestionario Modelización y Predicción
10 questions
+ Visualización de datos
6 lectures 44:56

En esta lección vamos a dar un repaso general de las principales funciones gráficas que ofrece R base. Como R está específicamente diseñado para la Ciencia de los Datos, incluye en su raíz una buena cantidad de opciones para dibujar los gráficos muy interesantes.

Gráficos 101. Los gráficos básicos de R.
11:13

Si los gráficos base de R no son suficientes para tí, y quieres realizar una aplicación visualmente atractiva, R ofrece la posibilidad de añadir nuevos paquetes gráficos. 

En esta lección conocerás la libreria Highcharts que ofrece un gran cantidad de gráficos interactivos y visualmente muy atractivos que pueden mejorar cualquier aplicación. 

Highcharts funciona en JS, pero la libreria Highcharter nos ofrece toda su potencia en nuestro querido R.

Gráficos para molar: Highcharts y Highcharter
04:38

Hacemos un repaso a los principales gráficos de Highcharts utilizando la librería Highcharter.

Veremos un pie chart, un gráfico de tipo línea, uno de tipo área porcentual, y uno de tipo polar, con forma de tela de araña.

Algunos ejemplos con Highcharter
11:08

Shiny es una librería desarrollada por los creadores de RStudio, el IDE de R, que nos permite desarrollar aplicaciones web sin conocimientos de programación php, JS, etc. Y que, además, nos permite incluir nuestros desarrollos en R.

Una herramienta muy interesante y realmente potente para ofrecer productos de datos más que interesantes.

Desarrollo de aplicaciones con Shiny
05:55

En esta lección, la última del curso, podrás poner en funcionamiento lo aprendido en lecciones anteriores y terminaremos convirtiendo el código de Análisis de Sentimientos desarrollada, en una aplicación que puede funcionar en una web.

App Sentimientos de películas en Twitter
12:01

Incluye todo el material complementario de la sección.

Material Complementario sección 7
00:01

Cuestionario sobre la sección 7, gráficos básicos de R, highcharts y shiny.

Cuestionario Visualización de Datos
10 questions
+ Conclusiones y Despedida
3 lectures 05:31

Si has llegado hasta aquí, ¡¡¡Enhorabuena!!!.

Resumen de lo que hemos visto en este curso.

Resumen del curso
02:49

¿Y ahora qué? Te propongo una serie de cosas que se pueden hacer a partir de este momento.

Conclusiones y próximos pasos
02:20

Muchas gracias por todo. Espero que hayas disfrutado al menos tanto como yo lo he hecho al hacer este curso. ¡¡¡Ya eres un héroe del dato!!!

Despedida
00:22
Requirements
  • Los estudiantes tendrán conocimientos básicos de estadística y programación, aunque se les proporcionarán referencias en los puntos que sean realmente necesarios. En caso de que el estudiante tenga estos conocimientos avanzados, encontrará en el curso un nuevo lenguaje, R, y nuevos conceptos para utilizar en el análisis de datos.
Description

Aprende la Ciencia de los Datos utilizando R con ejemplos del análisis de Redes Sociales. Al finalizar el curso serás capaz de usar el lenguaje R como Data Scientist, desde la instalación del programa hasta la realización de los fundamentos de la Ciencia de los Datos, esto es, captación y limpieza de datos, análisis exploratorio, modelización y predicción y la visualización de los datos recogidos.

Who this course is for:
  • El estudiante objetivo viene de la programación, ingeniería, matemáticas o estadística, que quiere introducirse en el mundo de la Ciencia de los Datos (Data Science). No es necesario conocimientos concretos, pero es preferible tener ciertas nociones de estadística y/o de programación, aunque no es imprescindible.