Introducción a Data Scientist programando en R
4.4 (6 ratings)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
30 students enrolled
Wishlisted Wishlist

Please confirm that you want to add Introducción a Data Scientist programando en R to your Wishlist.

Add to Wishlist

Introducción a Data Scientist programando en R

Analiza Redes Sociales desde cero para convertirte en un Héroe del Dato
4.4 (6 ratings)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
30 students enrolled
Created by David Manero
Last updated 7/2017
Spanish
Curiosity Sale
Current price: $10 Original price: $100 Discount: 90% off
30-Day Money-Back Guarantee
Includes:
  • 5.5 hours on-demand video
  • 6 Articles
  • 17 Supplemental Resources
  • Full lifetime access
  • Access on mobile and TV
  • Certificate of Completion
What Will I Learn?
  • Los estudiantes serán capaces de iniciarse en el uso del lenguaje R, desde la instalación del programa hasta la realización de los fundamentos de la Ciencia de los Datos, esto es, captación y limpieza de datos, análisis exploratorio, modelización y predicción y la visualización de los datos recogidos.
View Curriculum
Requirements
  • Los estudiantes tendrán conocimientos básicos de estadística y programación, aunque se les proporcionarán referencias en los puntos que sean realmente necesarios. En caso de que el estudiante tenga estos conocimientos avanzados, encontrará en el curso un nuevo lenguaje, R, y nuevos conceptos para utilizar en el análisis de datos.
Description

Aprende la Ciencia de los Datos utilizando R con ejemplos del análisis de Redes Sociales. Al finalizar el curso serás capaz de usar el lenguaje R como Data Scientist, desde la instalación del programa hasta la realización de los fundamentos de la Ciencia de los Datos, esto es, captación y limpieza de datos, análisis exploratorio, modelización y predicción y la visualización de los datos recogidos.

Who is the target audience?
  • El estudiante objetivo viene de la programación, ingeniería, matemáticas o estadística, que quiere introducirse en el mundo de la Ciencia de los Datos (Data Science). No es necesario conocimientos concretos, pero es preferible tener ciertas nociones de estadística y/o de programación, aunque no es imprescindible.
Students Who Viewed This Course Also Viewed
Curriculum For This Course
49 Lectures
05:28:01
+
Introducción
3 Lectures 07:03

Presentación del curso. ¿Qué es la Ciencia de los Datos? ¿Qué hay en este curso? Todas las preguntas que necesites responder.

Preview 02:59

David Manero: Ingeniero de Telecomunicaciones, Consultor, Científico de Datos, Profesor de varias cosas, entre ellas, de Lindy Hop, y Héroe del Dato.

Preview 01:48

Presentación de todos los objetivos del curso: convertirte en un auténtico Héroe del Dato.

Preview 02:16
+
¿Por qué R?
4 Lectures 15:57

¿Qué es R? Una descripción de qué es el lenguaje de programación R y su principales características, así como la presentación de RStudio, el IDE principal de este lenguaje.

Preview 03:59

Video explicativo de como instalar R y RStudio en Mac, aunque es extensible a Linux y Windows.

Preview 02:48

En esta clase veremos el combate del siglo en el mundillo de la Ciencia de los Datos: Python vs R. 

A través de una Infografía realizada por DataCamp, vamos desbrozando todas las interioridades de estos dos lenguajes. Y veremos cuál es el ganador de un lugar entre tus herramientas de Científico de Datos.

Python vs R
09:09

Incluye todo el material complementario de la sección.

Material Complementario de la sección 2
00:01

Cuestionario de la sección 2, sobre qué es R y RStudio y sus diferencias con Python.

Cuestionario ¿Qué es R?
3 questions
+
Fundamentos de R
11 Lectures 01:22:04

Comenzamos a familiarizarnos con RStudio y las primeras nociones de R. Donde están las cosas, para qué sirven los botones, etc...

Comenzamos también a manejarnos con las variables y su asignación en R.

Preview 10:47

Seguimos familiarizándonos con R y RStudio. 

Las operaciones más básicas con las variables numéricas y las alfanuméricas. 

También veremos las diferencias entre introducir comandos por consola, por fichero y ejecutándolo desde el editor de RStudio.

Preview 06:51

Comenzamos a realizar operaciones con variables en R.

Operaciones aritméticas y también operaciones lógicas, así como comandos condicionales para comprobar el uso de las operaciones lógicas.

Preview 07:58

El primer objeto que veremos en esta sección son los vectores.

Veremos cómo asignarlos, y aprenderemos a operar con ellos. Operaciones aritméticas sobre vectores y cómo actúa R con vectores de distintos tamaños.

Objetos: vectores parte I
07:01

Seguimos operando con vectores, comandos especiales para ellos, como sum, max, min, prod, etc...

Objetos: vectores parte II
09:47

El objeto más importa para un científico de datos es el dataframe, que es la forma que tendrán nuestros datasets. 

Un dataframe es una matriz en la que las filas son las distintas observaciones y las columnas son las variables que hay de cada observación.

En esta primera parte generamos un dataframe con el que operaremos.

Objetos: dataframe parte I
07:44

El objeto más importa para un científico de datos es el dataframe, que es la forma que tendrán nuestros datasets. 

Un dataframe es una matriz en la que las filas son las distintas observaciones y las columnas son las variables que hay de cada observación.

En la segunda parte vemos cómo hacer subsets del dataframe original y aprenderemos a acceder a cada uno de los datos.

Objetos: dataframe parte II
07:04

El objeto más importa para un científico de datos es el dataframe, que es la forma que tendrán nuestros datasets. 

Un dataframe es una matriz en la que las filas son las distintas observaciones y las columnas son las variables que hay de cada observación.

En la tercera parte veremos la operaciones principales que podemos realizar con nuestros dataframes.

Objetos: dataframe parte III
08:52

Las listas son un tipo especial de objeto que tiene una mejor performance en el uso dentro de R.

Permite guardar los datos de una forma más ordenada, y nos recuerda a formatos como JSON.

En la lección aprenderemos a generarlas en R y a operar con ellas.

Objetos: listas
09:28

El último objeto que veremos en este curso son las Series de Tiempo. Aunque no las utilicemos más adelante, conviene conocerlas, ya que son muy importantes para análisis de datos, por ejemplo, en el mundo del e-commerce, o para procesos en los que el tiempo es un factor muy importante.

Objetos: series de tiempo
06:31

Incluye todo el material complementario de la sección.

Material Complementario de la sección 3
00:01

Cuestionario de la sección 3 sobre las principales funciones de R

Cuestionario Fundamentos de R
10 questions
+
Origen y Limpieza de Datos
10 Lectures 01:15:59

La fuente de los datos suele ser una de nuestras primeras preocupaciones. ¿De dónde los sacamos? ¿Cómo convertirlos en un dataframe u otro objeto que podamos utilizar en R?

Vamos a localizar un set de datos alojado en la página web de la ciudad de Baltimore, en EE.UU., y lo descargaremos en nuestro local, utilizando R para realizar este proceso.

Carga de Datos: Descarga de un fichero desde internet
04:08

Una vez tenemos un archivo en nuestro local, hay que cargarlo en R. En esta lección veremos cómo hacerlo de una manera sencilla.

Carga de Datos: Carga de un fichero en R
08:12

Conocemos el objeto dataframe, ahora vamos a pelearnos con él.

Con el archivo descargado de internet y cargado en nuestro RStudio, vamos a empezar a repasar las principales operaciones y funciones que podemos hacer con él.

Operaciones con Data Frames parte I
07:41

Conocemos el objeto dataframe, ahora vamos a pelearnos con él.

Seguimos con los operadores de resumen que nos proporcionan una información general del dataframe.

Operaciones con Data Frames parte II
06:00

Conocemos el objeto dataframe, ahora vamos a pelearnos con él.

Trabajamos ahora con otros sets de datos de ejemplo y veremos funciones de relaciones entre variables como xtabs.

Operaciones con Data Frames parte III
09:27

Twitter tiene una API pública desde la que se puede descargar información de usuarios, tweets, topics, etc.

En esta lección echaremos un vistazo a lo que nos ofrece y nos crearemos una cuenta como desarrollador. Es necesario tener una cuenta de usuario de Twitter para realizar esta y las siguientes lecciones, así que, si todavía no la tienes, ¡date de alta! 

Redes Sociales: API pública de Twitter
07:03

Cargaremos el paquete TwitteR, el más indicado para acceder a la API pública de Twitter.

Con los datos obtenidos al daros de alta como desarrolladores de Twitter, podéis conectaros a la API pública. 

También veremos los límites de la API pública, que será muy necesario tenerlos controlados para que no se nos bloquee el acceso de forma temporal.

Paquete TwitteR parte I
11:32

En esta lección veremos los comandos getUser, searchTwitter y getTrends del paquete TwitteR.

Paquete TwitteR parte II
14:03

En este apartado veremos algunas funciones específicas de los usuarios, como getFollowers o getFriends.

Paquete TwitteR parte III
07:52

Incluye todo el material complementario de la sección.

Material Complementario de la sección 4
00:01

Cuestionario sobre la sección 4, Origen de los Datos y Limpieza de los Datos.

Cuestionario Origen de los Datos y Limpieza
10 questions
+
Análisis Exploratorio
5 Lectures 46:01

Vamos a enfrentarnos a un dataset descargado de internet y del que sabemos su estructura, pero no sabemos bien lo que contiene.

Descargaremos una serie de tweets mediante la API pública y lo aumentaremos con una serie de información adicional procedente de operaciones sobre los mismos datos.

Explorando tu data set
12:47

Comenzaremos a analizar algunas de las variables de nuestro dataset y hallaremos las principales funciones estadísticas que las caracterizan.

Principales Funciones Estadísticas parte I
14:07

Continuamos dando un repaso a las principales funciones estadísticas, llegando hasta la desviación estándar, la varianza, la covarianza y la correlación, que nos serán útiles para llegar a algunas conclusiones.

Principales Funciones Estadísticas parte II
12:06

Aunque en la última sección vemos un apartado específico para los datos, en esta lección veremos una serie de gráficos exploratorios útiles para nuestro estudio.

Gráficos Exploratorios
07:00

Incluye todo el material complementario de la sección.

Material Complementario sección 5
00:01

Cuestionario sobre la sección 5 de análisis exploratorio, principales funciones estadísticas, etc.

Cuestionario Análisis Exploratorio
10 questions
+
Modelización y predicción
7 Lectures 50:27

Vamos a realizar un auténtico algoritmo de Científico de Datos.

Realizaremos un estudio de los sentimientos de los tweets sobre 500 tweets de la película "Wonder Woman". El análisis será mediante un algoritmo que nos hemos inventado y que compara las palabras con un diccionario de palabras en el que tenemos medidas su positividad o negatividad.

Mi primer análisis de sentimiento
11:03

Continuamos con el algoritmo sencillo de Análisis de Sentimiento, y veremos los resultados que nos proporciona.

Mi primer análisis de sentimiento parte II
09:37

En este apartado vamos a utilizar el Algoritmo de Naive Bayes para tratar de hacer una predicción del sentimiento de los tweets. Utilizaremos el resultado de nuestro algoritmo de Análisis de Sentimiento para entrenarlo, aunque se podrían utilizar otros métodos como el entrenamiento por agente (humano), es decir, coger una muestra y analizar uno a uno los tweets.

Mi primer algoritmo de Machine Learning
10:49

El paquete caret, Classification And REgression Training, es un paquete muy utilizado para realizar modelos de clasificación y clusterización en Machine Learning en R.

En esta lección veremos sus principales características.

Paquete caret
04:57

Utilizaremos el paquete caret para replicar de una forma más ordenada nuestro algoritmo de Machine Learning de sentimientos.

Paquete caret. Caso práctico: sentimientos
09:03

Volvemos a utilizar el paquete caret, esta vez para analizar un dataset que muestra una serie de características de un mail y nos dice si es spam o no lo es.

Con la ayuda de caret haremos un modelo de Machine Learning con la base del GLM, o Modelo Linear Generalizado.

Paquete caret. Caso práctico: spam
04:57

Incluye todo el material complementario de la sección.

Material Complementario sección 6
00:01

Cuestionario sobre la sección 6 de modelización de datos, el análisis de sentimientos y la modelización de datos con caret.

Cuestionario Modelización y Predicción
10 questions
+
Visualización de datos
6 Lectures 44:56

En esta lección vamos a dar un repaso general de las principales funciones gráficas que ofrece R base. Como R está específicamente diseñado para la Ciencia de los Datos, incluye en su raíz una buena cantidad de opciones para dibujar los gráficos muy interesantes.

Gráficos 101. Los gráficos básicos de R.
11:13

Si los gráficos base de R no son suficientes para tí, y quieres realizar una aplicación visualmente atractiva, R ofrece la posibilidad de añadir nuevos paquetes gráficos. 

En esta lección conocerás la libreria Highcharts que ofrece un gran cantidad de gráficos interactivos y visualmente muy atractivos que pueden mejorar cualquier aplicación. 

Highcharts funciona en JS, pero la libreria Highcharter nos ofrece toda su potencia en nuestro querido R.

Gráficos para molar: Highcharts y Highcharter
04:38

Hacemos un repaso a los principales gráficos de Highcharts utilizando la librería Highcharter.

Veremos un pie chart, un gráfico de tipo línea, uno de tipo área porcentual, y uno de tipo polar, con forma de tela de araña.

Algunos ejemplos con Highcharter
11:08

Shiny es una librería desarrollada por los creadores de RStudio, el IDE de R, que nos permite desarrollar aplicaciones web sin conocimientos de programación php, JS, etc. Y que, además, nos permite incluir nuestros desarrollos en R.

Una herramienta muy interesante y realmente potente para ofrecer productos de datos más que interesantes.

Desarrollo de aplicaciones con Shiny
05:55

En esta lección, la última del curso, podrás poner en funcionamiento lo aprendido en lecciones anteriores y terminaremos convirtiendo el código de Análisis de Sentimientos desarrollada, en una aplicación que puede funcionar en una web.

App Sentimientos de películas en Twitter
12:01

Incluye todo el material complementario de la sección.

Material Complementario sección 7
00:01

Cuestionario sobre la sección 7, gráficos básicos de R, highcharts y shiny.

Cuestionario Visualización de Datos
10 questions
+
Conclusiones y Despedida
3 Lectures 05:31

Si has llegado hasta aquí, ¡¡¡Enhorabuena!!!.

Resumen de lo que hemos visto en este curso.

Resumen del curso
02:49

¿Y ahora qué? Te propongo una serie de cosas que se pueden hacer a partir de este momento.

Conclusiones y próximos pasos
02:20

Muchas gracias por todo. Espero que hayas disfrutado al menos tanto como yo lo he hecho al hacer este curso. ¡¡¡Ya eres un héroe del dato!!!

Despedida
00:22
About the Instructor
David Manero
4.4 Average rating
6 Reviews
30 Students
1 Course
Data Scientist

Mi nombre es David Manero, y estudié Ingeniería de Telecomunicaciones en Zaragoza, España, cuando las carreras eran de 5 años (A mí me costó 6…)

Tras trabajar unos cuantos años en el mundo de la consultoría, fundamentalmente, descubrí en el año 2010 el Big Data y desde entonces no he podido dejarlo.

Fui cofundador de una empresa que se dedica al análisis de Redes Sociales para generar información de valor añadido para empresas y realiza micro-segmentaciones. En esta empresa me auto-formé en el mundo de la Ciencia de los Datos y, posteriormente, realicé diversos cursos y másters para tener unas titulaciones más “formales”.

También he trabajado para empresas de varios sectores analizando información de tráfico on-line y de e-commerce de diversas índoles, desde alimentación, turismo, moda, etc.

También he trabajado con datos financieros y de seguros y de operadoras telefónicas.

Además de los Datos, me gustan mucho los videojuegos, y también me he formado en la programación de los mismos.

Tengo experiencia impartiendo cursos. Espero que se note. He realizado varios cursos de Project Management en mi época de consultor. Y, nos os lo creeréis, pero desde 2010 también, doy clases de baile como profesor. Soy un enamorado de la música swing y de su baile, el Lindy Hop.

Así que: Ingeniero, emprendedor, lindy hoper, profesor, … son muchas cosas. La verdad es que soy un tío muy normal, un poco friki, y con ganas de aprender, y enseñar lo aprendido.