Machine learning y data science con scikit-learn y pyspark
3.9 (14 ratings)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
97 students enrolled
Wishlisted Wishlist

Please confirm that you want to add Machine learning y data science con scikit-learn y pyspark to your Wishlist.

Add to Wishlist

Machine learning y data science con scikit-learn y pyspark

Aprende las principales técnicas de machine learning y ciencia de datos para aplicarlas en proyectos con python
3.9 (14 ratings)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
97 students enrolled
Last updated 8/2017
Spanish
Current price: $10 Original price: $95 Discount: 89% off
5 hours left at this price!
30-Day Money-Back Guarantee
Includes:
  • 14.5 hours on-demand video
  • 16 Articles
  • 85 Supplemental Resources
  • Full lifetime access
  • Access on mobile and TV
  • Certificate of Completion
What Will I Learn?
  • Investigar que con Python también se puede hacer ciencia de datos y machine learning.
  • Aplicar técnicas de machine learning y ciencia de datos en proyectos con python
  • Que el alumno descubra el potencial de las técnicas de Machine Learning para el análisis de datos y sobre todo para extracción de información a partir de los datos. Es decir, sacar valor a los datos.
  • Presentar con casos prácticas las técnicas de Machine Learning que actualmente se utilizan en soluciones de análisis de datos, tanto en Big Data como en Data Science en general.
  • Dar a conocer una de las herramientas más fáciles de utilizar para aplicar Machine Learning a problemas reales de una manera sencilla, como es Python, Numpy y Scikit-Learn.
View Curriculum
Requirements
  • Es necesario tener conocimientos básico de python.
  • Es necesario tener instalada la distribución de Python de Anaconda, preferentemente la versión de Python3. Se usarán principalmente las librerías numpy, scipy, pandas, scikit-learn y pyspark.
  • Es necesario tener instalado python.Trabajaremos con python 3.6
Description
  • Este curso pretende ser una introducción a las técnicas más relevantes de Machine Learning y mostrar ejemplos de aplicación de estas técnicas. Que sirva para conocer qué técnicas existen, en qué se fundamentan y sobre qué tipos de problemas pueden aplicarse. 

  • El enfoque será teórico-práctico y se hará uso del lenguaje de programación Python y del toolkit Scikit Learn. Se recomienda a los alumnos instalarse ANACONDA en su plataforma habitual. ANACONDA incluye Python, Scikit-Learn y Matplotlib. La versión de python que utilizaremos será la 3.6.

  • También veremos pyspark como plataforma de desarrollo de aplicaciones distribuídas

  • Entre los principales objetivos podemos destacar:

  • Introducir los conceptos de ciencias de datos y machine learning.

  • Introducir las principales librerías que podemos encontrar en python para aplicar técnicas de machine learning a los datos.

  • Introducir las principales librerías que podemos encontrar en python para tratamiento y visualización de datos

  • Dar a conocer los pasos para construir un modelo de machine learning, desde la adquisición de datos,pasando por la generación de funciones, hasta la selección de modelos.

  • Dar a conocer los principales algoritmos para resolver problemas de machine learning.

  • Introducir scikit-learn como herramienta para resolver problemas de machine learning.

  • Introducir pyspark como herramienta para aplicar técnicas de big data y map-reduce a los datos.

  • Conocer y aplicar algoritmos de machine learning con pyspark.

  • Introducir los sistemas de recomendación basados en contenidos


Who is the target audience?
  • Desarrolladores python interesados en herramientas de machine learning y data science
Students Who Viewed This Course Also Viewed
Curriculum For This Course
79 Lectures
14:54:48
+
Introducción a la ciencia de datos y machine learning
7 Lectures 57:38

Me presento, hago una presentación del curso,comentando el temario y los principales conocimientos que adquieren los estudiantes cuando lo terminen

Preview 07:39

Definiciones de ciencia de datos y machine learning

Preview 13:38

Introducción y ejemplos de aplicación de machine learning

Introducción al aprendizaje automático
04:42

Se comentarán los principales tipos de aprendizaje automático

Tipos de aprendizaje automático
07:41

Se comentarán los problemas que resuelven cada tipo

Aprendizaje supervisado vs no supervisado
06:52

Se comentará la problemática del sobreentrenamiento en problemas de machine learning y se propondrán algunas soluciones

Problema del sobreentrenamiento
06:43

Se comentarán los principales pasos para construir un modelo de machine learning

Pasos para construir un modelo de machine learning
10:23

Se propondrá un cuestionario básico de preguntas sobre introducción al machine learning

Cuestionario de evaluación machine learning
10 questions
+
Librerías para tratamiento y visualización de datos con python
9 Lectures 01:54:58

Se comentarán los principales librerías,instalación y ejemplos con numpy y pandas

Preview 18:11

Se comentará la instalación de un entorno de desarrollo para python basado en notebook instalando los paquetes mediante anaconda

Se comentarán los principales comandos para instalar paquetes con anaconda

Instalación anaconda + jupyter notebook
18:29

Se comentará el módulo pydatasets que contiene conjuntos de datos predefinidos que podemos usar para realizar pruebas

Conjunto de datasets
12:36

Crear nuestro propio dataset
07:47

Se comentarán las principales funcionalidades de la librería pandas para tratamiento de datos

Introducción a pandas
15:07

Se comentarán ejemplos con las librerías de pandas

Preview 09:17

Se comentarán los principales librerías de visualización de datos en python,

Librerías de visualización de datos con python
13:24

Se comentarán ejemplos para visualización de datos con matplotlib,bokeh, seaborn y folium

Ejemplos prácticos visualización de datos
19:09

Se comentarán librerías relacionadas con machine learning que podemos encontrar en python

Librerías de machine learning con python
00:58

Se propondrá un cuestionario básico de preguntas sobre tratamiento y visualización de datos en python

Cuestionario de evaluación tratamiento y visualización de datos
10 questions
+
Scikit-learn como librería de machine learning
26 Lectures 05:28:50

Instalación de la librería , uso de los principales módulos y datasets incorporados en scikit-learn

Preview 11:22

Datasets sklearn
15:19

Se comentarán los principales algoritmos que vamos a ver y dar una primera visión de los vamos a ver a nivel del API de sklearn para entrenar nuestros datos

Algoritmos de Machine Learning en scikit-learn
16:51

Se introducirá la regresión lineal a nivel teórico y se introducirá cómo podemos aplicarlo de forma gráfica con sklearn y matplotlib

Introducción a la regresión lineal
08:39

Definir en qué consiste el algoritmo de regresión lineal y ejemplo de problema de regresión lineal con un dataset definido en scikit-learn

LinearRegression como algoritmo de regresión lineal
14:34

Se tratará de resolver el problema de predecir el trafico de una web mediante distintos algoritmos de regresión para determinar cuál es el más óptimo

Resolver problema de predecir el tráfico web
14:40

Ejemplo de regresión logística con un dataset definido en scikit-learn

Logistic Regression como algoritmo de regresión logística
12:50

LogisticRegresion gráfico
07:55

Se introducirán los principales conceptos a nivel teórico de los árboles de decisión

Introducción a los árboles de decisión
12:09

Ejemplo de árboles de decisión con un dataset definido en scikit-lear

DecissionTreeClassifier como algoritmo de árboles de decision
18:50

DecissionTreeRegressor como algoritmo de selección de mejores atributos
14:59

Explicación del algoritmo SVM para resolver problemas de clasificación

SVM como algoritmo de máquinas de vectores de soporte
02:04

Ejemplos de clasificador multiclase y gráfico donde se pueden ver los diferentes modelos de implementación de support vectgor machine

Implementación del algoritmo SVM en scikit-learn
13:29

Ejemplo de implementación en python con scikit-learn con el dataset de digits

Clasificador de dígitos con el algoritmo SVM en scikit-learn
19:55

Explicación del algoritmo K-NN (K Nearest Neighbor) para resolver problemas basados en el cálculo de los k vecinos más cercanos

K-NN (K Nearest Neighbor) como algoritmo de clasificación supervisada
14:07

Ejemplos de implementación en python con scikit-learn

Implementación de KNeighborsClassifier en scikit-learn
17:38

Comparación entre ambos modelos de aprendizaje en scikit-learn

KneighborsClassifier vs RadiusNeighborsClassifier
00:25

Explicación del algoritmo de clustering dentro del aprendizaje no supervisado

Clustering y aprendizaje no supervisado
08:18

Describir las principales aplicaciones que se pueden aplicar

Aplicaciones de clustering
00:49

Tipos de clustering
02:20

Explicación del algoritmo Kmeans para resolver problemas de agrupación de datos

K-means como algoritmo de clustering
10:31

Ejemplo de implementación en python con scikit-learn

Implementación de K-means en scikit-learn
21:58

Ejemplos kmeans en scikit-learn
16:25

Imlementación del algoritmo de clustering AffinityPropagation en scikit-learn

AffinityPropagation en scikit-learn
12:52

Mostrar el dataset del titanic con gráficos circular,histograma y de barras

Titanic Dataset gráficos
19:03

Mostrar técnicas de tratamiento de datos antes de aplicar machine learning ,técnicas relacionadas con la limpieza de los datos y la selección de atributos,a nivel de aprendizaje se mostrará el algoritmo de árbol de decisión sobre el dataset de titanic.scv

Titanic Dataset Scikit-learn
20:47

Se propondrá un cuestionario básico de preguntas sobre los algoritmos vistos en scikit-learn

Cuestionario de evaluación scikit-learn
25 questions
+
Pyspark como librería de big data y data science
28 Lectures 05:07:51
Introducción al big data
00:52

Comentar las principales características de Apache Spark y ventajas respecto a otros sistemas

Introducción a Apache Spark
09:49

Comentar los principales módulos de Apache Spark

Módulos de Apache Spark
14:04

Comentar los principales ventajas que aporta Spark para científicos de datos

Spark para Científicos de Datos
01:07

Comentar la instalación de Apache Spark en sistemas unix

Instalación de Apache Spark
13:44

Comentar la ejecución de comandos de spark desde la consola interactiva de python

Consola interactiva en pyspark
00:55

Comentar el principal objeto del que disponemos para trabajar con spark y ejemplos de aplicación mediante scripts de python

SparkContext y esqueleto de una aplicación con pyspark
16:52

  • Comentar el script sparksubmit para lanzar scripts completos en python.
  • Ejemplo de script
SparkSubmit para la ejecución de scripts python
00:27

SparkSubmit parte práctica
14:28

Definir los conceptos de dataset y RDD dentro del contexto de spark

Datasets y RDD con pyspark
01:25

Crear colecciones de datos con pyspark

Crear un RDD en python con pyspark
13:04

  • Comentar las principales operaciones que se pueden aplicar a las colecciones de datos con pyspark.
  • Transformaciones y acciones.
  • Ejemplos prácticos de operaciones
Operaciones sobre un RDD
12:06

Comentar las principales transformaciones que se pueden aplicar a las colecciones de datos con pyspark.

Transformaciones sobre un RDD
22:03

  • Comentar las principales funciones en spark para tratar un problema mediante map reduce.
  • Ejemplo de map reduce
Map Reduce en pyspark
08:59

Funciones lambda,map,filter,reduce en python

Funciones lambda en python
03:21

Resumen operaciones pyspark

Resumen operaciones pyspark
21:42

Resumen operaciones map reduce

Resumen operaciones map reduce
19:16

Comentar la instalación y ejecución de pyspark con docker

Instalar y ejecutar Pyspark con docker
02:38

Ejemplo de scripts en python con jupyter notebook

Contador de palabras con pyspark
18:15

Palabras más frecuentes de un texto con pyspark

Palabras más frecuentes de un texto con pyspark
08:42

Leer fichero csv y cargarlo como un RDD en spark

Leer ficheros csv
10:20

  • Comentar los principales modos de lectura y carga de ficheros
  • Ejemplo de lectura csv y json
Lectura ficheros json con pyspark
12:14

  • Introducir Spark SQL  como módulo que permite trabajar con datos estructurados
  • Ejemplo de operación sql y estructuras dataframes
Trabajando con Spark SQL y dataframes
22:24

Resumen operaciones sql dataframes pyspark

Resumen operaciones sql dataframes pyspark
20:04

Introducir MLlib como módulo de machine learning comentando los principales algoritmos que podemos utilizar

MLlib como módulo de machine learning con pyspark
09:14

Introducción a MLlib
04:58

  • Comentar qué algoritmos podemos usar dentro de pyspark para solucionar un problema de clasificación de correo spam.
  • Ejemplo de algoritmo con python
Ejemplo clasificación Spam con mLlib
14:33

  • Comentar un problema de clustering y cómo podemos solucionarlo con pyspark
  • Ejemplo algoritmo kmeans con python
Clustering con pyspark. Algoritmo Kmeans
10:12

Se propondrá un cuestionario básico de preguntas sobre las operaciones y los algoritmos  disponibles en pyspark

Cuestionario de evaluación pyspark
15 questions
+
Sistemas de recomendación
8 Lectures 01:12:54
Definir sistema de recomendación
07:24

Tipos de sistemas de recomendación
08:25

  • Introducir los filtros basados en contenido
  • Mostrar un ejemplo con python de filtro basado en el contenido


Filtros basados en contenido (Content-Based Filtering)
03:57

Sistema de recomendaciones que recomiende películas a los usuarios

Practica filtro basado en contenido
14:07

Practica filtro basado en contenido mediante extracción de atributos
18:42

  • Introducir los filtros colaborativos
  • Mostrar un ejemplo con python de filtro colaborativo
Filtros colaborativos (Collaborative Filtering)
01:22

Practica en notebook con ejemplo de recomendación basado en filtro colaborativo donde se usa el dataset de movielens que contiene películas y usuarios que votan las mismas.

Práctica filtro colaborativo
18:16

Conclusiones
00:40

Se propondrá un cuestionario básico de preguntas sobre los sistemas de recomendación

Cuestionario de evaluación sistemas de recomendación
10 questions
+
Recursos y artículos
1 Lecture 13:57

Recursos y artículos

Recursos y artículos
13:57
About the Instructor
José Manuel Ortega
3.9 Average rating
14 Reviews
97 Students
1 Course
Security Researcher && Software Engineer

Soy Ingeniero de Software centrado en nuevas tecnologías, código abierto, seguridad y testing. Mi carrera se ha centrado en especializarme en Python y proyectos relacionados con seguridad informática.En los últimos años me he interesado en sistemas de inteligencia artificial y aprendizaje automático,y cómo obtener inteligencia de los datos en proyectos big data.En este momento soy ingeniero de pruebas de seguridad y mis funciones son el análisis y las pruebas de seguridad de las aplicaciones.