
El curso de “Machine Learning con Python” se centra en un subcampo específico de aprendizaje automático llamado modelado predictivo. Este es el campo del aprendizaje automático que es el más útil en la industria y el cual se utilizar la librería de aprendizaje automático scikit-learn en Python por su gran rendimiento y facilidad en su uso.
A diferencia de las estadísticas, donde los modelos se usan para comprender los datos, el modelado predictivo se enfoca en el desarrollo de modelos que hacen las predicciones más precisas a expensas de explicar por qué se hacen las predicciones.
A diferencia del campo más amplio del aprendizaje automático que podría utilizarse con datos en cualquier formato, el modelado predictivo se centra principalmente en datos tabulares (por ejemplo, tablas de números como en una hoja de cálculo).
Bienvenido al curso virtual de machine learning con Python. El objetivo principal de este curso es que el alumnado sea capaz desarrollar experimentos avanzados de analítica de datos de manera muy sencilla dentro del modelado predictivo y, es decir, el conocido área de machine learning.
En la siguiente clase te detallo como está organizado y configurado el curso que estas comenzando. El objetivo es que aproveches al máximo la formación y saques el mayor beneficio de la misma.
¡Comencemos!
En esta lección aprenderás los más importante sobre el uso correcto y óptimo del portal formativo Udemy. Recuerda que si aún sigues tienes algún problema o dificultad durante la formación puedes contactar conmigo.
Para ir conociéndonos todos, te invito a presentarte. Ponle cara a tu perfil y sube un par de proyectos, personales o profesionales, compártelos en el foro de esta clase y cuéntanos en qué lugar o proyecto desearías trabajar idealmente.
Recuerda que desde el apartado de "Preguntas y Respuestas" podrás presentarte al resto de alumnos de este curso y plantear todas las inquietudes que tengas.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Comenzamos nuestro curso de Machine Learning con Python realizando una introducción del proceso paso a paso que se debe de utilizar en el mundo del modelado predictivo con el lenguaje de programación Python. Veremos como Python es un potente lenguaje de programación que nos permitirá analizar y tomar decisiones sobre cualquier conjunto de datos de manera muy sencilla con los conocimientos ya adquiridos de programación que ya deberemos de poseer.
Finalmente, recordarle que la estructura del curso está diseñada de manera que cada unidad está compuesta por una parte de teoría y otra de práctica. Cada una de las unidades dispondrá del PDF de lectura (y presentación) que tendrá todos los conceptos teóricos y varios vídeos que tendrá los conceptos prácticos que deberás reproducir usted en su estudio. Por tanto, es importante, antes de ver la parte de práctica, se entienda y estudie la parte de teoría.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
En esta segunda unidad, se estudiarán una de las partes más importantes para trabajar en analítica predictiva, esto es, es el análisis de los datos y conocer su comportamiento. Para ello, comenzaremos manipulando un conjunto de datos simple en Python para, posteriormente, intentar conocer y entender como es el comportamiento de estos. Para ello, Python nos proporciona una serie de funciones muy interesantes que debemos de hacer uso al inicio de trabajo en modelado predictivo.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
En esta tercera unidad, ampliaremos el concepto de Análisis de datos viendo como se realiza un análisis exploratorio de datos bajo un hilo argumental y sacando algunas conclusiones en nuestro conjunto de datos. Finalmente trabajaremos con algunas funciones de generación de gráficos para ver el comportamiento e interrelaciones de las diferentes característica de un conjunto de datos en particular. Finalmente, deberemos aprender en un primer momento qué métricas tenemos a nuestro alcance para poder evaluar un problema de Machine Learning.
Análisis Exploratorio de Datos: Empezaremos viendo como se realiza un correcto Análisis Exploratorio de nuestros datos con la base de la unidad anterior.
Preprocesamiento de datos. Analizaremos las diferentes técnicas que tenemos a nuestra disposición para poder realizar un buen preprocesamiento de datos y, así, mejorar el rendimiento de nuestros modelos.
Métodos de remuestreo. Aprenderemos a qué nos referimos con la métrica de un modelo para poder estimar su desempeño en los datos no etiquetados.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Una vez realizado un preprocesamiento de los datos aprenderemos a comparar los diferentes resultados de los algoritmos para así crear un modelo más robusto en la fase de predicción. Así mismo, para poder comprenderlos existen técnicas como feature selection nos permitirán seleccionar las variables más significativas en los resultados.
En este sentido, el tema se divide en las siguientes secciones:
Evaluación de las métricas. Descubriremos cómo puede evaluar sus algoritmos de machine learning en Python utilizando una serie de métricas de evaluación estándar.
Feature selection. El proceso de feature selection en los datos permite modelar su problema se denomina selección de mejores características, es decir, atributos más relevantes para los modelos de aprendizaje.
Feature Importance. Este concepto es muy parecido al anterior (por no decir igual), pero la diferencia es que cuando hablamos de Feature Importance es porque vamos a realizar técnicas basadas en algoritmos de Machine Learning para evaluar las características más importante.
Reducción de dimensiones. Un último apartado, más corto pero no menos importante, es la reducción de dimensiones en nuestro conjunto de datos. Para ello utilizaremos la técnica principal que es PCA.
Para los usuario de Windows tenéis que seguir este tutorial para la visualización del árbol
https://www.youtube.com/watch?v=kOYnlqbZ8K4
Por otro lado, la nueva versión de Python no integra six. Por lo que si se quiere visualizar hay que seguir este tutorial: https://stackoverflow.com/questions/61901365/modulenotfounderror-no-module-named-sklearn-externals-six
En todo caso la visualización del árboles es meramente informativo, por lo que se puede prescindir de este punto y continuar con el curso
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
En esta unidad aprenderemos sobre los algoritmos más importantes de machine learning ya que tenemos que comparar el rendimiento de los algoritmos para buscar al mejor candidato. Además, tan importante es aprender de estos algoritmos como también evaluar su rendimiento y, sobre todo, los modelos más avanzados que tenemos a nuestra disposición para poder trabajar problemas avanzados
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Antes de trabajar con proyectos reales en machine learning, es importante trabajar la fase de optimización, para obtener mejores resultados de los algoritmos de machine learning, y forecasting, para trabajar las predicciones de nuestros datos no etiquetados. Antes de ello, deberemos conocer dos aspectos avanzados que nos proporciona Python, el primero es la herramienta Pipeline y, el segundo, es como resolver problemas avanzados de procesamiento de datos muy comunes.
En este sentido las secciones principales de trabajo en esta sección serán:
Procesamiento avanzados de datos. Trataremos problemas avanzados muy típicos que nos vamos a encontrar a la hora de trabajar con un proyecto, estos son, valores NaN, One-Hot Encoding y escalamiento en la clase para problemas de regresión.
Fase de optimización. Aprenderemos las tres formas en que se pueden ajustar los parámetros de un algoritmo de machine learning en Python.
Fase forescasting. Una vez escogido y optimizado nuestro modelo, deberemos guardarlo para poder realizar predicciones de los datos no etiquetados.
Plantilla para proyectos. Finalmente, y antes de empezar a desarrollar los proyectos de machine learning, se expone una plantilla de trabajo, la cual puede ser utilizada para cualquier trabajo de modelado predictivo.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Una vez visto todos los conceptos teórico/prácticos, empezamos a trabajar un proyecto completo de machine learning, es decir, de inicio a fin, evaluando cada una de las partes intermedias a tener en cuenta (tenga en cuenta la plantilla de trabajo).
¡Clase práctica! Recuerda que los archivos y cuadernos asociados a esta clase se encuentran en la primera lectura de esta sección.
Good coding!
¡Clase práctica! Recuerda que los archivos y cuadernos asociados a esta clase se encuentran en la primera lectura de esta sección.
Good coding!
¡Clase práctica! Recuerda que los archivos y cuadernos asociados a esta clase se encuentran en la primera lectura de esta sección.
Good coding!
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Aprendizaje no supervisado es un método de Aprendizaje Automático donde un modelo se ajusta a las observaciones. Se distingue del Aprendizaje supervisado por el hecho de que no hay un conocimiento a priori. En el aprendizaje no supervisado, un conjunto de datos de objetos de entrada es tratado. Así, el aprendizaje no supervisado típicamente trata los objetos de entrada como un conjunto de variables aleatorias, siendo construido un modelo de densidad para el conjunto de datos.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Machine Learning con Python. Aprendizaje Automático Avanzado
Aprendizaje Automático Scikit-Learn en Python. Modelos Predictivos. Data Science. De básico a Experto.
Instructores: PhD. Manuel Castillo y Arquitecto Álvaro García.
Requisitos: Se recomienda tener conocimientos de programación, preferiblemte Python.
Descripción del Curso:
El curso de “Machine Learning con Python” se centra en un subcampo específico de aprendizaje automático llamado modelado predictivo y clustering. Este es el campo del aprendizaje automático que es el más útil en la industria y el cual se utilizar la librería de aprendizaje automático scikit-learn en Python por su gran rendimiento y facilidad en su uso.
A diferencia de las estadísticas, donde los modelos se usan para comprender los datos, el modelado predictivo se enfoca en el desarrollo de modelos que hacen las predicciones más precisas a expensas de explicar por qué se hacen las predicciones.
A diferencia del campo más amplio del aprendizaje automático que podría utilizarse con datos en cualquier formato, el modelado predictivo y clustering se centra principalmente en datos tabulares, llamados técnicamente Tidy Data (por ejemplo, tablas de números como en una hoja de cálculo).
El curso está dirigido a personas que tengan pocos conocimientos de machine learning, conocimientos intermedios del lenguaje de programación y que quieran adentrarse a este apasionante mundo de dentro del campo de modelado predictivo y clustering.
Además, el curso está diseñado para que cualquier estudiante universitario, investigador o tecnólogo que se encuentre realizando o necesite realizar diferentes experimentos a través de grandes conjuntos de datos para poder sintetizarlos en alguna salida predictiva puedan utilizar los muy diferentes recursos de machine learning que nos pone a nuestra disposición el lenguaje de programación.
Contenidos del Curso:
MÓDULO I. Introducción.
Conceptos básicos de machine learning.
Jupyter Notebook como nuestro entorno de machine learning.
Curso rápido de Python.
MÓDULO II. Análisis de datos
Cargar un conjunto de datos.
Estadística descriptiva.
Visualización de datos.
Taller: Trabajo de aplicación de diferentes técnicas analíticas de datos en un conjunto de datos seleccionado por el usuario e interpretar la salida obtenida.
Examen tipo test sobre los contenidos del módulo.
MODULO III. Preprocesamiento de datos
Análisis exploratorio de datos.
Preprocesamiento de datos.
Métodos de remuestreo para estimar la precisión del modelo.
Taller: Trabajo de aplicación de diferentes técnicas de análisis y procesamiento de datos de datos en un conjunto de datos seleccionado por el usuario e interpretar la salida obtenida.
Examen tipo test sobre los contenidos del módulo.
MÓDULO IV. Fase de tratamiento de datos
Evaluación de las métricas.
Feature Selection.
Feature Importance.
Reducción de dimensiones en un dataset.
Taller: Aplicación de diferentes técnicas de tratamiento de datos en un conjunto de datos y verificación de su impacto en las métricas algorítmicas.
Examen tipo test sobre los contenidos del módulo.
MÓDULO V. Fase de modelado
Algoritmos de Machine Learning.
Rendimiento de los algoritmos.
Algoritmos Ensamblados
Algoritmo "Super Lerner"
Taller: Aplicación de diferentes algoritmos de machine learning en un conjunto de datos e interpretar la salida obtenida, así mismo, verificar el algoritmo que tenga mejor comportamiento.
Examen tipo test sobre los contenidos del módulo.
MÓDULO VI. Fase de optimización y forecasting
Pipelines.
Procesamiento de datos avanzado.
Configuración de hiperparámetros.
Guardado e integración del modelo.
Taller: Una vez seleccionados los algoritmos candidatos a modelo realizar una optimización de estos a través de la configuración de sus hiperparámetros.
Examen tipo test sobre los contenidos del módulo.
MÓDULO VII. Proyectos de machine learning
Trabajar un proyecto de clasificación multiclase
Trabajar un proyecto de regresión.
Trabajar un proyecto de clasificación binaria.
Proyecto: Realizar un proyecto completo analizando todas las fases estudiadas en los diferentes módulos.
MÓDULO VIII. Aprendizaje No Supervisado
Aprendizaje No supervisado.
Algoritmos de Aprendizaje No Supervisado.
Determinar el número óptimo de clústers.
Proyecto de Aprendizaje No Supervisado.
Características del Curso:
Recuerda que esta formación incluye lecciones en vídeo fullHD con audio de estudio (compatible con TV, PC, Mac, tablet y smartphone), artículos didácticos, actividades, proyectos paso a paso, recursos descargables, links de interés, acceso de por vida, certificado de finalización, tutorización online, y una exclusiva comunidad de aprendizaje privada que nos ayudamos aportando nuestras experiencias en el foro de comunicación del curso.
Con esta formación disfrutarás aprendiendo desde dónde quieras, sin tener que desplazarte, sin horarios, con quién quieras, según tus necesidades y disponibilidad. Aprenderás con un instructor avalado por miles da alumnos satisfechos en todo el mundo (comentarios certificados). Conocerás las técnicas, métodos, trucos y flujos de trabajo de este sector creativo. El docente te transmitirá su sabiduría y conocimientos con pasión a la vez que las explicaciones concisas, claras, sencillas y con un enfoque profesional en cada clase. Podrás conseguir un certificado homologado personalizado y firmado por tu instructor en cada formación. De está forma podrás compartir tu título en tu portafolio, currículo, en redes sociales...
Con la alta definición de los vídeos (vídeo fullHD y audio de estudio) conseguirá no te perder detalle. Podrás ver las clases las veces que requieras para recordar y perfeccionar tus habilidades como diseñador. Tendrás la posibilidad de preguntar, pedir opinión y ayuda al instructor, además de compartir tu experiencia de aprendizaje con los demás alumnos del curso, tan apasionados como tú, repartidos por todo el mundo. Seleccionamos cuidadosamente los contenidos y producimos cada curso para garantizar una experiencia de aprendizaje online integral y de la máxima calidad.
¿A qué esperas?, este curso es ideal para ti, atrévete a convertirte en un experto. Adelante, nos vemos dentro de la formación ;)