
En la siguiente clase te detallo como está organizado y configurado el curso que estas comenzando. El objetivo es que aproveches al máximo la formación y saques el mayor beneficio de la misma.
¡Comencemos!
En esta lección aprenderás los más importante sobre el uso correcto y óptimo del portal formativo Udemy. Recuerda que si aún sigues tienes algún problema o dificultad durante la formación puedes contactar conmigo.
Comenzamos nuestro curso de machine learning con Weka realizando una introducción de todo lo que estudiaremos y, sobre todo, la instalación de Weka. Weka Workbench será nuestro programa para poder analizar y tomar decisiones sobre cualquier conjunto de datos de manera muy sencilla y sin saber programar.
Para ir conociéndonos todos, te invito a presentarte. Ponle cara a tu perfil y sube un par de proyectos, personales o profesionales, compártelos en el foro de esta clase y cuéntanos en qué lugar o proyecto desearías trabajar idealmente.
Recuerda que desde el apartado de "Preguntas y Respuestas" podrás presentarte al resto de alumnos de este curso y plantear todas las inquietudes que tengas.
Ya que Weka, será nuestro entorno de machine learning aplicado, en esta segunda lección realizaremos un recorrido sobre los diferentes paneles y opciones que nos ofrece este software. Para ello Weka nos ofrece un conjunto de diferentes paneles con diferentes pestañas cada uno de ellos que serán los recursos principales para trabajar machine learning en cualquier conjunto de datos.
En este sentido, los principales paneles que se recorrerán serán:
Panel Explorer: Este panel podemos observar estadísticas de los datos, distribuciones de los diferentes atributos, correlaciones de los atributos, algoritmos de modelado y un largo etcétera, que veremos a continuación.
Panel Experimenter: Este entorno nos ofrece la posibilidad de poder cargar diferentes conjuntos de datos y algoritmos, para posteriormente obtener los resultados y analizarlos en detalle evaluando todos ellos encontrando el mejor resultado.
Panel Explorer: Este panel podemos observar estadísticas de los datos, distribuciones de los diferentes atributos, correlaciones de los atributos, algoritmos de modelado y un largo etcétera, que veremos a continuación.
Panel Experimenter: Este entorno nos ofrece la posibilidad de poder cargar diferentes conjuntos de datos y algoritmos, para posteriormente obtener los resultados y analizarlos en detalle evaluando todos ellos encontrando el mejor resultado.
En esta tercera unidad, se estudiarán las diferentes clasificaciones de datos en machine learning, a interpretar cómo es este conjunto de datos, para, finalmente, realizar un pre-análisis de este conjunto, teniendo en cuenta la clasificación y su interpretación.
Asimismo, repasaremos temas tan importantes como:
Clasificación de datos: Estudiaremos en profundidad los tipos de datos para machine learning y como identificarlos y cargarlos en nuestro entorno de trabajo.
Conjuntos de datos o datasets: Analizaremos los diferentes conjuntos de datos que estudiaremos en nuestro curso, evaluando si es un problema de clasificación binaria, clasificación multiclase o de regresión.
Estadística descriptiva: Interpretaremos nuestros datos con conceptos de estadística descriptiva obteniendo valiosa información respecto al machine learning.
Conjuntos de datos o datasets: Analizaremos los diferentes conjuntos de datos que estudiaremos en nuestro curso, evaluando si es un problema de clasificación binaria, clasificación multiclase o de regresión.
Estadística descriptiva: Interpretaremos nuestros datos con conceptos de estadística descriptiva obteniendo valiosa información respecto al machine learning.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
El pre-procesamiento de los datos es un tema fundamental para mejorar los resultados finales de los diferentes modelos de predicción. Tener unos datos bien estructurados y representados ayudará, tanto al modelo como a nosotros mismos, a comprenderlos mejor. Temas como normalización, estandarización, transformación de los datos y manejar valores ''perdidos'' (missing), serán de gran importancia en los resultados finales de los diferentes modelos.
Por tanto, cada uno de los temas serán:
Normalización y estandarización de datos. Es de sobra conocido que los diferentes algoritmos de machine learning "lanzan" probabilidades en base al aprendizaje de un conjunto de datos de entrenamiento, de ahí la importancia de tener un conjunto de datos bien estructurado y filtrado. Tanto es así, que podemos obtener resultados muy notables si tenemos un conjunto datos bien estudiado, por ejemplo escalar o normalizar nuestro conjunto de datos, puede llevar a una mejor salida de la métrica de los modelos de machine learning.
Transformar los datos. A menudo, los datos ''en bruto'' para el Machine Learning no están en una forma ideal para el modelado, sino que un conjunto de datos debemos prepararlo o remodelarlo para cumplir con las expectativas de los diferentes algoritmos.
Valores "missing" en los datos. Normalmente, los datos no están limpios y, a menudo, puede tener valores corruptos u omisos (no tienen). Es importante identificar, marcar y manejar datos faltantes al desarrollar modelos de machine learning para obtener un mejor rendimiento.
Normalización y estandarización de datos. Es de sobra conocido que los diferentes algoritmos de machine learning "lanzan" probabilidades en base al aprendizaje de un conjunto de datos de entrenamiento, de ahí la importancia de tener un conjunto de datos bien estructurado y filtrado. Tanto es así, que podemos obtener resultados muy notables si tenemos un conjunto datos bien estudiado, por ejemplo escalar o normalizar nuestro conjunto de datos, puede llevar a una mejor salida de la métrica de los modelos de machine learning.
Transformar los datos. A menudo, los datos ''en bruto'' para el Machine Learning no están en una forma ideal para el modelado, sino que un conjunto de datos debemos prepararlo o remodelarlo para cumplir con las expectativas de los diferentes algoritmos.
Valores "missing" en los datos. Normalmente, los datos no están limpios y, a menudo, puede tener valores corruptos u omisos (no tienen). Es importante identificar, marcar y manejar datos faltantes al desarrollar modelos de machine learning para obtener un mejor rendimiento.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Una vez realizado un preprocesamiento de los datos debemos comprenderlos antes de modelarlos. Para poder comprenderlos existen técnicas como feature selection nos permitirán seleccionar las variables más significativas en los resultados. Además, estudiaremos los diferentes algoritmos (lineales, no lineales y ensamblados) para poder realizar estimaciones en su resultado y poder compararlos con un modelo base para un test de significancia estadística.
Por tanto, cada uno de los temas serán:
Feature selection. El proceso de future selection en los datos permite modelar su problema se denomina selección de mejores características, es decir, atributos más relevantes para los modelos de aprendizaje.
Algoritmos de aprendizaje: En esta sección descubrirá los algoritmos de machine learning apoyados por Weka. Estos algoritmos podrán ser lineales, no lineales y/o ensamblados en su variate de aprendizaje supervisado o no supervisado.
Estimar el resultado de los algoritmos. El problema del modelado predictivo es crear modelos que tengan un buen resultado haciendo predicciones sobre nuevos datos no vistos. Cuanto más fiable sea el cálculo del resultado en su modelo, más puede impulsar el resultado y confiar en que se traducirá en el uso operativo de su modelo.
Feature selection. El proceso de future selection en los datos permite modelar su problema se denomina selección de mejores características, es decir, atributos más relevantes para los modelos de aprendizaje.
Algoritmos de aprendizaje: En esta sección descubrirá los algoritmos de machine learning apoyados por Weka. Estos algoritmos podrán ser lineales, no lineales y/o ensamblados en su variate de aprendizaje supervisado o no supervisado.
Estimar el resultado de los algoritmos. El problema del modelado predictivo es crear modelos que tengan un buen resultado haciendo predicciones sobre nuevos datos no vistos. Cuanto más fiable sea el cálculo del resultado en su modelo, más puede impulsar el resultado y confiar en que se traducirá en el uso operativo de su modelo.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
En esta unidad aprenderemos a gestionar en detalle los los diferentes resultados que tienen los algoritmos, diferenciando si nuestro problema es un problema de regresión (recordamos, valor numérico a predecir) o de clasificación (recordamos, valor de clase a predecir). Finalmente, estudiaremos qué son los algoritmos ensamblados y como funcionan estos modelos para problemas de regresión/clasificación.
Las secciones que se discutirán son:
Algoritmos de clasificación: Los 5 algoritmos que veremos serán: (i) Logistic Regression; (ii) Naive Bayes; (iii) Decision Tree; (iv) k-Nearest Neighbors; y (v) Support Vector Machine.
Algoritmos de clasificación: Los 5 algoritmos que veremos serán: (i) Linear Regression; (ii) Multilayer Perceptron; (iii) Decision Tree; (iv) k-Nearest Neighbors; y (v) Support Vector Machine.
Algoritmos ensamblados: Los 5 algoritmos que veremos serán: (i) Boostrap Aggregation; (ii) Random Forest; (iii) AdaBoost; (iv) Voting; y (v) Stacked Generalization.
Algoritmos de clasificación: Los 5 algoritmos que veremos serán: (i) Logistic Regression; (ii) Naive Bayes; (iii) Decision Tree; (iv) k-Nearest Neighbors; y (v) Support Vector Machine.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
Finalizamos los conceptos teórico/prácticos conociendo la fase de predicción para machine learning, esto es, los resultados que nos interesan para, posteriormente, realizar predicciones sobre nuestro problema. Debido a que es el tema fundamental en machine learning, tenemos que profundizar sobre estos conceptos para poder comparar el rendimiento de los algoritmos, configurar sus hiperparámetros y saber guardar el modelo para, finalmente, realizar predicciones. Por tanto, en este tema se estudiará:
Comparar el rendimiento de los algoritmos. Como hemos visto en el capítulo anterior puede hacerse un poco engorroso el tener que estar ejecutando algoritmos y comparando la salida que nos proporciona con el objetivo de buscar el mejor candidato. En este capítulo veremos como minimizar este problema.
Configurar los hiperparámetros de los algoritmos. Al igual que los algoritmos, tener que configurar los hiperparámetros uno por uno se puede hacer también un poco lioso. Weka nos proporciona la posibilidad de analizar un conjunto de hiperparámetros para un algoritmo, optimizando el tiempo de búsqueda de los mejores candidatos.
Guardar el modelo y realizar predicciones. Por último, una vez obtenido el mejor algoritmo candidato con sus mejores hiperparámetros, tenemos que proceder a la fase de predicción para las nuevas instancias no clasificadas.
Una vez visto todos los conceptos teórico/prácticos finalizamos el curso trabajando un proyecto completo, es decir, de inicio a fin, evaluando cada una de las partes intermedias a tener en cuenta.
Sección que dispondrá de una serie de recursos y enlaces interesantes para poder complementar eficazmente la formación del curso.
¡Enhorabuena, finalizaste con éxito la formación!
En esta última clase podrás solicitar tu certificado de finalización del curso, que te será de gran ayuda para complementar tu curriculum vitae.
En esta clase dispones de un espacio para resolver las dudas y consultas que te surjan durante el curso.
Plantea tus dudas y te ayudaré a resolverla. De esta forma todos los alumnos de esta formación podrán participar de las aportaciones mías como instructor como del resto de compañeros del curso.
Mis Cursos en Udemy.
Te invito a conocer el resto de mis formaciones disponibles en la plataforma Udemy.
Y por ser alumno y haber finalizado este curso, te ofrezco un gran descuento en mis cursos online como agradecimiento por tu apoyo y confianza prestada en mis formaciones. Accede al contenido exclusivo de esta lección y consigue tu curso con descuento.
Machine Learning para Investigación con WEKA. De 0 a Experto
Conoce las técnicas más potente y necesarias que un investigador debe tener en su fase de de desarrollo. Weka Workbench
Instructores: PhD. Manuel Castillo y Arquitecto Álvaro García.
Requisitos previos: Ninguno
Descripción
Entre los diferentes software que existen de machine learning automatizado, destaca, sobre todos los demás, Weka Workbench, que es un software libre y gratuito. Este potente software nos ofrece un amplio espectro de opciones para utilizar machine learning sobre cualquier conjunto de datos que tengamos, ya sea de nuestros experimentos u obtenidos de diferentes bancos de datos libres, de manera muy sencilla, sin tener grandes conocimientos sobre el modelo matemático de un algoritmo y, lo más interesante, sin conocimientos de programación.
Son nueve unidades temáticas, en las que contará con vídeos, actividades, temario, foros que le ayudarán a realizar el curso de manera eficiente y entretenida.
Este curso se enfoca en un subcampo específico de la minería de datos llamado modelado predictivo (aprendizaje supervisado) y clústering (Aprendizaje No Supervisado). Este es el campo de la minería de datos que es el más útil en la industria e investigación siendo estas técnicas las más potente y necesarias que un investigador debe tener en su fase de de desarrollo.
A diferencia de las diferentes formas de estadística, donde los modelos se utilizan para comprender los datos, el modelado predictivo se centra en el desarrollo de modelos que hacen las predicciones más precisas a expensas de explicar el por qué se hacen las predicciones. A diferencia del campo más amplio de minería de datos que podría usarse con datos en cualquier formato, el modelado predictivo (aprendizaje supervisado)) y clústering (Aprendizaje No Supervisado) se enfoca principalmente en datos tabulares (por ejemplo, tablas de números como una hoja de cálculo).
En este contexto, el curso pretende otorgar a los estudiantes los conceptos básicos e intermedios relacionados al análisis y tratamiento de datos pero llevando este proceso más allá pudiendo aplicar algoritmos basados en aprendizaje, es decir, Machine Learning. Para ello, el curso hará uso de un sistema muy utilizado en cualquier ámbito y línea de investigación como es Weka. Weka es una plataforma de muy sencillo uso que nos permite utilizar todos los conceptos de Minería de datos sin tener que saber programar, es decir, es una plataforma específicamente desarrollara para cualquier investigador que requiera de estas técnicas pero que no tiene un base previa computacional.
Curso Virtual el curso es virtual para poder llevarlo a cabo se tiene el siguiente esquema:
Lectura del material. Los participantes debe leer y revisar los contenidos teóricos que se tienen correspondiente a cada unidad.
Visualización de Videos. Como ayuda al aprendizaje se tienen videos para cada unidad, los cuales deben ser visualizados por el alumnado.
Autoaprendizaje. Se debe resolver el material para refuerzo y aplicación de los contenidos teóricos/prácticos antes de la evaluación.
Sofware de trabajo. Se utilizará el software libre Weka Workbench.
Foro de consultas. Este espacio está destinado para que los estudiantes formulen sus preguntas con respecto a la temática desarrollada y el docente tutor será el responsable de absolver sus interrogantes.
Con esta amplia formación aprenderás el proceso completo y de forma profesional para llevar a cabos proyectos integrales. Una formación 100% practica que aumentará tu habilidades y competencias profesionales. Un curso paso a paso que te ahorra mucho tiempo y esfuerzo en tu trabajo diario.
El aprendizaje será un proceso continuo donde los estudiantes tienen la oportunidad de ir trabajando con el software de machine learning practicando lo expuesto en la parte de teoría.
La formación te permitirá convertirte en un experto en la materia, y todo ello desde una formación principalmente práctica. A través de variadas actividades y proyectos completos podrás adquirir los conocimientos suficientes para ejercer profesionalmente de forma solvente. Además conocerás en detalle mi flujo de trabajo a la hora de afrontar un proyecto profesional. Para la realización de este curso no vas a necesitar el equipo informático más potente del mercado, ya que el software empleado durante formación online se encuentra perfectamente optimizado y su uso es muy fluido en todo tipo de equipos, tanto en PC como en Mac.
Puedes elegir ver todas las lecciones de forma secuencial (lineal) y aprovecharlas al máximo la formación. Pero también puedes decidir ver este curso como una guía de referencia. Las clases están claramente organizadas en secciones lógicas y puedes decidir visualizar solo las clases que te resulten más importantes según tus necesidades formativas. A excepción de las lecciones PRO, la mayoría de las lecciones son independientes para que puedas comprender los conceptos de cada lección sin tener que ver las lecciones anteriores del curso.
Es excepcional el aumento en la demanda de profesionales en este ámbito por parte de las empresas de todo el mundo actualmente. Para desarrollar el programa formativo propuesto no ser requieren grandes conocimientos previos, ya que la formación se acomete desde un nivel de usuario 0. El curso está orientado a aquellos creativos que quieran ampliar sus skills (habilidades) y conocer múltiples trucos, consejos, recursos y recomendaciones, de la mano de los instructores Manuel Castillo y Álvaro García. Además todas las formaciones de Udemy disponen acceso automático al curso, sin limitación de tiempo, disponibilidad 24 horas al día los 7 días de la semana, sin caducidad y con garantía de devolución.
Contenidos
Unidad 1: Introducción
Conceptos básicos de machine learning.
Weka Workbench como nuestro entorno de machine learning.
Conclusiones.
Unidad 2: Minería de datos en Weka
Planeles en Weka.
Conociendo nuestros datos en los paneles de Weka.
Conclusiones.
Unidad 3: Pre-análisis y pre-tratamiento de datos
Clasificación de datos en machine learning.
Conjunto de datos para machine learning.
Pre-análisis de datos.
Conclusiones.
Unidad 4: Pre-procesamiento de datos para machine learning
Normalización y estandarización de los datos.
Transformar los datos de machine learning.
Manejar valores perdidos en los datos de machine learning.
Conclusiones.
Unidad 5: Análisis de datos en machine learning
Future Selection en machine learning.
Uso de algoritmos de machine learning.
Estimar el resultado de los algoritmos.
Estimar una línea base de los resultados.
Conclusiones.
Unidad 6: Fase de modelado en machine learning
Algoritmos de clasificación.
Algoritmos de regresión.
Algoritmos ensamblados.
Conclusiones.
Unidad 7: Fase de optimización en machine learning
Comparar el rendimiento de los algoritmos.
Optimización de los parámetros (hiperparámetros) de los algoritmos.
Guardar nuestros modelos y hacer predicciones.
Conclusiones.
Unidad 8: Proyectos en machine learning
Trabajar un proyecto de clasificación multiclase.
Trabajar un proyecto de clasificación binario.
Trabajar un proyecto de regresión.
Conclusiones
Unidad 9. Aprendizaje No Supervisado
Aprendizaje No supervisado
Algoritmos de Aprendizaje No Supervisado
Determinar el número óptimo de clústers
Proyecto de Aprendizaje No Supervisado
Modalidad
La modalidad de este curso te permite que empieces y acabes cuando tú quieras, marcando el ritmo de la clase según tu disponibilidad. Puedes volver a visualizar lo que te interese, saltar el contenido que ya domines, hacer preguntas, resolver dudas, compartir tus proyectos, etc.
Recuerda que esta formación incluye lecciones en vídeo fullHD con audio de estudio (compatible con TV, PC, Mac, tablet y smartphone), artículos didácticos, actividades, proyectos paso a paso, recursos descargables, links de interés, acceso de por vida, certificado de finalización, tutorización online, y una exclusiva comunidad de aprendizaje privada que nos ayudamos aportando nuestras experiencias en el foro de comunicación del curso.
Con esta formación disfrutarás aprendiendo desde dónde quieras, sin tener que desplazarte, sin horarios, con quién quieras, según tus necesidades y disponibilidad. Aprenderás con un instructor avalado por miles da alumnos satisfechos en todo el mundo (comentarios certificados). Conocerás las técnicas, métodos, trucos y flujos de trabajo de este sector creativo. El docente te transmitirá su sabiduría y conocimientos con pasión a la vez que las explicaciones concisas, claras, sencillas y con un enfoque profesional en cada clase. Podrás conseguir un certificado homologado personalizado y firmado por tu instructor en cada formación. De está forma podrás compartir tu título en tu portafolio, currículo, en redes sociales...
Con la alta definición de los vídeos (vídeo fullHD y audio de estudio) conseguirá no te perder detalle. Podrás ver las clases las veces que requieras para recordar y perfeccionar tus habilidades como diseñador. Tendrás la posibilidad de preguntar, pedir opinión y ayuda al instructor, además de compartir tu experiencia de aprendizaje con los demás alumnos del curso, tan apasionados como tú, repartidos por todo el mundo. Seleccionamos cuidadosamente los contenidos y producimos cada curso para garantizar una experiencia de aprendizaje online integral y de la máxima calidad.
¿A qué esperas?, este curso es ideal para ti, atrévete a convertirte en un experto. Adelante, nos vemos dentro de la formación.