Udemy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
Development
Web Development Data Science Mobile Development Programming Languages Game Development Database Design & Development Software Testing Software Engineering Development Tools No-Code Development
Business
Entrepreneurship Communications Management Sales Business Strategy Operations Project Management Business Law Business Analytics & Intelligence Human Resources Industry E-Commerce Media Real Estate Other Business
Finance & Accounting
Accounting & Bookkeeping Compliance Cryptocurrency & Blockchain Economics Finance Finance Cert & Exam Prep Financial Modeling & Analysis Investing & Trading Money Management Tools Taxes Other Finance & Accounting
IT & Software
IT Certification Network & Security Hardware Operating Systems Other IT & Software
Office Productivity
Microsoft Apple Google SAP Oracle Other Office Productivity
Personal Development
Personal Transformation Personal Productivity Leadership Career Development Parenting & Relationships Happiness Esoteric Practices Religion & Spirituality Personal Brand Building Creativity Influence Self Esteem & Confidence Stress Management Memory & Study Skills Motivation Other Personal Development
Design
Web Design Graphic Design & Illustration Design Tools User Experience Design Game Design Design Thinking 3D & Animation Fashion Design Architectural Design Interior Design Other Design
Marketing
Digital Marketing Search Engine Optimization Social Media Marketing Branding Marketing Fundamentals Marketing Analytics & Automation Public Relations Advertising Video & Mobile Marketing Content Marketing Growth Hacking Affiliate Marketing Product Marketing Other Marketing
Lifestyle
Arts & Crafts Beauty & Makeup Esoteric Practices Food & Beverage Gaming Home Improvement Pet Care & Training Travel Other Lifestyle
Photography & Video
Digital Photography Photography Portrait Photography Photography Tools Commercial Photography Video Design Other Photography & Video
Health & Fitness
Fitness General Health Sports Nutrition Yoga Mental Health Dieting Self Defense Safety & First Aid Dance Meditation Other Health & Fitness
Music
Instruments Music Production Music Fundamentals Vocal Music Techniques Music Software Other Music
Teaching & Academics
Engineering Humanities Math Science Online Education Social Science Language Teacher Training Test Prep Other Teaching & Academics
AWS Certification Microsoft Certification AWS Certified Solutions Architect - Associate AWS Certified Cloud Practitioner CompTIA A+ Cisco CCNA Amazon AWS CompTIA Security+ AWS Certified Developer - Associate
Graphic Design Photoshop Adobe Illustrator Drawing Digital Painting InDesign Character Design Canva Figure Drawing
Life Coach Training Neuro-Linguistic Programming Personal Development Mindfulness Personal Transformation Meditation Life Purpose Coaching Neuroscience
Web Development JavaScript React CSS Angular PHP WordPress Node.Js Python
Google Flutter Android Development iOS Development Swift React Native Dart Programming Language Mobile Development Kotlin SwiftUI
Digital Marketing Google Ads (Adwords) Social Media Marketing Google Ads (AdWords) Certification Marketing Strategy Internet Marketing YouTube Marketing Email Marketing Retargeting
SQL Microsoft Power BI Tableau Business Analysis Business Intelligence MySQL Data Analysis Data Modeling Data Science
Business Fundamentals Entrepreneurship Fundamentals Business Strategy Online Business Business Plan Startup Freelancing Blogging Home Business
Unity Game Development Fundamentals Unreal Engine C# 3D Game Development C++ 2D Game Development Unreal Engine Blueprints Blender
30-Day Money-Back Guarantee

This course includes:

  • 10.5 hours on-demand video
  • 17 articles
  • 5 downloadable resources
  • Full lifetime access
  • Access on mobile and TV
  • Assignments
IT & Software Other IT & Software Machine Learning

Ingeniería de variables para machine learning

Aprende a modificar tus variables y construye mejores modelos de predicción
Rating: 4.6 out of 54.6 (26 ratings)
245 students
Created by Soledad Galli, Natalia C Angarita, Juan Gabriel Gomila Salas
Last updated 11/2020
Spanish
Spanish [Auto]
30-Day Money-Back Guarantee

What you'll learn

  • Aprende a imputar variables con datos faltantes mientras capturas información de tus datos
  • Convierte variables categóricas en numéricas mientras capturas información de tus datos
  • Transforma la distribución de tus variables numéricas
  • Convierte tus variables numéricas en intervalos discretos
  • Extrae información de variables de fechas y tiempo
  • Prepara los pasos de procesamiento de datos en una pipeline de predicción
  • Aprende a implementar ingenieria de variables en Scikit-learn
  • Implementa ingenieria de variables en el nuevo paquete Feature-engine
  • Haz tus pipelines de ingenieria mucho mas simples
  • Limpia y prepara tus set de datos para algoritmos de predicción

Requirements

  • Una instalación de Python
  • Jupyter notebooks
  • Familiaridad con programación en Python
  • Alguna experiencia con NumPy y pandas
  • Conocimiento de algoritmos de predicción

Description

Aprende a modificar las variables en tus datos y construye mejores modelos de predicción.

Ya diste tus primeros pasos en ciencia de datos, ya conoces los modelos de predicción más usados, ya construiste alguna regresión lineal o algún árbol de predicción. Pero ahora, la vida real toca a tus puertas, y te das cuenta que los datos están sucios, les faltan valores, algunas variables tienen etiquetas en vez de números, no cumplen los supuestos de los modelos, un desastre! Y para peores, no encuentras muchas fuentes de conocimiento consolidadas al respecto. Solo blogs?

Este curso te va a ayudar! Este es el curso online más extenso y comprensivo en ingeniería de variables. Vas a aprender una enorme variedad de técnicas de ingeniaría usadas mundialmente en diferentes organizaciones, o en competiciones de ciencias de datos, para limpiar y transformar tus datos y variables.

Hemos juntado una recopilación de técnicas fantástica, luego de buscar, investigar e implementar métodos publicados en varias páginas online, artículos de publicación científica, artículos por organizaciones, y por supuesto, utilizando también nuestra experiencia como científicas de datos.

Específicamente, que vas a aprender?

  • Como imputar tus datos faltantes

  • Como codificar tus variables categóricas

  • Como transformar tus variables numéricas

  • Como convertir tus variables numéricas en intervalos discretos

  • Como remover datos atípicos

  • Qué hacer con variables de fechas y horarios

  • Como trabajar con diferentes zonas horarias

  • Qué hacer con variables mixtas

Vas a prender no una, sino múltiples técnicas que se pueden aplicar para cada uno de esos puntos. Y como si esto fuera poco, vas a aprender a implementar estas técnicas de manera elegante, eficiente, y profesional, utilizando Python, NumPy, pandas Scikit-learn y un paquete open-source especial que diseñamos especialmente para este curso: Feature-engine.

Al finalizar el curso, vas a poder ordenar todos tus pasos de ingeniería de variables en una pipeline simple y elegante, que te va a permitir poner tus modelos predictivos en producción de manera mucho más sencilla.

Necesitas saber más? Te contamos…

En el curso, vas a encontrar primero, las técnicas más utilizadas para ingeniería de variables, seguidas por técnicas más avanzadas y exclusivas, que capturan información, a la vez que codifican o transforman tus variables. Vas a encontrar también una explicación detallada de la técnica, que es lo que asume, cuales son las ventajas de su uso, así como también sus limitaciones, y luego, mejores prácticas de programación para implementarla en Python.

Este curso es apropiado para principiantes, pero también para estudiantes y practicantes intermedios y avanzados. Con seguridad, vas a encontrar alguna técnica dentro de nuestra colección, que te va a ser nueva y útil.

Con más de 100 lecciones individuales y 10 hs. de videos, este curso cubre casi todos los aspectos de ingeniería de variables, incluyendo técnicas de imputación de datos faltantes, técnicas de codificación de variables categóricas, transformación de variables numéricas, discretización, y trabajo con variables de fechas y tiempo.

En este curso, Python es el lenguaje que elegimos, por su simpleza y la cantidad de paquetes open-source que soportan la ingeniería de variables. Además creamos un paquete especial, Feature-engine, para que puedas aplicar todas estas técnicas en un puñado de líneas de código.

Entonces, que estás esperando? Súmate al curso, descubre el poder de una sólida ingeniería de variables, y construye mejores modelos de predicción.

Who this course is for:

  • Científicos de datos que recién empiezan sus carreras
  • Científicos de datos de datos quienes quieran aprender mas técnicas de ingeniería
  • Ingenieros de software quienes quieran transicionar a ciencia de datos
  • Estudiantes de universidad quienes quieran aprender más de ciencia de datos
  • Científicos de datos quienes quieran mejorar su habilidad en programación

Course content

14 sections • 122 lectures • 10h 27m total length

  • Preview05:12
  • Preview06:35
  • Preview03:49
  • Preview00:17
  • Como abordar este curso
    01:12
  • Preparando tu ordenador
    01:31
  • El código para el curso | Jupyter notebooks
    01:07
  • Sets de datos para el curso | Como bajarlos
    01:20
  • Presentaciones para el curso
    00:22
  • Preguntas frecuentes
    00:41

  • Variables, qué son?
    03:01
  • Variables numéricas
    06:20
  • Variables categóricas
    04:17
  • Variables de tiempo y fechas
    02:37
  • Variables mixtas
    03:18
  • Material Complementario
    00:09

  • Características de las variables
    02:42
  • Datos faltantes
    08:05
  • Cardinalidad
    05:58
  • Categorías poco comunes
    06:05
  • Modelos lineales, qué asumen?
    11:46
  • Distribuciones
    05:28
  • Valores extremos
    10:34
  • Magnitud de la variable
    03:32
  • Características de variables y algoritmos de machine learning
    00:11
  • Material Adicional de Lectura
    00:41

  • Introducción a técnicas de imputación
    04:11
  • Analisis de casos completos
    04:04
  • Imputación por la media o mediana
    08:29
  • Imputación con valor arbitrario
    07:24
  • Imputación al borde de la distribución
    04:46
  • Imputación con categoría frecuente
    03:25
  • Imputación con categoría dedicada
    03:03
  • Imputación por extracción aleatoria
    05:58
  • Agregar un indicador de datos faltantes
    06:03
  • Intro to SimpleImputer from Sklearn
    03:15
  • Imputación con media y mediana | Sklearn
    12:42
  • Imputación con valor arbitrario | Sklearn
    07:08
  • Imputación con categoría frecuente | Sklearn
    04:05
  • Imputación con categoría dedicada | Sklearn
    03:32
  • Agregar un indicador de datos faltantes | Sklearn
    03:41
  • Determinación automática de la mejor imputación | Sklearn
    07:52
  • Introducción a Feature-engine
    04:28
  • Imputación con media y mediana | Feature-engine
    06:55
  • Imputación con valor arbitrario | Feature-engine
    05:24
  • Imputación al borde de la distribución | Feature-engine
    07:17
  • Imputación con categoría frecuente | Feature-engine
    03:40
  • Imputación con categoría dedicada | Feature-engine
    04:11
  • Imputación aleatoria con Feature-engine
    02:49
  • Agregar un indicador de datos faltantes | Feature-engine
    06:45
  • Resumen de métodos de imputación
    00:07
  • Conclusión: cuándo usar qué método?
    01:37

  • Imputación multivariada - MUY PRONTO
    00:00

  • Codificación de variables categóricas
    05:56
  • Codificación One Hot
    05:48
  • Codificación One Hot | Práctico
    13:33
  • Codificación One Hot de categorías frecuentes
    02:54
  • Codificación One Hot de categorías frecuentes| Práctico
    08:19
  • Codificación Ordinal
    02:03
  • Codificación Ordinal | Práctico
    09:05
  • Codificación por frecuencia y porcentajes
    02:52
  • Codificación por frecuencia y porcentajes | Práctico
    04:18
  • Codificación ordinal informada por el target
    03:01
  • Codificación ordinal informada por el target | Práctico
    10:16
  • Codificación con la media del target
    02:54
  • Codificación con la media del target | Práctico
    06:51
  • Codificación con proporción de probabilidades | Práctico
    08:38
  • Peso de la evidencia
    05:40
  • Peso de la evidencia | Práctico
    12:54
  • Comparación de técnicas de codificación
    12:55
  • Codificación de categorías raras
    06:51
  • Codificación de categorías raras | Práctico
    15:37
  • Codificación binaria y hashing de variables
    08:28
  • Material adicional de lectura
    00:27

  • Transformación de variables
    04:37
  • Transformación de variables | Numpy y pandas
    07:22
  • Transformación de variables | Sklearn
    08:28
  • Transformación de variables | Feature-engine
    05:12

  • Discretización de variables
    02:49
  • Discretización en intervalos de igual tamaño
    04:01
  • Discretización en intervalos de igual tamaño | Práctico
    12:11
  • Discretización en intervalos de igual frecuencia
    04:04
  • Discretización en intervalos de igual frecuencia | Práctico
    07:57
  • Discretización con clustering de K-medias
    04:02
  • Discretización con clustering de K-medias | Práctico
    03:21
  • Discretización mas codificación de variables
    03:10
  • Discretización mas codificación de variables | Práctico
    06:29
  • Discretización con árboles de decisión
    06:22
  • Discretización con árboles de decisión | Práctico
    12:20
  • Discretización con árboles de decisión | Feature-engine
    04:46
  • Discretización en intervalos arbitrarios
    04:18
  • BONUS: quiero aprender más
    00:01
  • BONUS: enlaces correspondientes al video anterior
    00:09

  • Ingeniería de outliers
    07:29
  • Recorte de valores atípicos
    07:36
  • Censura de valores atípicos con RIQ
    06:09
  • Censura de valores atípicos con media y devio estandar
    03:52
  • Censura de valores atípicos con quantiles
    03:30
  • Censura arbitraria de valores atípicos
    04:05
  • BONUS: quiero aprender más
    00:09

  • Poniendo las variables en la misma escala
    04:17
  • Estandarización
    05:31
  • Estandarización | Práctico
    06:04
  • Normalización con la media
    04:06
  • Normalización con la media | Práctico
    06:23
  • Re-escalando al valor mínimo y máximo
    03:20
  • Re-escalando al valor mínimo y máximo | Práctico
    03:29
  • Re-escalando al máximo
    02:29
  • Re-escalando al máximo | Práctico
    04:15
  • Normalización con la media y los quantiles
    02:35
  • Normalización con la media y los quantiles | Práctico
    02:05
  • Normalizando con la norma del vector
    06:38
  • Normalizando con la norma del vector |Práctico
    07:02
  • BONUS: quiero aprender más
    00:12

Instructors

Soledad Galli
Lead Data Scientist
Soledad Galli
  • 4.6 Instructor Rating
  • 5,535 Reviews
  • 24,053 Students
  • 6 Courses

Soledad Galli is a lead data scientist and founder of Train in Data. She has experience in finance and insurance, received a Data Science Leaders Award in 2018 and was selected “LinkedIn’s voice” in data science and analytics in 2019. Sole is passionate about sharing knowledge and helping others succeed in data science.

As a data scientist in Finance and Insurance companies, Sole researched, developed and put in production machine learning models to assess Credit Risk, Insurance Claims and to prevent Fraud, leading in the adoption of machine learning in the organizations.

Sole is passionate about empowering people to step into and excel in data science. She mentors data scientists, writes articles online, speaks at data science meetings, and teaches online courses on machine learning.

Sole has recently created Train In Data, with the mission to facilitate and empower people and organizations worldwide to step into and excel in data science and analytics.

Sole has an MSc in Biology, a PhD in Biochemistry and 8+ years of experience as a research scientist in well-known institutions like University College London and the Max Planck Institute. She has scientific publications in various fields such as Cancer Research and Neuroscience, and her research was covered by the media on multiple occasions.

Soledad has 4+ years of experience as an instructor in Biochemistry at the University of Buenos Aires, taught seminars and tutorials at University College London, and mentored MSc and PhD students at Universities.

Feel free to contact her on LinkedIn.


========================


Soledad Galli es científica de datos y fundadora de Train in Data. Tiene experiencia en finanzas y seguros, recibió el premio Data Science Leaders Award en 2018 y fue seleccionada como "la voz de LinkedIn" en ciencia y análisis de datos en 2019. A Soledad le apasiona compartir conocimientos y ayudar a otros a tener éxito en la ciencia de datos.


Como científica de datos en compañías de finanzas y seguros, Sole desarrolló y puso en producción modelos de aprendizaje automático para evaluar el riesgo crediticio, automatizar reclamos de seguros y para prevenir el fraude, facilitando la adopción del aprendizaje de máquina en estas organizaciones.


A Sole le apasiona ayudar a que las personas aprendan y se destaquen en ciencia de datos, es por eso habla regularmente en reuniones de ciencia de datos, escribe varios artículos disponibles en la web y crea cursos sobre aprendizaje de máquina.


Sole ha creado recientemente Train In Data, con la misión de ayudar a las personas y organizaciones de todo el mundo a que aprendan y se destaquen en la ciencia y análisis de datos.


Sole tiene una maestría en biología, un doctorado en bioquímica y más de 8 años de experiencia como investigadora científica en instituciones prestigiosas como University College London y el Instituto Max Planck. Tiene publicaciones científicas en diversos campos, como la investigación contra el Cáncer y la Neurociencia, y sus resultados fueron cubiertos por los medios en múltiples ocasiones.


Soledad tiene más de 4 años de experiencia como instructora de bioquímica en la Universidad de Buenos Aires, dio seminarios y tutoriales en University College London, en Londres, y fue mentora de estudiantes de maestría y doctorado en diferentes universidades.


No dudes en contactarla en LinkedIn.

Natalia C Angarita
Lead Data Scientist
Natalia C Angarita
  • 4.6 Instructor Rating
  • 26 Reviews
  • 245 Students
  • 1 Course

Natalia Angarita es una científica de datos con más de 10 años de experiencia en el Reino Unido en sectores público, académico y privado cubriendo múltiples industrias como financiera, retail, viajes, gobierno, operaciones, salud, bio-medicina, entre otras. Ganadora del premio Ambition and Achievement Award, del Instituto de Ingeniería & Tecnología del Reino Unido.


Cómo científica de datos, Natalia ha desarrollado y puesto modelos de aprendizaje automático en producción para evaluar niveles de riesgo y optimizar el procesamiento de aplicaciones, para la predicción de deserción de clientes de banca empresarial, entre otros. Adicionalmente, ha trabajado en la segmentación de clientes en sector retail y viajes, identificando tendencias emergentes de compra y la evolución de preferencias de los clientes.

A Natalia le apasiona la enseñanza y contribuye en diversas comunidades en temas de tecnología y ciencia de datos. Natalia ha dado clases en maestrías de ciencia de datos, participado en reuniones y conferencias sobre el desarrollo y aplicación de algoritmos para diferentes áreas y escrito artículos disponibles en la web.

Natalia tiene una maestría en el procesamiento de señales e imágenes y un doctorado en el desarrollo de algoritmos para aplicaciones de metrología óptica. Adicionalmente, Natalia tiene más de 6 años de experiencia como investigadora científica en áreas de bio-medicina en la Universidad de Southampton y la Universidad de Warwick, UK. También es la autora de publicaciones en revistas indexadas de alto impacto incluyendo Nature Scientific Reports y conferencias internacionales, con artículos altamente citados.


No dudes en contactarla en LinkedIn.


Juan Gabriel Gomila Salas
CEO de Frogames, Matemático, Data Scientist & Game Designer
Juan Gabriel Gomila Salas
  • 4.6 Instructor Rating
  • 41,457 Reviews
  • 288,615 Students
  • 92 Courses

Soy licenciado en matemáticas, especializado en el análisis de datos para empresas de videojuegos con R y Python, en Game Design para videojuegos de social casino, en el desarrollo de aplicaciones móviles para iOS y para Android y desarrollador de videojuegos utilizando los motores Unreal Engine y Unity tanto para PC como para móvil desde el año 2011.

Me encanta programar, crear apps y videojuegos que la gente utilice y sobretodo enseñar tanto en el mundo online, como en la Universidad presenciamente.

Aquí en Udemy, llevo como profesor online desde verano de 2015 he lanzado ya más de 90 cursos online con más de 250.000 estudiantes en más de 160 países de todo el mundo que han aprendido en castellano  temáticas de desarrollo tan diversas como el mundo de las apps para iOS en Objective-C, Swift y SpriteKit,  en Android con Java, desarrollo de videojuegos con Unity y Unreal Engine cubriendo desde lo más básico hasta aspectos avanzados para crear juegos profesionales o incluso análisis de datos masivos, big data, machine learning y data science con R, Tidyverse y Python. 

Soy también Instructor Certificado de Unity (UCI), lo cual me permite viajar por todo el mundo asesorando y dando formación en desarrollo de videojuegos para empresas de CAD, o estudios de renombre como por ejemplo Team 17 (Worms, The Escapists), Genera Games (Disney's Frozen, Star Wars) o Ubisoft (Assassin's Creed, CSI Hidden Crimes)

Además, los propios estudiantes online de varias partes del mundo me han contactado para ir a dar conferencias y compartir mis experiencias en lugares tan bonitos como Colombia, Dinamarca, USA, México, Suecia, Holanda, Londres o Bolivia entre otros. Si no conoces aún ninguno de los cursos que imparto aquí en Udemy, tómate un tiempo para visitar los diversos cursos gratuitos que tengo publicados aquí mismo.

  • Udemy for Business
  • Teach on Udemy
  • Get the app
  • About us
  • Contact us
  • Careers
  • Blog
  • Help and Support
  • Affiliate
  • Terms
  • Privacy policy
  • Cookie settings
  • Sitemap
  • Featured courses
Udemy
© 2021 Udemy, Inc.