Udemy

Random Forest: clasificación y regresión

Algoritmo de aprendizaje estadístico automático supervisado: Machine Learning
Free tutorial
Rating: 3.8 out of 5 (4 ratings)
87 students
1hr 11min of on-demand video
Spanish
Spanish [Auto]

Determinar la diferencia de Random Forest por clasificación y regresión
Conocer cómo RANDOM FOREST mejora a los árboles de decisión
Identificar en qué consiste el Bagging o el Bootstrap
Determinar qué refiere el termino random en Bosques aleatorios
Conocer cómo funciona el algoritmo Random Forest
Identificar cómo se construye el modelo RANDOM FOREST
Analizar qué significa OOB error y lo hiper- parámetros
Determinar como esta formada la estructura interna de los modelos
Analizar el set de datos para clasificación (Iris) y regresión (Boston)
Modelar en R a través de la librería Iris para clasificación
Modela en R a través de la librería MASS datos de Boston

Requirements

  • Voluntad de aprender
  • Conocimientos básicos de estadística: Regresión lineal simple
  • Manejo introductorio del software estadístico R

Description

La demanda que conlleva las investigaciones científicas sobre aplicar diferentes tipos de modelación estadística, misma que nos ayudan a mejorar el rendimiento de los modelos aplicados a nuestros datos. Nos vemos interesados en mejorar nuestros conocimientos respecto a programación en software de vanguardia como lo es el paquete estadístico libre R.  La herramienta Clasificación y regresión basadas en bosque entrena un modelo con unos valores conocidos proporcionados como parte de un dataset de entrenamiento. Este modelo de predicción puede utilizarse después para predecir valores desconocidos en un dataset de predicción que tenga asociadas las mismas variables explicativas. La herramienta crea modelos y genera predicciones mediante una adaptación del algoritmo de bosque aleatorio de Leo Breiman, que es un método de aprendizaje de máquina supervisado. La herramienta crea muchos árboles de decisión, denominados conjunto o bosque, que se utilizan en la predicción. Cada árbol genera su propia predicción y se utiliza como parte de un esquema de votación para hacer predicciones finales. Las predicciones finales no se basan en un solo árbol, sino en todo el bosque. El uso de un bosque completo en vez de un árbol individual le ayuda a evitar el exceso de ajuste en el modelo respecto al dataset de entrenamiento, como hace el uso de un subconjunto aleatorio de datos de entrenamiento y un subconjunto aleatorio de variables explicativas en cada árbol que compone el bosque.

Who this course is for:

  • Principiantes en manejo de R a través de las ciencias de datos
  • Estudiantes de las ciencias naturales: ambientales, forestales, biólogos, cambio climático, agrónomos, ecólogos etc
  • Médicos
  • Economistas
  • Empresarios
  • Ciencias sociales

Instructor

MSc | Ecuadendrotropical
Kelly Yohanna Peña Moreno
  • 4.0 Instructor Rating
  • 12 Reviews
  • 104 Students
  • 3 Courses

Ingeniera Forestal, Licenciada en el idioma Inglés con estudios de Maestría en Gestión Ambiental y Estadística Aplicada. Soy creadora de Ecuadendro Tropical. He trabajado en el campo de la dendrocronología y su relación con los factores ambientales en proyectos con la Universidad de Arizona, la Universidad de Erlangen-Alemania. Actualmente soy tesista de doctorado de la Universidad de Erlangen-Alemania. Sé, que en la actualidad el campo profesional es muy competitivo por esa razón deseo compartir estos conocimientos para que puedas tener una perspectiva mas amplia al momento de querer modelar estadísticamente en el campo investigativo o empresarial.

Top companies trust Udemy

Get your team access to Udemy's top 19,000+ courses