Udemy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
Development
Web Development Data Science Mobile Development Programming Languages Game Development Database Design & Development Software Testing Software Engineering Development Tools No-Code Development
Business
Entrepreneurship Communications Management Sales Business Strategy Operations Project Management Business Law Business Analytics & Intelligence Human Resources Industry E-Commerce Media Real Estate Other Business
Finance & Accounting
Accounting & Bookkeeping Compliance Cryptocurrency & Blockchain Economics Finance Finance Cert & Exam Prep Financial Modeling & Analysis Investing & Trading Money Management Tools Taxes Other Finance & Accounting
IT & Software
IT Certification Network & Security Hardware Operating Systems Other IT & Software
Office Productivity
Microsoft Apple Google SAP Oracle Other Office Productivity
Personal Development
Personal Transformation Personal Productivity Leadership Career Development Parenting & Relationships Happiness Esoteric Practices Religion & Spirituality Personal Brand Building Creativity Influence Self Esteem & Confidence Stress Management Memory & Study Skills Motivation Other Personal Development
Design
Web Design Graphic Design & Illustration Design Tools User Experience Design Game Design Design Thinking 3D & Animation Fashion Design Architectural Design Interior Design Other Design
Marketing
Digital Marketing Search Engine Optimization Social Media Marketing Branding Marketing Fundamentals Marketing Analytics & Automation Public Relations Advertising Video & Mobile Marketing Content Marketing Growth Hacking Affiliate Marketing Product Marketing Other Marketing
Lifestyle
Arts & Crafts Beauty & Makeup Esoteric Practices Food & Beverage Gaming Home Improvement Pet Care & Training Travel Other Lifestyle
Photography & Video
Digital Photography Photography Portrait Photography Photography Tools Commercial Photography Video Design Other Photography & Video
Health & Fitness
Fitness General Health Sports Nutrition Yoga Mental Health Dieting Self Defense Safety & First Aid Dance Meditation Other Health & Fitness
Music
Instruments Music Production Music Fundamentals Vocal Music Techniques Music Software Other Music
Teaching & Academics
Engineering Humanities Math Science Online Education Social Science Language Teacher Training Test Prep Other Teaching & Academics
AWS Certification Microsoft Certification AWS Certified Solutions Architect - Associate AWS Certified Cloud Practitioner CompTIA A+ Cisco CCNA Amazon AWS CompTIA Security+ AWS Certified Developer - Associate
Graphic Design Photoshop Adobe Illustrator Drawing Digital Painting InDesign Character Design Canva Figure Drawing
Life Coach Training Neuro-Linguistic Programming Mindfulness Personal Development Meditation Personal Transformation Life Purpose Emotional Intelligence Neuroscience
Web Development JavaScript React CSS Angular PHP Node.Js WordPress Python
Google Flutter Android Development iOS Development Swift React Native Dart Programming Language Mobile Development Kotlin SwiftUI
Digital Marketing Google Ads (Adwords) Social Media Marketing Google Ads (AdWords) Certification Marketing Strategy Internet Marketing YouTube Marketing Email Marketing Retargeting
SQL Microsoft Power BI Tableau Business Analysis Business Intelligence MySQL Data Modeling Data Analysis Big Data
Business Fundamentals Entrepreneurship Fundamentals Business Strategy Online Business Business Plan Startup Freelancing Blogging Home Business
Unity Game Development Fundamentals Unreal Engine C# 3D Game Development C++ 2D Game Development Unreal Engine Blueprints Blender
30-Day Money-Back Guarantee
IT & Software IT Certification Python

Curso maestro de Web Scraping: Extracción de Datos de la Web

Web Scraping en Python | Extracción de 16 sitios web | 5 librerías | Programación desde CERO | ¡TODO EN UN SOLO CURSO!
Rating: 4.6 out of 54.6 (519 ratings)
2,011 students
Created by Leonardo Kuffo
Last updated 12/2020
Spanish
Spanish [Auto]
30-Day Money-Back Guarantee

What you'll learn

  • Aprenderás a extraer datos de la web utilizando Python.
  • Te enseñaré desde los fundamentos del Web Scraping hasta la limpieza, almacenamiento (MongoDB) y actualización de los datos que extraigamos.
  • Practicaremos extrayendo datos de 16 páginas web reales (MERCADO LIBRE, OLX, GOOGLE PLACES, TRIP ADVISOR, IGN, entre otros)
  • Extraerás datos de páginas webs que cargan dinámicamente, webs con paginación, webs con captchas y webs con autenticación.
  • Aprenderás a automatizar tus extracciones para que se ejecuten de manera periódica y realicen actualizaciones incrementales de los datos descargados.
  • Si no sabes programar, ¡Te enseñare a programar desde CERO para que no tengas problemas en el curso!
  • Aprenderás a extraer y procesar datos de la Web utilizando 5 librerías diferentes (Requests, lxml-html, Scrapy, BeautifulSoup y Selenium). Analizando los PROS y los CONS de cada una.
  • Entenderás cómo funcionan las estructuras y protocolos de las páginas webs y los formatos de transmisión de información (XML y JSON).
  • Aprenderás a sobrepasar la barrera de los molestos CAPTCHAs al hacer extracción de datos.
  • Aprenderás a hacer web scraping de manera ética y segura. Protegiendo tus IPs y evitando los baneos.
  • Aprenderás a realizar Web Scraping en la nube.
  • Aprenderás a realizar extracción de imágenes y archivos
Curated for the Udemy for Business collection

Requirements

  • ¡No existe ningún requisito! Si no sabes programar, te enseñaré lo necesario desde CERO.

Description

Si buscabas convertirte en un experto en la extracción de datos de la web estás en el curso correcto. Estás viendo el curso más completo sobre Web Scraping de toda la Internet.

Te enseñaré desde CERO los fundamentos del Web Scraping de una manera muy sencilla de entender. ¡VOY DIRECTO AL GRANO! Realizaremos extracción de datos de 16 páginas web (OLX, MERCADO LIBRE, TWITTER, ACCUWEATHER, TRIP ADVISOR, entre otras), sin detenernos en explicaciones complejas que no te servirán de mucho. En muy poco tiempo vas a aprender Web Scraping y te vas a enamorar del mundo de la extracción de datos!   


En este curso utilizaremos Python. El mejor lenguaje de programación para principiantes y uno de los favoritos a la hora de hacer Web Scraping.   

  • Si no sabes programar, te explicaré los fundamentos de la programación de una manera rápida y muy sencilla en la primera sección del curso.

  • Aprenderemos a hacer Web Scraping de una página (NIVEL 1), de varias páginas al mismo tiempo (NIVEL 2), de páginas con carga dinámica (NIVEL 3), de APIs y iframes (NIVEL 4) y de páginas con CAPTCHAs y autenticación (NIVEL 5). Finalmente existe un NIVEL EXTRA que contiene lo siguiente: Extracción de imágenes, extracción de archivos, automatización de extracciones, almacenamiento de datos en base de datos (MongoDB) y actualizaciones periódicas de los datos almacenados.

  • Practicaremos extrayendo datos de 13 sitios web: OLX, MERCADO LIBRE, DIARIO EL UNIVERSO, WIKIPEDIA, STACKOVERFLOW, W3SCHOOLS, TRIPADVISOR, TWITTER, GOOGLE PLACES, GITHUB, ACCUWEATHER, CRUZ VERDE, URBANIA, FILE-EXAMPLES e IGN.

  • Vamos a aprender a utilizar 5 librerías modernas para hacer Web Scraping: LXML, Requests, Scrapy, Selenium y Beautiful Soup. Cada una con sus PROS y sus CONS. De tal forma que tengas un arsenal de herramientas para elegir al momento de hacer tu siguiente extracción de datos. Además veremos otras librerías tales como: Pillow, schedule, Twisted, time, json y pymongo.

  • No nos detendremos en detalles complejos ni en teorías avanzadas. ¡Solamente veremos lo realmente necesario para que te conviertas en un maestro del Web Scraping!

  • Este curso utiliza la PRÁCTICA como herramienta principal para aprender. Es por esto que extraemos datos de 13 sitios web que suman un total de casi 10 horas de pura práctica extrayendo datos.


Este curso es tu mejor opción si:

  • Quieres convertirte en un maestro del Web Scraping de la forma más sencilla posible.

  • Quieres aprender Web Scraping practicando con muchos ejemplos de páginas reales.

  • Has tenido dificultades con otros cursos, y has llegado a pensar que la programación no es lo tuyo.

  • Eres un profesional en otra área diferente a la informática (estadística, matemática, biologia, ingenierías, etc) que necesita aprender a extraer datos de la web ¡YA!

  • Quieres aprender Web Scraping sin detenerte en explicaciones largas y complejas.

  • Quieres aprender desde los fundamentos hasta la limpieza, almacenamiento y actualización de los datos que extraigas.

Who this course is for:

  • Personas que quieran convertirse en maestros del Web Scraping con un solo curso.
  • Cualquier persona que quiera aprender Web Scraping de una manera sencilla.
  • Personas que quieren aprender a extraer datos de la web pero NO saben programar.
  • Personas que necesitan extraer datos de la web para un proyecto, investigación o tesis.
  • Investigadores o científicos de datos que necesitan extraer datos de la web para ser analizados.
  • Personas que les gusta aprender a través de la práctica.

Course content

10 sections • 81 lectures • 14h 58m total length

  • Preview01:54
  • Repositorio de GITHUB y Recomendaciones
    01:18

  • Preview05:03
  • Preview11:25
  • Variables
    02:32
  • Tipos de Datos
    04:52
  • Operaciones entre Variables
    03:53
  • Salidas por Pantalla
    01:22
  • Librerías
    02:50
  • Pedirle datos al Usuario
    01:32
  • Prueba de Python #1
    6 questions
  • Operadores Lógicos y Condicionales
    08:34
  • Lazos
    08:41
  • Colecciones PT 1 (Listas, Cadenas, Tuplas)
    21:37
  • Prueba de Python #2
    7 questions
  • Colecciones PT 2 (Conjuntos, Diccionarios)
    13:28
  • Funciones
    09:54
  • Manejo de Archivos
    10:45
  • Manejo de Errores
    03:48
  • Prueba de Python #3
    7 questions
  • Clases y Objetos (POO)
    22:20

  • Preview02:54
  • Páginas Web: HTML
    08:53
  • Prueba #1
    3 questions
  • Arquitectura Cliente-Servidor
    02:50
  • URLs
    03:38
  • Tipos de Web Scraping
    04:06
  • Pasos del Web Scraping
    01:52
  • Prueba #2
    3 questions
  • Tu espada: Tutorial de XPATH | PT. 1
    08:24
  • Tu espada: Tutorial de XPATH | PT. 2
    07:46
  • Tu escudo: ÉTICA
    01:51
  • Prueba #3
    4 questions

  • Introducción
    02:11
  • BONUS: INSTALACIÓN DE LIBRERÍAS EN DETALLE (Windows, MAC y Linux)
    06:06
  • Requests y lxml (Extracción de WIKIPEDIA)
    21:08
  • Requests y Beautiful Soup (Extracción de STACKOVERFLOW)
    19:26
  • Scrapy: Introducción
    04:02
  • Scrapy: Soporte para Instalación
    03:06
  • Preview24:02
  • Scrapy (Extracción de DIARIO EL UNIVERSO)
    25:33
  • Ejecutar Scrapy sin la Terminal (+ Jupyter Notebook, Google Colab o Similares)
    06:48

  • Introducción: Scraping Vertical y Horizontal
    03:22
  • Web Scraping Vertical (Extracción de TRIPADVISOR con Scrapy PT. 1)
    25:10
  • Scrapy Map Compose (Extracción de TRIPADVISOR con Scrapy PT.2)
    05:25
  • Web Scraping Horizontal y Vertical (Extracción de MERCADO LIBRE con Scrapy)
    25:55
  • ATENCIÓN: Scrapy no funciona con todas las páginas webs
    00:37
  • Varios tipos de Items y 2 dimensiones horizontales (Extracción de IGN)
    30:37
  • 2 niveles de profundidad (Extracción de TRIP ADVISOR con Scrapy PT.3)
    31:34
  • Scrapy Link Extractor (Extracción de FARMACIA CRUZ VERDE)
    17:41
  • Múltiples URLs Semilla (Extracción de URBANIA PT. 1)
    16:40
  • Web Scraping en la Nube con CRAWLERA (Extracción de URBANIA PT. 2)
    14:10
  • Scrapy bajo el Microscopio (Primer Requerimiento, Delay, CSVs y Concurrencia)
    17:42

  • Introducción: SELENIUM
    05:24
  • Preview23:07
  • Esperando eventos (Extracción de OLX)
    15:00
  • Web Scraping Dinámico Horizontal y Vertical (Extracción de MERCADO LIBRE)
    26:33
  • Scrolling y Manejo de Tabs (Extracción de GOOGLE PLACES)
    34:36
  • Formularios y Login (Extracción de TWITTER)
    19:20
  • Detectando carga dinámica (¿Cuándo utilizar Selenium?)
    13:08
  • Prueba: NIVEL 1, 2 y 3
    3 questions

  • Introducción
    02:45
  • Preview02:59
  • Preview02:31
  • ¿Qué es una RESTful API?
    04:58
  • Extracción de datos de APIs
    23:48
  • Web Scraping y Pandas
    08:09
  • Extracción de datos de iframes (W3SCHOOLS)
    16:35
  • Extracción de Datos de Tag Script (EJEMPLO 1 - GOB.PE)
    19:15
  • Extracción de Datos de Tag Script (EJEMPLO 2 - FootDistrict)
    12:10

  • Introducción a la Autenticación Online
    04:39
  • Autenticación por Form Data de Login (Extracción de GITHUB)
    28:09
  • Autenticación exclusivamente por API (Extracción de GITHUB)
    09:10
  • Autenticación con Scrapy Spider (Extracción de GITHUB)
    15:08
  • ¿Qué son los captchas?
    03:42
  • Resolviendo captchas manualmente
    11:16
  • Resolviendo captchas de manera automática
    16:28

  • Web Scraping responsable
    03:13
  • ¿Cómo evitar que me baneen?
    03:19
  • User Agents y VPNs
    03:15
  • Rotación de User Agents con Scrapy
    04:53

  • Web Scraping de Imágenes (Extracción de OLX)
    16:58
  • Web Scraping de Archivos (Extracción de FILES EXAMPLE)
    13:59
  • Automatización de Extracción en Scrapy (Extracción de ACCUWEATHER)
    19:32
  • Automatización de Extracción en Selenium (Extracción de ACCUWEATHER)
    12:54
  • Almacenamiento de datos en MongoDB (Extracción de OLX)
    08:04
  • Actualización periódica de datos con Selenium, Scrapy y Mongo (ACCUWEATHER)
    13:51
  • Mis redes sociales + contenido gratuito
    00:19

Instructor

Leonardo Kuffo
Profesor, Músico e Ingeniero en Ciencias Computacionales
Leonardo Kuffo
  • 4.6 Instructor Rating
  • 519 Reviews
  • 2,011 Students
  • 1 Course

Profesor e Ingeniero en Computación. Mi pasión es enseñar. Lo he hecho durante más de 5 años. Y al mismo tiempo trabajo ejerciendo la profesión en un startup de Latinoamérica llamado Shippify.

He impartido clases presenciales de fundamentos de la programación, análisis exploratorio de datos, análisis de grandes cantidades de datos y extracción de datos de la Web a más de 1000 personas entre estudiantes universitarios, estudiantes de maestría, estudiantes doctorales y profesionales. Además, he podido impartir mis conocimientos en Youtube a mas de 250 mil personas.

No me canso de enseñar ni de aprender.

  • Udemy for Business
  • Teach on Udemy
  • Get the app
  • About us
  • Contact us
  • Careers
  • Blog
  • Help and Support
  • Affiliate
  • Terms
  • Privacy policy
  • Cookie settings
  • Sitemap
  • Featured courses
Udemy
© 2021 Udemy, Inc.