Mô tả

Si buscabas convertirte en un experto en la extracción de datos de la web estás en el curso correcto. Estás viendo el curso más completo sobre Web Scraping de toda la Internet.

Te enseñaré desde CERO los fundamentos del Web Scraping de una manera muy sencilla de entender. ¡VOY DIRECTO AL GRANO! Realizaremos extracción de datos de más de 20 páginas web (FACEBOOK, YOUTUBE, HACKERNEWS, AIRBNB, OLX, MERCADO LIBRE, GOOGLE REVIEWS, ACCUWEATHER, TRIP ADVISOR, entre otras), sin detenernos en explicaciones complejas que no te servirán de mucho. En muy poco tiempo vas a aprender Web Scraping y te vas a enamorar del mundo de la extracción de datos!   


En este curso utilizaremos Python. El mejor lenguaje de programación para principiantes y uno de los favoritos a la hora de hacer Web Scraping.   

  • Si no sabes programar, te explicaré los fundamentos de la programación de una manera rápida y muy sencilla en la primera sección del curso.

  • Aprenderemos a hacer Web Scraping de:

    • Una página (NIVEL 1)

    • Varias páginas al mismo tiempo (NIVEL 2)

    • Páginas con carga dinámica (NIVEL 3)

    • APIs, iframes y scripts (NIVEL 4)

    • Páginas con CAPTCHAs, protección de Cloudflare, Token CSRF y autenticación por LOGIN (NIVEL 5)

    • y Web Scraping utilizando Proxies.

  • Finalmente existe un NIVEL EXTRA que contiene lo siguiente: 

    • Extracción de imágenes y archivos

    • Automatización de extracciones

    • Almacenamiento de datos en base de datos (MongoDB)

    • Actualizaciones periódicas de los datos almacenados.

  • Practicaremos extrayendo datos de más de 20 sitios web: YOUTUBE, FACEBOOK, X (TWITTER), HACKERNEWS, OLX, AIRBNB, MERCADO LIBRE, DIARIO EL UNIVERSO, WIKIPEDIA, STACKOVERFLOW, W3SCHOOLS, TRIPADVISOR, GOOGLE REVIEWS, GOOGLE SCHOLAR, GITHUB, ACCUWEATHER, URBANIA, ZONAPROP, FOOTDISTRICT, IGN, entre otros.

  • Vamos a aprender a utilizar 7 librerías modernas para hacer Web Scraping: LXML, Requests, Scrapy, Selenium, Beautiful Soup, Requests-HTML y Cloudscraper. Cada una con sus PROS y sus CONS. De tal forma que tengas un arsenal de herramientas para elegir al momento de hacer tu siguiente extracción de datos. Además veremos otras librerías tales como: Pillow, schedule, time, json y pymongo.

  • No nos detendremos en detalles complejos ni en teorías avanzadas. ¡Solamente veremos lo realmente necesario para que te conviertas en un maestro del Web Scraping!

  • Este curso utiliza la PRÁCTICA como herramienta principal para aprender. Es por esto que extraemos datos de +20 sitios web que suman un total de casi 19 horas de pura práctica extrayendo datos.

  • Soporte para instalación de librerías, preguntas sobre el curso, y extracciones personalizadas con las que tengas problemas.

  • ¡El curso es actualizado constantemente! ¡Este 2024 ya tenemos 8 clases nuevas! 


Este curso es tu mejor opción si:

  • Quieres convertirte en un maestro del Web Scraping de la forma más sencilla posible.

  • Quieres aprender Web Scraping practicando con muchos ejemplos de páginas reales.

  • Has tenido dificultades con otros cursos, y has llegado a pensar que la programación no es lo tuyo.

  • Eres un profesional en otra área diferente a la informática (estadística, matemática, biologia, ingenierías, etc) que necesita aprender a extraer datos de la web ¡YA!

  • Quieres aprender Web Scraping sin detenerte en explicaciones largas y complejas.

  • Quieres aprender desde los fundamentos hasta la limpieza, almacenamiento y actualización de los datos que extraigas.

Bạn sẽ học được gì

Aprenderás a extraer datos de la web utilizando Python.

Te enseñaré desde los fundamentos del Web Scraping hasta la limpieza, almacenamiento (MongoDB) y actualización de los datos que extraigamos.

Practicaremos extrayendo datos de más de 20 páginas web reales (FACEBOOK, YOUTUBE, TWITTER, MERCADO LIBRE, OLX, GOOGLE PLACES, TRIP ADVISOR, IGN, entre otros)

Extraerás datos de páginas webs que cargan dinámicamente, webs con paginación, webs con captchas y webs con autenticación.

Aprenderás a automatizar tus extracciones para que se ejecuten de manera periódica y realicen actualizaciones incrementales de los datos descargados.

Si no sabes programar, ¡Te enseñare a programar desde CERO para que no tengas problemas en el curso!

Aprenderás a extraer y procesar datos de la Web utilizando 7 librerías diferentes (Requests, lxml, Scrapy, BeautifulSoup, Selenium y más).

Entenderás cómo funcionan las estructuras y protocolos de las páginas webs y los formatos de transmisión de información (XML y JSON).

Aprenderás a sobrepasar la barrera de los molestos CAPTCHAs al hacer extracción de datos.

Aprenderás a hacer web scraping de manera ética y segura. Protegiendo tus IPs y evitando los baneos.

Aprenderás a realizar Web Scraping en la nube con Proxies.

Aprenderás a realizar extracción de imágenes y archivos

Yêu cầu

  • ¡No existe ningún requisito! Si no sabes programar, te enseñaré lo necesario desde CERO.

Nội dung khoá học

11 sections

¡BIENVENIDOS!

2 lectures
Bienvenida y Programa del curso
02:14
TIPS IMPORTANTES antes de iniciar y Repositorio de GITHUB
02:19

Aprendiendo a Programar en Python

19 lectures
¿Qué son los lenguajes de programación?
05:03
¿Qué es Python? + Instalación
11:25
Variables
02:32
Tipos de Datos
04:52
Operaciones entre Variables
03:53
Salidas por Pantalla
01:22
Librerías
02:50
Pedirle datos al Usuario
01:32
Operadores Lógicos y Condicionales
08:34
Prueba de Python #1
6 questions
Lazos
08:41
Colecciones PT 1 (Listas, Cadenas, Tuplas)
21:37
Prueba de Python #2
6 questions
Colecciones PT 2 (Conjuntos, Diccionarios)
13:28
Funciones
09:54
Manejo de Archivos
10:45
Manejo de Errores
03:48
Prueba de Python #3
7 questions
Clases y Objetos (POO)
22:20

Introducción al Web Scraping

13 lectures
¿Qué es el Web Scraping?
02:54
Páginas Web: HTML
08:53
Prueba #1
3 questions
Arquitectura Cliente-Servidor
02:50
URLs
03:38
Tipos de Web Scraping
04:06
Pasos del Web Scraping
01:52
Prueba #2
3 questions
Tu espada: Tutorial de XPATH | PT. 1
08:24
Tu espada: Tutorial de XPATH | PT. 2
07:46
Tu escudo: ÉTICA
01:51
Prueba #3
4 questions
Tipos de Páginas Webs: ¿Cuándo utilizar cada herramienta?
04:49

Web Scraping NIVEL 1: Una sola página estática

13 lectures
Introducción
02:11
Guía de Instalación de Python
01:55
Guía de Instalación de Librerías (Requests, LXML, BeautifulSoup, Scrapy)
05:06
Requests y LXML (Extracción de WIKIPEDIA)
21:08
Requests y Beautiful Soup I (Extracción de STACKOVERFLOW)
19:19
Requests y Beautiful Soup II (Extracción de HACKER NEWS) [2024]
25:04
Scrapy: Introducción
04:02
Scrapy: Solución de Problemas | Instalación
02:03
Scrapy (Extracción de STACKOVERFLOW)
24:02
Scrapy: Solución de Problemas | ¡El archivo CSV me aparece vacío!
03:35
Scrapy no funciona con todas las páginas webs
01:22
Scrapy (Extracción de DIARIO EL UNIVERSO)
25:33
Ejecutar Scrapy sin la Terminal (+ Jupyter Notebook, Google Colab o Similares)
06:48

Web Scraping NIVEL 2: Varias páginas del mismo dominio

13 lectures
Introducción: Scraping Vertical y Horizontal
03:22
Web Scraping Vertical (Extracción de TRIPADVISOR con Scrapy PT. 1)
25:10
Scrapy Map Compose (Extracción de TRIPADVISOR con Scrapy PT.2)
05:25
Web Scraping Horizontal y Vertical (Extracción de MERCADO LIBRE con Scrapy)
25:55
Varios tipos de Items y 2 dimensiones horizontales (Extracción de IGN)
30:37
2 niveles de profundidad (Extracción de TRIP ADVISOR con Scrapy PT.3)
31:34
Scrapy Link Extractor (Extracción de FARMACIA CRUZ VERDE)
17:41
¿Cuándo podemos utilizar Scrapy? (Extracción de GOOGLE SCHOLAR PT.1) [2024]
35:37
Limitando la Profundidad (Extracción de GOOGLE SCHOLAR PT.2) [2024]
12:04
Múltiples URLs Semilla (Extracción de URBANIA PT. 1)
16:40
Web Scraping en la Nube con CRAWLERA (Extracción de URBANIA PT. 2)
14:10
Web Scraping con Proxies con ZYTE (Extracción de URBANIA PT. 3) [2024]
09:45
Scrapy bajo el Microscopio (Primer Requerimiento, Delay, CSVs y Concurrencia)
17:42

Web Scraping NIVEL 3: Páginas Dinámicas

14 lectures
Introducción: SELENIUM [2024]
05:29
Carga de Datos por Clicks (Extracción de OLX)
23:07
Descarga Automática del Webdriver y Headless Mode (Extracción de AIRBNB) [2023]
17:57
Selenium y Google Colab
00:15
Esperando eventos (Extracción de OLX)
15:00
Web Scraping Dinámico Horizontal y Vertical (Extracción de MERCADO LIBRE)
26:33
Scrolling y Manejo de Tabs (Extracción de GOOGLE PLACES)
34:36
Formularios y Login (Extracción de TWITTER (X))
19:20
Detectando carga dinámica (¿Cuándo utilizar Selenium?)
13:08
Estrategias Avanzadas de Scrolling (Extracción de Comentarios de YOUTUBE) [2024]
38:27
Páginas caóticas y XPATHs avanzados (Extracción de Posts de FACEBOOK) [2024]
35:00
Scrolling Suavizado (Extracción de Posts de FACEBOOK) [2024]
18:12
Selenium con Proxies con Zyte (Extracción de MERCADO LIBRE) [2024]
02:04
Prueba: NIVEL 1, 2 y 3
3 questions

Web Scraping NIVEL 4: Web Scraping de APIs, iFrames y Scripts

10 lectures
Introducción
02:45
¿Qué es una API?
02:59
¿Qué es JSON?
02:31
¿Qué es una RESTful API?
04:58
Extracción de datos de APIs
23:48
Web Scraping y Pandas
08:09
Extracción de datos de iframes (W3SCHOOLS)
16:35
Extracción de Datos de Tag Script I (GOB.PE)
19:15
Extracción de Datos de Tag Script II (FootDistrict)
12:10
Carga Dinámica de Datos con Requests (Requests-HTML)
09:15

Web Scraping NIVEL 5: Autenticación y Captchas

9 lectures
Introducción a la Autenticación Online
04:39
Autenticación por Form Data de Login (Extracción de GITHUB)
28:09
Autenticación exclusivamente por API (Extracción de GITHUB)
09:10
Autenticación con Scrapy Spider (Extracción de GITHUB)
15:08
¿Qué son los captchas?
03:42
Resolviendo captchas manualmente
11:16
Resolviendo captchas de manera automática (2CAPTCHA)
16:28
Extracción de Páginas Protegidas por Cloudflare (Extracción de ZONAPROP)
14:00
Extracción de API protegida con autenticación por Token CSRF
14:59

Evitando Problemas: Ética

4 lectures
Web Scraping responsable
03:13
¿Cómo evitar que me baneen?
03:19
User Agents y VPNs
03:15
Rotación de User Agents con Scrapy
04:53

Web Scraping NIVEL FINAL: Automatización,almacenamiento y actualización de datos

6 lectures
Web Scraping de Imágenes (Extracción de OLX)
16:58
Web Scraping de Archivos (Extracción de FILES EXAMPLE)
13:59
Automatización de Extracción en Scrapy (Extracción de ACCUWEATHER)
19:32
Automatización de Extracción en Selenium (Extracción de ACCUWEATHER)
12:54
Almacenamiento de datos en MongoDB (Extracción de OLX)
08:04
Actualización periódica de datos con Selenium, Scrapy y Mongo (ACCUWEATHER)
13:51

Mis Otros Cursos, y Más Contenido Gratuito

1 lectures
Mis otros Cursos y más contenido gratuito
00:27

Đánh giá của học viên

Chưa có đánh giá
Course Rating
5
0%
4
0%
3
0%
2
0%
1
0%

Bình luận khách hàng

Viết Bình Luận

Bạn đánh giá khoá học này thế nào?

image

Đăng ký get khoá học Udemy - Unica - Gitiho giá chỉ 50k!

Get khoá học giá rẻ ngay trước khi bị fix.