Extrayendo datos con Web Scraping
En este Workshop aprenderemos todo lo necesario para comprender como extraer información de diferentes sitios, presentarla por medio de web services, completar nuestras bases de datos o extraer información concreta de una página web que nos resulte relevante. Web Scraping es la técnica que en los últimos años tomó más impulso debido a la cantidad de información que consumimos y generamos a diario en nuestros dispositivos.
Aprenderemos:
- Conceptos básicos de Web Scraping
- Conceptos básicos de HTTP
- Herramientas para obtener información de la Web
- Librería BeautifulSoup de Python
- Framework Scrapy
Requisitos para el Workshop.
- Conocimientos básicos de WordPress
- No es necesario un conocimiento en Programación
- Manejo básico de Maquinas virtuales
- Ganas de aprender y participar
Destinado a:
- Desarrolladores Web
- Estudiantes de Informática
- Analistas de Datos
- Emprendedores
temas.
Introducción a Web Scraping
Introducción a HTML, CSS, Request y Response
URL, DOM y estructura HTML
Crawling, Scraping y Parsing (Rastreo de Paginas Web, extracción y organización de datos)
Formatos JSON y XML
Selector Xpath
Selector CSS
Introducción a Python (ejemplos prácticos)
Web Scraping con Python (ejemplo y práctica)
Analizando Request con la librería Beautiful Soup de Python
Analizamos el Framework Scrapy para el rastreo y extracción de datos.
...
Cómo crear un backup en Linux con el comando cpio
Daniel Maldonado
marzo 10, 2026
En la administración de sistemas Linux, realizar copias de seguridad es una práctica esencial para proteger información crítica. Aunque muchas personas utilizan herramientas populares como tar, existe otra utilidad clásica…
Cómo comprimir archivos xz en Linux
Daniel Maldonado
febrero 17, 2026
En el ecosistema Linux, la compresión de archivos es una práctica cotidiana: reduce espacio en disco, optimiza transferencias y facilita respaldos. Entre los distintos formatos disponibles, XZ se destaca por…
Cómo limpiar el caché de Nginx en Linux
Daniel Maldonado
diciembre 19, 2024
Limpiar el caché de Nginx en Linux es sencillo y útil para resolver problemas relacionados con contenido desactualizado. Primero, identifica la ubicación del directorio de caché, generalmente configurado en el…
Cómo configurar Apache2 con MPM Event y PHP8
Daniel Maldonado
marzo 24, 2024
Hoy les voy a compartir cómo realizo la configuración en el servidor Apache2 HTTP con MPM Event y el lenguaje de programación PHP8. El servidor web Apache Apache HTTP Server…
Disponible Debian 11.7 con más de 100 actualizaciones de seguridad y correcciones de errores
Daniel Maldonado
mayo 2, 2023
El lanzamiento del séptimo punto en la serie «Bullseye» de Debian 11 ya está disponible para descargar. Debian 11.7 no incluye ninguna característica nueva (como se esperaba), pero sí incluye…
Cómo descomprimir archivos xz en Linux
Daniel Maldonado
abril 8, 2023
¿Alguna vez te has encontrado con archivos xz y no sabes cómo abrirlo? No te preocupes, en este artículo te enseñaré cómo descomprimir estos archivos en la terminal de comandos…



