Este repositorio contiene un script en Python para realizar web scraping en la página web de IMDb con el objetivo de obtener información sobre las 100 celebridades españolas más populares. El script utiliza BeautifulSoup para analizar el HTML de la página y extraer datos como el nombre de la celebridad, la foto y una breve descripción.
- Nombre: Extrae el nombre de las celebridades españolas.
- Foto: Obtiene la URL de la foto de perfil de cada celebridad.
- Biografía: Captura una breve descripción de cada celebridad.
- Clona este repositorio en tu máquina local.
- Instala las dependencias usando
pip install -r requirements.txt
. - Ejecuta el script
WebScrapping - Actores Españoles.ipynb
para obtener el DataFrame con la información de las celebridades.
requests
: Para realizar solicitudes HTTP.beautifulsoup4
: Para analizar el HTML y extraer datos.pandas
: Para trabajar con datos en forma de DataFrame.
Nota: Asegúrate de cumplir con los términos de servicio de IMDb al utilizar este script para scraping.
¡Las contribuciones son bienvenidas! Si encuentras mejoras o tienes ideas para agregar más funcionalidades, no dudes en abrir un problema o enviar una solicitud de extracción.