webscraping-imdb's Introduction

IMDb Spanish Celebrities Web Scraping

Este repositorio contiene un script en Python para realizar web scraping en la página web de IMDb con el objetivo de obtener información sobre las 100 celebridades españolas más populares. El script utiliza BeautifulSoup para analizar el HTML de la página y extraer datos como el nombre de la celebridad, la foto y una breve descripción.

Características

Nombre: Extrae el nombre de las celebridades españolas.
Foto: Obtiene la URL de la foto de perfil de cada celebridad.
Biografía: Captura una breve descripción de cada celebridad.

Cómo Usar

Clona este repositorio en tu máquina local.
Instala las dependencias usando pip install -r requirements.txt.
Ejecuta el script WebScrapping - Actores Españoles.ipynb para obtener el DataFrame con la información de las celebridades.

Dependencias

requests: Para realizar solicitudes HTTP.
beautifulsoup4: Para analizar el HTML y extraer datos.
pandas: Para trabajar con datos en forma de DataFrame.

Nota: Asegúrate de cumplir con los términos de servicio de IMDb al utilizar este script para scraping.

Contribuciones

¡Las contribuciones son bienvenidas! Si encuentras mejoras o tienes ideas para agregar más funcionalidades, no dudes en abrir un problema o enviar una solicitud de extracción.

Recommend Projects

danielarosero / webscraping-imdb Goto Github PK

webscraping-imdb's Introduction

IMDb Spanish Celebrities Web Scraping

Características

Cómo Usar

Dependencias

Contribuciones

webscraping-imdb's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent