Git Product home page Git Product logo

easybroker-scraping's Introduction

Contributors Forks Stargazers Issues MIT Licencia LinkedIn


Logo

EasyBroker Scraping

Web scraping en el sitio web de EasyBroker
Explorar docs »

Reportar Bug · Request Feature

Tabla de contenido
  1. Acerca del Proyecto
  2. Getting Started
  3. Uso
  4. Roadmap
  5. Contribuciones
  6. Licencia
  7. Contacto

Acerca del Proyecto

screenshot

Este proyecto utiliza Selenium y BeautifulSoup para hacer web scraping en el sitio web de EasyBroker y extraer el nombre, ubicación, teléfono y pagina web de las inmobiliarias registradas.

(volver arriba)

Desarrollado con:

  • Python
  • Pandas
  • Selenium
  • Jupiter
  • VSC
  • BeautifulSoup

(volver arriba)

Getting Started

Para ejecutar este proyecto localmente sigue estos pasos para configurarlo:

Instalación

  1. Clona el repositorio:
    git clone https://github.com/FreddyPinto/easybroker-scraping.git
  2. Crea un entorno virtual de Python:
    python -m venv venv
  3. Activa el entorno virtual:
    • En Windows:
      .\env\Scripts\activate
    • Unix o MacOS:
      env/bin/activate
  4. Instala las dependencias:
    pip install -r requirements.txt
  5. Configura tus variables de entorno. Crea un archivo .env en la raíz del proyecto y añade tus credenciales de EasyBroker:
    EMAIL=tu_email
    PASSWORD=tu_contraseña

(volver arriba)

Uso

Ejecuta el script de Python para hacer web scraping en el sitio web de EasyBroker:

python src/scripts/make_data.py

Esto generará un archivo CSV en la carpeta data con la información extraída.

(volver arriba)

Roadmap

Este proyecto se realizó como un Producto Mínimo Viable, por lo que se podrían mejorar algunos aspectos en el futuro, con la finalidad de lograr un producto más completo y robusto. Algunas de las posibles mejoras son:

  • Mejorar la eficiencia del web scraping, explorando técnicas para acelerar la extracción de datos.

  • Implementar un manejo de errores más robusto para manejar posibles fallos durante el web scraping.

  • Explorar el uso de una base de datos para almacenar los datos extraídos, lo que permitiría consultas más eficientes y un almacenamiento más seguro.

  • Mejorar la limpieza y el preprocesamiento de los datos, para asegurar que los datos estén en el formato más útil para el análisis.

  • Implementar pruebas automatizadas para asegurar que el código funciona como se espera después de cada cambio.

  • Explorar otras bibliotecas o herramientas para el web scraping que podrían ofrecer mejores prestaciones o facilidades de uso.

  • Mejorar la documentación del proyecto, incluyendo más detalles sobre cómo se realiza el web scraping y cómo se pueden utilizar los datos extraídos.

Consulta los issues abiertos para proponer características (y problemas conocidos).

(volver arriba)

Contribuciones

Las contribuciones son lo que hacen que la comunidad de código abierto sea un lugar increíble para apBeautifulSoup, inspirarse y crear. Cualquier contribución que hagas será muy apreciada.

Si tienes una sugerencia para mejorar este proyecto, haz un fork del repositorio y crea un pull request. También puedes simplemente abrir un issue con la etiqueta “enhancement”. ¡No olvides darle una estrella al proyecto! Gracias de nuevo.

  1. Haz un fork del Proyecto
  2. Crea tu feature Branch (git checkout -b feature/AmazingFeature)
  3. Haz commit de tus cambios (git commit -m 'Add some AmazingFeature')
  4. Push a la Branch (git push origin feature/AmazingFeature)
  5. Abre un Pull Request

(volver arriba)

Licencia

Distribuido bajo la licencia MIT. Consulta el archivo LICENSE para más información.

(volver arriba)

Contacto

Freddy Pinto - [email protected]

LinkedIn

Project Link: https://github.com/FreddyPinto/easybroker-scraping

(volver arriba)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.