Este projeto consiste em desenvolver um robô de Web Scraping usando a biblioteca Selenium em Python para obter informações das notícias da Prefeitura de Araraquara.
O objetivo é obter informações das notícias das 10 primeiras páginas (páginas 1 a 10) do site da Prefeitura de Araraquara. As informações a serem extraídas são:
- Título da notícia
- Atributo "src" da imagem de capa (se houver)
- HTML da notícia
- Atributo "src" das imagens internas da notícia (separadas por \n)
As informações obtidas serão armazenadas em um arquivo de texto (.txt), onde cada notícia será separada por uma quebra de linha (\n).
Antes de executar o robô de Web Scraping, certifique-se de ter os seguintes requisitos instalados em seu ambiente:
- Python 3.x
- Biblioteca Selenium (instalável via pip: pip install selenium)
- Clone este repositório em sua máquina local.
- Execute o script scraping.py para iniciar o robô de Web Scraping.
- Aguarde até que o robô colete todas as informações das notícias.
- O resultado será armazenado na pasta news, no mesmo diretório do script.
Pedro Willian