webnets-scrapping's Introduction

Desafio de Web Scraping - Prefeitura de Araraquara

Este projeto consiste em desenvolver um robô de Web Scraping usando a biblioteca Selenium em Python para obter informações das notícias da Prefeitura de Araraquara.

Descrição do Desafio

O objetivo é obter informações das notícias das 10 primeiras páginas (páginas 1 a 10) do site da Prefeitura de Araraquara. As informações a serem extraídas são:

Título da notícia
Atributo "src" da imagem de capa (se houver)
HTML da notícia
Atributo "src" das imagens internas da notícia (separadas por \n)

As informações obtidas serão armazenadas em um arquivo de texto (.txt), onde cada notícia será separada por uma quebra de linha (\n).

Pré-requisitos

Antes de executar o robô de Web Scraping, certifique-se de ter os seguintes requisitos instalados em seu ambiente:

Python 3.x
Biblioteca Selenium (instalável via pip: pip install selenium)

Como executar

Clone este repositório em sua máquina local.
Execute o script scraping.py para iniciar o robô de Web Scraping.
Aguarde até que o robô colete todas as informações das notícias.
O resultado será armazenado na pasta news, no mesmo diretório do script.

Autor

Pedro Willian

Recommend Projects

pedrowill-dev / webnets-scrapping Goto Github PK

webnets-scrapping's Introduction

Desafio de Web Scraping - Prefeitura de Araraquara

Descrição do Desafio

Pré-requisitos

Como executar

Autor

webnets-scrapping's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent