Git Product home page Git Product logo

web_scraper's Introduction

💫 Web Scraping - Mais vendidos da Amazon 💫

Vídeo demostrativo da aplicação

Projeto

Desenvolvimento de um Sistema de Web Scraping dos produtos mais vendidos da Amazon. Os produtos são capturados e salvos com as informações de categoria, nome, id, preço e disponibilizados para serem consumidos por uma API e populados em um banco de dados.

O que é um Web Scraper?

Ferramenta que extrai dados automaticamente de páginas da web. Ele analisa o código HTML de um site e coleta informações específicas, como preços de produtos ou detalhes de contato. Pode ser usado para monitoramento de preços, pesquisa de mercado e outras aplicações.

Stack

Tecnologias

  • AWS Lambda - Utilizado para computação de forma serverless. No contexto do projeto, foi possível desenvolver e implantar funções que são ativadas em resposta a eventos. Isso permitiu uma execução sob demanda e escalabilidade automática, eliminando a necessidade de provisionar ou gerenciar servidores.

  • AWS API Gateway - Utilizado para a gestão da API. No projeto, desempenha um papel na exposição e gerenciamento dos endpoints, permitindo definição de rotas, métodos HTTP e controle de acesso.

  • AWS DynamoDB - Utilizado como banco de dados. No projeto, o AWS DynamoDB é essencial para armazenar e gerenciar os dados coletados pelo web scraper.

  • Puppeteer - Ferramenta de scraping. O Puppeteer é uma ferramenta utilizada no projeto para automatizar a navegação e interação com a página de mais vendidos da Amazon

Endpoints

1. Listar Todos os items

Retorna uma lista com todos os produtos

  • URL: dev/items
  • Método: GET
  • Resposta de Sucesso:
    • Código: 200 OK
    • Exemplo de Corpo:
    [
      {
          "productID": "B09BK73232",
          "categoria": "Cozinha",
          "name": "Filtro/Refil de Água Acqua Pure para Purificador Electrolux PE12A/PE12B/PE12G/PE12V",
          "price": "R$ 78,90",
      },
      {
          "productID": "6598078806",
          "categoria": "Livros",
          "name": "Café com Deus Pai 2024: Porções Diárias de paz",
          "price": "R$ 66,51",
      }
    ]

2. Pesquisar Item

Retorna o produto pesquisado pelo id

  • URL: dev/items/B089XVR312
  • Método: GET
  • Resposta de Sucesso:
    • Código: 200 OK
    • Exemplo de Corpo:
      {
          "productID": "B089XVR312",
          "categoria": "Móveis",
          "name": "Mesa para Escritório Office Estilo Industrial 1,50m Kuadra",
          "price": "R$ 287,90",
      }
    

3. Deletar Item

Deleta item pelo id

  • URL: dev/items/B089XVR312
  • Método: DELETE
  • Resposta de Sucesso:
    • Código: 200 OK
    • Exemplo de Corpo:
     { "message": "Item excluido com sucesso" }
    

4. Buscar todas as categorias

Retorna uma lista com todas as categorias cadastradas no banco de dados.

  • URL: dev/category
  • Método: GET
  • Resposta de Sucesso:
    • Código: 200 OK
    • Exemplo de Corpo:
     {
      "categories": [
          "Cozinha",
          "Beleza",
          "Livros",
          "Ferramentas",
          "Móveis",
          "Eletrônicos",
          "Computadores"
      ]
    }
    
    

web_scraper's People

Contributors

tayamorim avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.