Git Product home page Git Product logo

coletor-cnj's Introduction

Conselho Nacional de Justiça (CNJ)

Este coletor tem como objetivo a recuperação de informações sobre folhas de pagamentos dos funcionários dos tribunais brasileiros, a partir do Conselho Nacional de Justiça. O site com as informações pode ser acessado aqui.

O crawler está estruturado como uma CLI. Você deve passar dois argumentos: O órgão e o caminho para o diretório do chromedriver, e serão baixadas quatro planilhas no formato xlsx, cada planilha é referente a uma destas categorias:

    1. Contracheque
    1. Direitos Pessoais
    1. Indenizações
    1. Direitos Eventuais

Estas planilhas contém as informações de pagamento de todos os meses disponíveis, a fim de gerar os crawling results de cada mês.

Como usar

Executando com Docker

  • Inicialmente é preciso instalar o Docker.

  • Construção da imagem:

  $ cd coletores/cnj
  $ sudo docker build -t cnj .
  • Execução:
  $ sudo docker run -e COURT=TJRJ -e YEAR=2020 -e MONTH=2 -e DRIVER_PATH=/chromedriver -e GIT_COMMIT=$(git rev-list -1 HEAD) cnj

Execução sem Docker:

  • Para executar o script é necessário rodar o seguinte comando, a partir do diretório cnj, adicionando às variáveis seus respectivos valores, a depender da consulta desejada. É válido lembrar que faz-se necessario ter o Python 3.6.9 instalado, bem como o chromedriver compatível com a versão do seu Google Chrome. Ele pode ser baixado aqui.

    COURT=TJRJ YEAR=2018 MONTH=03 DRIVER_PATH=/chromedriver GIT_COMMIT=$(git rev-list -1 HEAD) python3 main.py
  • Para que a execução do script possa ser corretamente executada é necessário que todos os requirements sejam devidamente instalados. Para isso, executar o PIP passando o arquivo requiments.txt, por meio do seguinte comando:

       pip install -r requirements.txt

coletor-cnj's People

Contributors

danielfireman avatar joaolgm avatar joeberth avatar marcos-inja avatar

Stargazers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.