Git Product home page Git Product logo

extracao-xml-py's Introduction

Extração de dados - Python

Scripts feitos em python para extração de dados contidos em XMLs de notas ficais de postos de gasolina.

1 - EXTRAIR VENDAS - CNPJ

Extrai os dados de vendas dos XMLs de venda dos postos de combustiveis especificado pelo CNPJ.

  • Inicia o cronometro.
  • Especifica o diretorio principal.
  • Especifica o CNPJ do posto.
  • Itera em todas as pastas do diretorio especificado.
  • Itera em todos os arquivos XML da pasta atual e extrai as informações relevantes contidas no XML.
  • Salva os dados extraidos em uma planilha XLSX.
  • Define o nome da planilha.
  • Apaga todas planilhas que forem menor que 4KB
  • Finaliza o cronometro
  • Exibe informações como (Notas processadas, Notas não processadas, tempo total de execução em M\S).

NESCESSARIO ORGANIZAÇÃO DOS ARQUIVOS EM PASTAS COMO NO EXEMPLO DE DIRETORIO ABAIXO

Diretorio-principal         ---Diretorio Raiz   (DIRETORIO A SER ESPECIFICADO NO SCRIPT)
    2018                        ---Ano
        01                          ---Mês
            .xml                        ---Arquivos .xml de vendas que serão extraido as informações
            .xml
            .xml
        02
            .xml
            .xml
            .xml
        03
        XX
    2019
    XXXX
    COMPRAS                     ---Pastas dos XMLs de compras
        COMPRA 2018
            .xml

2 - EXTRAIR COMPRAS - CNPJ

Extrai os dados de compras dos XMLs de compras dos postos de combustiveis especificado pelo CNPJ.

  • Especifica o diretorio das compras.
  • Especifica o CNPJ do posto.
  • Itera em todas as pastas do diretorio especificado.
  • Itera em todos os arquivos XML da pasta atual.
  • Apaga todos os XMLs cancelados.
  • Extrai as informações relevantes contidas no XML.
  • Se não possuir a informações, ela é considerada 0.
  • Salva os dados extraidos em uma planilha XLSX.
  • Define o nome da planilha.
  • Exibe informações como (Notas processadas, Notas não processadas).

NESCESSARIO ORGANIZAÇÃO DOS ARQUIVOS EM PASTAS COMO NO EXEMPLO DE DIRETORIO ABAIXO

Diretorio-principal         ---Diretorio Raiz
    2018                        ---Ano
        01                          ---Mês
            .xml                        ---XML de venda (NÃO SERÁ USADO)
    2019
    COMPRAS                     ---Pasta que contem todas compras dos anos  (DIRETORIO A SER ESPECIFICADO NO SCRIPT)
        COMPRA 2018                 ---Todas compras do ano(os XMLs que será extraido as informações deverá estar nestas pastas)
            .xml                        ---XML de COMPRA
            .xml
            .xml
        COMPRA 2019
        COMPRA XXXX

3 - EXTRAIR COMPRAS - COTEPE

Extrai os dados de compras dos XMLs de compras dos postos de combustiveis especificado pelo CNPJ. A extração será feita para a utilização da tabela COTEPE.

  • Especifica o diretorio principal.
  • Especifica o CNPJ do posto.
  • Itera em todas as pastas do diretorio especificado.
  • Itera em todos os arquivos XML da pasta atual.
  • Extrai as informações relevantes contidas no XML.
  • Se não possuir a informações, ela é considerada 0.
  • Informa os dados nescessarios para a utilização da COTEPE.
  • Salva os dados extraidos em uma planilha XLSX.
  • Define o nome da planilha.
  • Exibe informações como (Notas processadas, Notas não processadas).

NESCESSARIO ORGANIZAÇÃO DOS ARQUIVOS EM PASTAS COMO NO EXEMPLO DE DIRETORIO ABAIXO

Diretorio-principal         ---Diretorio Raiz
    2018                        ---Ano
        01                          ---Mês
            .xml                        ---XML de venda (NÃO SERÁ USADO)
    2019
    COMPRAS                     ---Pasta que contem todas compras dos anos  (DIRETORIO A SER ESPECIFICADO NO SCRIPT)
        COMPRA 2018                 ---Todas compras do ano(os XMLs que será extraido as informações deverá estar nestas pastas)
            .xml                        ---XML de COMPRA
            .xml
            .xml
        COMPRA 2019
        COMPRA XXXX

4 - GERAR RELATORIO

Gera um relatorio com os dados dos CSVs de cada posto, organizando essas dados e os salva em uma planilha fixa.

  • Especifica o diretorio dos postos.
  • Itera em todos os CSVs.
  • Extrai apenas os dados nescessarios para o relatorio.
  • Salva os dados em uma planilha fixa.

5 - ABRIR PLANILHAS

Abre todas as planilhas .xlsx de um diretorio especificado.

  • Especifica o diretorio.
  • Itera todos os arquivos do diretorio.
  • Se for uma planilha .xlsx e não for uma planilha de compra, Abre.

extracao-xml-py's People

Contributors

sales16 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.