Git Product home page Git Product logo

data-hunters's Introduction

DSRP | "Dataton por la Integridad y Lucha contra la Corrupción en Obras Públicas"

Nombre de equipo : DATA HUNTERS

Team

Desafío

Adaptar y aprovechar los beneficios de la ciencia de datos e inteligencia artificial para resolver los desafíos actuales relacionados a corrupción en contrataciones en obras públicas del estado Peruano. La solución tecnológica a presentar contempla un nivel de innovación, aplicable, sostenible y escalable a la categoría establecida de contrataciones públicas.

Etapa 1: Extracción, transformación, carga y apertura de datos que contribuyan a resolver el desafío

El objetivo de esta etapa es que en conjunto los equipos puedan identificar las fuentes de datos relevantes a distintos retos y bajo procedimientos de extracción de información automática se puedan liberar dichos datasets de este listado preseleccionado por los organizadores. Muchos de los datos de interés están principalmente alojados en portales de consulta pública en formatos no amigables para el fin propuesto como: pdfs, resultados de búsquedas en tablas, entre otros formatos.

Reto identificado por el equipo:

¿Cuáles son los patrones que denoten presuntos actos de corrupción en las instituciones públicas del Perú?

¿Sabías que el perjuicio económico al Estado peruano producto de la corrupción es de 625 millones de dólares en el año 2021? De acuerdo a la Contraloria General de la República halló que 7.740 funcionarios cometieron presuntos actos de corrupción en 2021. (https://www.sandiegouniontribune.com/en-espanol/noticias/story/2022-01-11/peru-casi-8-000-funcionarios-ligados-a-corrupcion-en-2021)

¿Cómo lo hicimos? | ESTRATEGIA

  1. Identificación de instituciones públicas que cuentan con datos relacionados a las compras públicas en el país.
  2. Identificación de Bases de Datos que contengan información útil.
  3. Identificación de categorías relevantes de cada base de datos.
  4. Obtención de las Bases de Datos.
    • Consultas al Portal de Datos Abiertos.
    • Descarga de Data Sets Públicos (CONOSCE, MEF, JNE).
    • Web scraping (SSI, SUNAT, CONTRALORIA).
    • Acceso a la Información Pública (SUNAT).
  5. Organizar los dataset.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.