Git Product home page Git Product logo

clustering_municipios_eleicoes_2022_ceara's Introduction

Clustering dos municípios cearenses - Eleições 2022

Objetivo do projeto

Obter e extrair dados a fim de analisar (dados da votação, mas também de votação por indicadores socioeconômicos) e clusterizar os municípios cearenses com base na proporção de votos nos principais candidatos aos cargos de: governador, senador e presidente (1º e 2º turno).

Etapas do projeto

Obtenção de extração dos dados:

Os dados foram obtidos ou extraídos utilizando a biblioteca selenium. Os dados eleitorais foram coletados com automação web a partir do portal de dados abertos do TSE. image

Os dados de resumo de alguns indicadores socioeconômicos do IBGE foram extraídos por meio de web scraping.

Extração e tratamento dos dados:

Os obtidos do TSE são compactados, sendo necessária a sua descompactação. Para isso, uma classe Extract foi instanciada com base na biblioteca zipfile. Ambos os dados (eleição e IBGE) foram tratados para que estivessem num formato mais pronto para as análises posteriores e clusterização.

Análise dos dados:

Para obter diferentes insights, foram feitas diversas análises. Tanto de um panorama mais geral para entender o número de zonas e seções eleitorais, e as cidades com o maior número destas, mas também a contribuição de votos de cada município para eleição no estado.

Assim como análises mais focadas nos cargos disputados. A visualização de dados foi feita utilizando a biblioteca plotly. Também foi feito o uso da biblioteca geobr a fim de obter dados geoespaciais.

image

Clustering dos municípios cearenses e análise de seus perfis:

A modelagem foi feita utilizando o algoritmo KMeans e teve como base a proporção de votos válidos para os principais candidatos que disputaram os cargos de governador e senador do estado, além de presidente (3 candidatos para o 1º turno e 2 candidatos no 2º turno). No estado do Ceará não houve disputa no 2º turno para governador.

image

Ademais, após a definição dos clusters foi feita a análise do perfil eleitoral de cada um deles.

Como executá-lo?

A pasta dataprocessing contém o pacote com as classes utilizadas para coletar, extrair e baixar os dados. O código está documentado. Além disso, o arquivo requirements.txt contém as versões da ferramentas utilizadas no projeto.

Desenvolvido por

Damodara Barbosa, Cientista de Dados e Instrutor de Ciência de Dados LinkedIn: https://www.linkedin.com/in/damodarabarbosa/

clustering_municipios_eleicoes_2022_ceara's People

Contributors

damodarabarbosa avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.