Git Product home page Git Product logo

educaods-enem's Introduction

Análise dos Dados do ENEM e ODS em Educação

Este repositório é dedicado à análise dos dados do Exame Nacional do Ensino Médio (ENEM) em relação aos Objetivos de Desenvolvimento Sustentável (ODS) no contexto da educação. Aqui, exploramos diversos aspectos, desde fatores socioeconômicos até diferenças regionais e de diversidade.

Objetivos:

  • Investigar as disparidades educacionais no Brasil utilizando os dados do ENEM.
  • Relacionar o desempenho no exame com os ODS em educação.
  • Fornecer insights para políticas públicas voltadas para a educação.

Ideias da Análise:

  • Desempenho por região e correlação com indicadores socioeconômicos.
  • Diversidade e áreas de conhecimento com foco em: matemática e redação.
  • Acessibilidade e análise de candidatos menos favorecidos.
  • Avaliar quais métodos de estudo se destacaram para o desempenho dos alunos e quais foram os principais desafios enfrentados.
  • Criação de modelos através de Regressão Linear e Random Forest para avaliar classificadores que impactam na nota dos alunos.

Extração de Dados:

Através da plataforma do INEP: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados e baixamos os Microdados do Enem 2022. Daí, haviam 4 pastas:

  • DADOS
  • DICIONÁRIOS
  • INPUTS
  • LEIA-ME E DOCUMENTOS TÉCNICOS
  • PROVAS E GABARITOS

Na primeira pasta, haviam os csv's com os dados do ENEM 2022 EM "MICRODADOS_ENEM_2022.csv", onde temos as informações de cada candidato por número de inscrição das colunas descritas na pasta de dicionários. E os arquivos com as respostas dos estudantes em "QUEST_HAB_ESTUDO.CSV" do questionário sobre os hábitos de estudo na pandemia.

Na segunda pasta, havia o dicionário de variáveis na aba "MICRODADOS_ENEM_2022", o dicionário referente aos itens da prova como código da questão, área do conhecimento, se o item foi abandonado, níveis de dificuldade, entre outros na aba "ITENS_PROVA_2022" e por último havia o dicionário referente aos hábitos de estudo durante a pandemia na aba "QUEST_HAB_ESTUDO".

Na terceira pasta, havia alguns arquivos em .sas e .r para auxiliar na leitura dos dados. Que não utilizaremos.

Na quarta pasta, haviam os editais, informações sobre o cálculo da nota, a metodologia utilizada, a estrutura do exame, entre outros em PDF. Que também não nos aprofundaremos.

Na última pasta, temos os arquivos com as provas e gabaritos em PDF's que não serão utilizado.

Limpeza de Dados:

Após uma leitura inicial dos dados, decidimos importar as seguintes colunas:

  • 'NU_INSCRICAO'
  • 'TP_FAIXA_ETARIA'
  • 'TP_SEXO'
  • 'TP_COR_RACA'
  • 'TP_ESCOLA'
  • 'TP_ENSINO'
  • 'IN_TREINEIRO' (Se o aluno está fazendo o ENEM para treinar)
  • 'CO_MUNICIPIO_ESC' (Código no Município e Estado da Escola)
  • 'TP_PRESENCA_CN' (Presença em Ciências Naturais)
  • 'TP_PRESENCA_CH' (Presença em Ciências Humanas)
  • 'TP_PRESENCA_LC' (Presença em Linguagens e Comunicações)
  • 'TP_PRESENCA_MT' (Presença em Matemática)
  • 'NU_NOTA_CN' (Nota de Ciências Naturais)
  • 'NU_NOTA_CH' (Nota de Ciências Humanas)
  • 'NU_NOTA_LC' (Nota de Linguagens e Comunicações)
  • 'NU_NOTA_MT' (Nota de Matemática)
  • 'TP_STATUS_REDACAO' (Presença na Redação)
  • 'NU_NOTA_REDACAO' (Nota de Redação)
  • 'Q001' (Nível Educacional do Pai)
  • 'Q002' (Nível Edcacional da Mãe)
  • 'Q005' (Número de Habitantes na Residência)
  • 'Q006' (Renda Familiar)
  • 'Q024' (Acesso a Computadores)
  • 'Q025' (Acesso a Internet)

A partir daí, pela limitação do github com espaço de memória, começamos extraindo com Pandas os dados em "MICRODADOS_ENEM_2022.csv" que inicialmente continham 3.476.105 linhas e 76 colunas. Pelo fato dos dados serem muito grandes, filtramos o número de alunos que estiveram presentes nos dois dias de prova em todas as áreas e que responderam o questionário sobre os hábitos de estudo durante a pandemia em "QUEST_HAB_ESTUDO.csv". Através de um merge nos dois datasets de dados na coluna "NU_INSCRICAO" que é comum a ambos, geramos nosso csv final "microdados_reduzido.csv".

teste

educaods-enem's People

Contributors

edilton-bs avatar iaracastro avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.