Git Product home page Git Product logo

dados's Introduction

Dados

Repositório com CSVs utilizados para análises da célula de dados e com resultados encontrados.

Organização do repositório

  • Gastos da UFCG : CVS's de gastos publicos da UFCG junto de jupyter notebooks de análises e resultados encontrados.
  • SISU : CVS's de dados do SISU paraíba e SISU UFCG. Os dados nacionais podem ser encontrados no portal de dados abertos do MEC
  • Cadas pasta conta com uma subpasta notebooks referente as análises feitas.

dados's People

Contributors

arthurfernandesvieira avatar danieleolivs avatar gabriel-emannuel avatar gabrielemannue avatar gustavo-maia-gst avatar kemilli-lima avatar leofarias-cpu avatar leonardo-mota-filho avatar lucasqueiros avatar moabalv avatar rafa-pb avatar ricardoadley avatar smilke avatar

Stargazers

 avatar  avatar

Watchers

 avatar  avatar  avatar  avatar

dados's Issues

Histórico de aprovados nas optativas especificas

Eu, como integrante da célula, desejo saber como se distribuem as aprovações e reprovações dos alunos de CC nas optativas especificas do curso

  • Filtrar os dados para as cadeiras optativas
  • Calcular a quantidade de aprovados e reprovados
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

Link para o colab

Google Colab

Analisar desempenho dos alunos na cadeira optativa de Economia

Eu, como integrante da célula, desejo saber como é o desempnho dos alunos na disciplina optativa geral 'Economia'

  • Filtrar dados para a cadeira de economia
  • Observar maiores e menores medias
  • Observar quantidade de reprovados e trancamentos
  • Observar quantidade de alunos aprovados com media menor que 7
  • Gerar visualizações e descrever os resultados

Aprovação e reprovação dos estudantes de CC nas cadeiras optativas gerais (Fora do DSC)

Eu, como integrante da célula, desejo saber como se distribuem as aprovações e reprovações dos alunos de CC nas optativas ofertadas por outros departamentos

  • Filtrar os dados para as cadeiras opitativas gerais
  • Calcular a quantidade de aprovados e reprovados
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

Observar onde estão as maiores e menores medias das áreas do enem e se elas mudaram com o tempo para CC na UFCG

Eu, como integrante da célula, desejo ver como as medias de ingresso no curso se comportaram durante os anos.

  • Filtrar os dados para CC na UFCG
  • Identificar a maior média de cada área por sisu (.1 e .2)
  • Identificar a menor média (nota de corte) de cada área por sisu (.1 e .2)
  • Identificar qual a área com a maior media e qual com a menor (nota de corte)
  • Observar o comportamento desse valor durante os anos (uma visualização como grafico talvez)
  • Plotar graficos sobre as medias em cada area (displot e boxplot por exemplo)

Link para acesso ao colab com o código e resultados obtidos Link

Como se distribui os inscritos (aprovados e reprovados) observando se o curso foi 1ª ou 2ª opção para CC na UFCG

Eu, como integrante da célula, desejo saber como se distribui os incritos no curso, ao serem aprovados ou reprovados o curso era a 1ª ou a 2ª opção deles?

  • Filtrar os dados para o curso de ciência da computação na UFCG
  • Calcular quantidade de inscritos como 1ª opção e 2ª opção
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado link do notebook

Observar a diferença entre as notas de corte para os cursos de EE, CC,CC na UEPB e Engenharia da computação no IFPB (estão crescendo ou diminuindo)

Eu, como integrante da célula, desejo saber como são as notas de cortes para os cursos de computação na cidade de campina grande, o aumento (e interesse) esta sendo em apenas uma instituição?

  • Filtrar os dados para os cursos de CC na UFCG, Engenharia Eletrica na UFCG, CC na UEPB (apenas campina grande) e Engenharia da Computação do IFPB (apenas campina grande)
  • Observar a nota de corte ao longo dos anos para esses cursos (todas as listas)
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Fonte dos dados

Os dados estão no repositorio do git da célula

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Analisar quantidade de inscritos (aprovados e reprovados) para os diferentes campus da UFCG

Eu, como integrante da célula, desejo saber se a busca por ingresso nos diferentes campi da UFCG vem aumentando ou diminuindo.

  • Filtrar dados para os diferentes campi da UFCG
  • Calcular quantidade de inscritos aprovados e reprovados para cada campi
  • Observar como foi o número de inscritos em cada ano para os diferentes campi
  • Gerar visualizações e descrever os resultados

Analisar desempenho dos alunos nas cadeiras do primeiro periodo

Eu, como integrante da célula, desejo saber como é o desempenho dos estudantes no primeiro periodo do curso

  • Filtrar cadeiras do primeiro periodo
  • Observar porcentagem de reprovados e aprovados nas disciplinas
  • Observar quantidade de trancamentos das cadeiras
  • Ver distribuição das medias
  • Gerar visualizações e descrever os resultados

Ver a quantidade de aprovados vindos de escola publica, privada ou federal considerando apenas a lista geral para CC na UFCG

Eu, como integrante da célula, desejo saber onde os aprovados do curso cursaram o ensino médio. Observando se essa distribuição mudou ao longo dos anos

  • Filtrar os dados para o curso de ciência da computação na UFCG
  • Filtrar apenas ingressantes pela lista geral
  • Calcular a quantidade de acordo com a instituição onde cursaram o ensino médio
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Observar como se distribui a busca de inscritos nas cotas de acesso entre homens e mulheres

Eu, como integrante da célula, desejo saber se existe uma diferença significativa entre homens e mulheres no momento de tentar ingresso no curso por cotas.

  • Filtrar dados para CC na UFCG
  • Observar a busca de inscritos pelas cotas
  • Ver como se distribui os incritos (aprovados e reprovados) nas cotas entre homens e mulheres
  • Gerar visualizações e descrever os resultados

Quantidade de matriculados por período na cadeira de TC

Eu, como integrante da célula, desejo saber como se distribui a quantidade de matriculados na cadeira de TC ao longo dos periodos

  • Filtrar os dados para a cadeira de TC
  • Calcular a quantidade de matriculados em cada periodo
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado
Liink: https://colab.research.google.com/drive/1Xth5m_xgUkYfb9yx2wVwBjk6tktGVb6H#scrollTo=kiqHIPZheHII

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

Desempenho dos alunos nas cadeiras de cálculo

Eu, como integrante da célula, desejo saber como é o desempenho dos alunos nas cadeiras de cáculo do curso

  • Filtrar os dados para as cadeiras de cálculo
  • Calcular a quantidade de aprovados e reprovados
  • Ver distribuição das médias
  • Gerar visualizações para os resultados
  • Descrever os achados na análise
  • Expandir para outras cadeiras relacionadas com cálculo

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

Link do jupyter da Task: Link

Conclusões:

  • No geral, há uma taxa geral de 59% de aprovação nas disciplinas de cálculo entre os alunos que realmente finalizam a cadeira.

  • O gráfico boxplot feito no colab indica que as médias finais dos alunos nessas disciplinas aumentam gradativamente conforme avançam para a próxima cadeira. Ao contrário do que se imaginaria, a média das médias finais de C3 é maior que a de C2, que por sua vez é maior que a de C1.

  • Isso parece indicar que os alunos, no geral, têm mais dificuldade em C1 do que em C2 em C3. Hipótese minha de que isso se daria ao fato de que é o primeiro contato que os alunos têm com uma disciplina de cálculo.

Media dos estudantes ao longo do curso na cadeira de Teoria da Computação

Eu, como integrante da célula, desejo saber o historico de desempenho dos alunos na cadeira de Teoria da Computação ao longo do curso

  • Filtrar os dados para a cadeira de TC
  • Observar a distribuição da média dos alunos
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado: https://colab.research.google.com/drive/1h5bi0lRA-qm02-koyJzuSdLOSMSw_t5c?usp=sharing

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

remover dados sensiveis dos csvs do SISU

Eu, como integrante da célula, desejo manter a identidade dos dados anonima.

  • Remover a coluna nome do csv
  • remover a coluna cpf
  • remover a coluna número de inscrição
  • Verificar e remover demais colunas que tornem possivel identificar uma pessoa (nomes, documentos, numeros de registro)

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Testar estratégias de clusterização para gerar grupos de perfis dos estudantes [PESQUISA]

Eu, como integrante da célula, desejo testar diferentes modelos de clusterização e observar se é viavel classificar os estudantes em perfis.

  • Usar filtro das optativas gerais para o estudo
  • Estudar sobre algoritmos de clusterização (Kmeans, Mapa auto organizáveis, etc.)
  • Testar resultados das aplicações dos algoritmos
  • Escrever relatorio sobre resultados das aplicações.

Quantidade de aprovações e reprovações na cadeira de TC

Eu, como integrante da célula, desejo saber o historico de aprovações e reprovações dos alunos na cadeira de Teoria da Computação ao longo do curso

  • Filtrar os dados para a cadeira de TC
  • Calcular a quantidade de aprovados e reprovados
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

Link do colab com a analise dos dados da cadeira de TC:
Aprovação Teoria da computação
Analise:
As informaçoes indicam que, em media, 8 a cada 10 estudantes que realmente pagam a cadeira são aprovados, mostrando que tem um alto indice de aprovação em relação a outras cadeiras do curso

Comparação de busca de inscritos do sexo feminino para os cursos de CC e Engenharia Eletrica na UFCG, CC na UEPB e Engenharia da computação no IFPB

Eu, como integrante da célula, desejo saber se existe uma maior busca de um curso especifico pelos inscritos do sexo feminino

  • Filtrar os dados para o curso objetivo
  • Observar a quantidade de inscritos aprovados e reprovados em cada curso
  • Comparar a quantidade de inscritos do sexo feminino em cada curso
  • Gerar visualizações para os restudados e descrever os achados

optativas especificas mais buscadas

Eu, como integrante da célula, desejo saber quais cadeiras optativas especificas tem maior procura no curso

  • Filtrar os dados para as cadeiras optativas especificas
  • Calcular a quantidade de matriculados em cada cadeira
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado Link

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

Relatório de Analise

Link para notion

Desempenho dos alunos nas cadeiras de programação

Eu, como integrante da célula, desejo saber como é o desempenho dos alunos nas cadeiras de programação do curso

  • Filtrar os dados para as cadeiras de programação
  • Calcular a quantidade de aprovados e reprovados
  • Ver distribuição das médias
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado: https://colab.research.google.com/drive/1SvagWgQGKuf5ZlBrDoPcD8T_LUmnq7IR?usp=sharing

Fonte de dados para historico do curso

https://github.com/elasComputacao/raio-x-dados/blob/main/data/dados-brutos/historico_alunos_raiox.csv?raw=true

Analisar gastos por região

Eu, como integrante da célula, irei analisar os dados de acordo com os localizadores e região.
tasks:

  • criar colab
  • filtrar os dados por localizador e/ou região
  • realizar análise exploratória dos dados filtrados
  • realizar visualização dos resultados

critério de aceitação:

Link para acesso ao colab com os resultados e código elaborado [link do notebook]

Visão geral dos dados sobre os gastos com a energisa

eu, como integrante da célula de dados, desejo saber informações sobre os dados coletados a cerca dos gastos da UFCG com a energisa.

  • Criar notebook
  • Filtrar dados pelo CNPJ da energisa paraiba e energisa borborema
  • Ver a quantidade de entradas referentes a esses dois CNPJs (tamanho do dataframe)
  • Ver a quantidade de registros em cada ano do intervalo de dados
  • Ver a quantidade de registros geral e por ano referente a energisa paraiba e energisa borborema

Link para o acesso ao notebook Link

Identificar padrões nos dados sobre a energisa [EDA]

Eu, como integrante da célula, desejo saber como se comportam os dados referentes aos gastos da UFCG com a energisa.

  • Filtrar dados pelo CNPJs da energisa paraiba e energisa borborema
  • Gasto por mês e quais meses apresentam maiores gastos
  • Quais são os meses que apresentam maior gasto por ano (sempre o mesmo?)
  • Porcentagem de gastos ano/mês com a energisa borborema e energisa paraiba
  • Graficos para visualização dos dados (boxplots, displots, graficos de barra, linha etc. (pensar boas visualizações)
  • Observar valores em empenhado e pago para o ano de 2023
  • Observar se existem marcadores além de empenhado e pago para os registros
  • Observar se existem valores sem estar como pago em anos anteriores

Como está a busca dos inscritos homens e mulheres para os diferentes campi da UFCG

Eu, como integrante da célula, desejo saber se existe uma busca maior de determinado sexo para um campus especifico

  • Filtrar dados pelos campi da UFCG
  • Observar quantidade de inscritos (aprovados e reprovados) do sexo masculino e feminino para cada campi
  • Buscar qual a area de maior atuaçaõ do campi (CCBS é saúde por exemplo)
  • Gerar visualizações e descrever os resultados

Analisar gastos por verbas de projeto de lei

Eu, como integrante da célula, irei analisar os dados de gastos da UFCG fazendo um recorte por verbas oriundas de projeto de lei

Sub-tasks:

  • criar o colab para análise
  • filtrar os dados apenas por verbas oriundas de projeto de lei
  • realizar a análise exploratória dos dados filtrados buscando resultados interessantes
    Critério de aceitação:
  • colab com código e descrição dos resultados encontrados

Como esta a distribuição dos aprovados e reprovados de acordo com o estado de origem deles para CC na UFCG

Eu, como integrante da célula, desejo saber como se distribui os incritos no curso, de acordo com o estado de origem, existem mais reprovados na Paraíba ou de fora do estado?

  • Filtrar os dados para o curso de ciência da computação na UFCG
  • Calcular quantidade de inscritos por cada estado
  • Calcular a quantidade de reprovados e aprovados de cada estado encontrado
  • Gerar visualizações para os resultados
  • Descrever os achados na análise

Criterio de aceitação

Link para acesso ao jupyter colab com os resultados e código elaborado

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.