Git Product home page Git Product logo

challenge_bi_alura_2022_semana_1's Introduction

Challenge BI Alura 2022 - Semana 1

Dashboard sobre filmes

Photo by: @mike_simon

Elaborado por Francico Foz


Sobre o challenge

O challenge é uma iniciativa da Alura para seus alunos desenvolverem projetos baseado em desafios reais.

Contexto de todo o mês

Três empresas nos contrataram para entender suas bases de dados e exibir informações relevantes com o objetivo de auxiliar suas tomada de decisões.

Conceitos e técnicas de BI serão utilizados para desenvolver um dashboard para uma das empresas.

A primeira empresa, Alura Films, necessita analisar dados sobre o IMDB (Internet Movie Database) dos filmes e suas informações.

A segunda empresa, Alura Food, precisa de um dashboard para analisar o mercado de restaurantes na Índia.

A terceira empresa, Alura Skimo, precisa analisar as métricas de suas vendas.

Descrição semana 1

A Alura Films contratou você para fazer uma pesquisa de mercado, com a finalidade de identificar a seleção ideal de elenco e produção. Para isso, ela disponibilizou uma base de dados do IMDB com 1000 filmes. Use suas habilidades e conhecimentos para explorar, tratar e transformar os dados em informações relevantes que auxiliem na tomada de decisão da empresa.

Projeto

Para este projeto utilizei a ferramenta Google Data Studio e o Google SpreadSheets

Bases de dados

Os dados fornecidos foram dois arquivos .csv, com as informações da tabela de filmes e outra de posters, com a descrição conforme o pdf

Você pode encontrar os dados iniciais aqui

Limpeza de dados e modelagem de dados

Para a construção do dashboard, realizei o tratamento dos dados para que eles ficassem corretos.

Etapas:

  1. Tradução da coluna "Genre_PT-BR":

Inseri uma nova coluna no conjunto de dados chamada "Overview_PT-BR" com a tradução das colunas "Overview" e "Genre". Utilizei a função "=GOOGLETRANSLATE()" do google sheets.

  1. Formatação da coluna "Gross":

Formatei os valores que estavam com formato norte americano de "," no lugar do ".", usando a função SUBSTITUIR() e depois acrescentei mais ",00" e formatei a coluna para moeda.

  1. Padronização da coluna "Certificate":

Após algumas pesquisas, encontrei os valores equivalentes das classificações indicativas dos filmes e subistituí para que todos ficassem no padrão do Brasil mais os não Classificados:

U: Livre , UA: 10, A: 18, PG-13: 14, Passed: Não Classificado, PG: 10, R: 18, G: Livre, not rated: Não Classificado, Approved: Livre, PG-12: 14, U/A: 10, 12A: 14, TV-14: 14, GP: 10, Unrated: Não Classificado, TV-PG: 10, TV-MA: 18,

  1. Criei uma nova tabela com as estrelas Separei eles pela função de dividir texto em coluna, ao colar. Manipulei as colunas para que ficassem em apenas uma e repeti o índice, afim de se ter apenas duas colunas e fazer o relacionamento das tabelas.

Dashboard

Construi o dashboard no Data Studio, que foi formado por:

  • Um painel inicial de menu.
  • Um painel com a visão geral do lucro, com gráficos de filmes, gêneros, notas do IMDB, classificação indiativa e ano. Desta forma pode-se visualizar os gêneros que tiveram maior quantidade de lucro, qual a relação da nota do IMDB com o lucro gerado, a classificação indicativa que abrange maior quantidade de lucro e a evolução do lucro dos filmes por ano.
  • Um painel com a visão de elenco e produção, com as informações de diretores, atores e atrizes e gênero com suas respectivas posições no filme para com a quantidade de lucro gerado. Para que desta forma, possa entender quais os melhores elencos e produção gerariam maior quantidade de lucro.

Foi escolhido não separar os gêneros de cada filme para que de fato possa se ter uma informação mais precisa a respeito de cada filme. Por exemplo, há uma quantidade muito grande do gênero drama, porém há diversas outras posições como Drama + Ação + Crime ou Drama + Comédia.

Resultado:

Você pode acessar ele por aqui

challenge_bi_alura_2022_semana_1's People

Contributors

franciscofoz avatar

Watchers

 avatar

challenge_bi_alura_2022_semana_1's Issues

Badge Alura Challenge

Olá, cientista!

Primeiramente, gostaria de te parabenizar por aceitar o desafio e mergulhar de cabeça nesse primeiro Challenge de BI da Alura.

Como recordação da sua participação e reconhecimento por compartilhar seu aprendizado com a comunidade, deixamos essa badge 🏅

Abraços e te vejo nos próximos Challenge.
Badge_Alura_Challenge_BI_Sharer

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.