Git Product home page Git Product logo

anomaly-detection-bi's Introduction

Detecção de Anomalia

Scripts desenvolvidos para as palestras sobre Anomalias

Índice

Nesta seção é apresentado todas as etapas para desenvolvimento de um Detector de Anomalia pontual. A primeira etapa consiste em visualizar a quantidade de classes existentes no problema, executar o preprocessamento necessário e em seguida o treinamento do modelo.

  • Análise, preprocessamento e modelo: Carregamento do dataset, analisar o seu comportamento e treinamento do modelo AnomalyDetection.ipynb.

    A base de dados trata-se de um conjunto de amostras de exames de eletrocardiograma. E, nessa base, os dados estão rotulados como normais e anômalos e, apesar dos dados serem de um período de tempo sequencial, a avaliação de anomalia ocorre de uma sequência de tamanho fixo e para uma mesma janela de amostragem. Inicialmente é feita uma análise da base, tanto o tamanho dessa janela de amostragem quanto a quantidade de registros normais e de anomalia. Em seguida é aplicado a normalização desses dados e o treinamento do modelo. Por fim, é executada a avaliação do modelo treinado e os resultados quantitativos.

    • Análise da base de dados
      • Visualização gráfica
      • Exibição da quantidade de registros por classe
    • Preprocessamento dos dados
    • Treinamento do modelo
    • Avaliação do modelo

Abaixo está organizado todas as etapas necessárias para a criação de um Detector de Anomalias em Séries Temporais, desde a análise crítica dos dados brutos, passando pelos processos necessários para organização e pré-processamento dos dados, até o treinamento dos modelos e a otimização de seus parâmetros. Diferentemente da abordagem de detecção de anomalias em registros pontuais ou globais, quando o detector deve levar em consideração a evolução temporal de determinada grandeza, é necessário realizar alguns procedimentos adicionais. Além disso, assim como nos casos de previsão de séries temporais, a etapa mais importante e mais delicada do processo é no momento da organização da base de dados. Definir as taxas de amostragens para criação dos batches é crucial para um treinamento adequado dos modelos.

  • Leitura de sensores: Análise e Processamento Leitura de sensores Analise_Preprocessamento.ipynb.

    A base de dados utilizada para exemplificação desse case é do dataset 3W sendo composto por inúmeros arquivos de leitura de sensores já rotulados com classes de eventos. Para o estudo de aula, o foco foi apenas sobre 1 único arquivo para exemplificar o passo a passo de um problema de detecção de anomalias em séries temporais. Nessa etapa o objetivo foi explicar as etapas de análise dos dados do problema e aplicar as diversas etapas de pré processamento necessários em séries temporais.

    • Análise dos dados
      • Comportamento classe de saída
      • Amostragem mínima/máxima
      • Quantidade de atributos
    • Processamento
      • Retirada de colunas nulas
      • Checagem de amostragem mínima
      • Organizar base em formato padrão
      • Extrair features com a biblioteca tsfresh
      • Armazenar em um arquivo
  • Modelos: Carregamento do dataset processado e testagem de variados modelos Modelos.ipynb.

    Com a base de dados já processada são testados diversos modelos para a detecção dos momentos de anomalia.

    • Modelos
      • Autoencoder simples
      • Autoencoder + SVC
      • Variational Autoencoder

anomaly-detection-bi's People

Contributors

felipeborgesc avatar

Watchers

Manoela Rabello Kohler avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.