Repositório de minha primeira iniciação científica intitulada "Data Augmentation via Aprendizado Semissupervisionado Baseado em Grafos" Data Augmentation via Aprendizado Semissupervisionado Baseado em Grafos", realizada no período de junho de 2017 a julho de 2018, como bolsista PIBIC.
Willian Dihanster G. Oliveira, Otávio A. B. Penatti, Lilian Berton - ICT/UNIFESP
No Aprendizado Supervisionado, a acurácia dos algoritmos e o número de exemplos rotulados usados no treinamento estão relacionados. Quanto maior o número de exemplos, maior a capacidade de predição do algoritmo. No entanto, em aplicações da vida real, obter muitos exemplos rotulados é uma tarefa custosa. Para contornar essa situação e tentar melhorar a acurácia dos métodos pode-se usar técnicas de data augmentation (DA). No presente projeto, foi feito o estudo de duas técnicas de DA aplicadas em classificação de imagens. A primeira delas expande o conjunto de dados rotulados utilizando transformações de imagens e a segunda usa algoritmos semissupervisionados baseados em grafos. Após a geração das bases aumentadas com os dois métodos, experimentos de classificação foram realizados no software WEKA para a análise da eficiência e comparação das abordagens. Não houve diferença significativa entre as abordagens empregadas, o que nos levou a fazer um estudo sobre os grafos gerados e como isso afetou a acurácia final. Conclui-se que ambas as técnicas se mostraram eficientes para a aplicação escolhida e técnicas de DA podem ser aplicadas em casos com poucos exemplos rotulados para melhorar o modelo gerado pelos algoritmos supervisionados.