Détection de Deepfake : EfficientNet + Vision Transformer

Ce projet utilise une combinaison de modèles EfficientNet et Vision Transformer pour détecter les deepfakes dans les images.

Table des matières

Introduction
Installation
Dataset
Modèles Utilisés
Présentation
Résultats

Introduction

La détection des deepfakes est un enjeu majeur de la sécurité numérique. Ce projet combine deux architectures de réseaux de neurones, EfficientNet et Vision Transformer, pour améliorer la précision et la robustesse de la détection de deepfakes.

Installation

Pour utiliser ce projet, vous devez avoir Python 3.8 et les bibliothèques nécessaires installées. Voici comment configurer votre environnement :

git clone https://github.com/taeyeonmik/ViT_deepfake
cd ViT_deepfake
pip install -r requirements.txt

Installation de Model State Dict

Dataset

DFFD: Diverse Fake Face Dataset

ffhq.zip, stylegan_ffhq.zip, stylegan_celeba.zip. Consultez On the Detection of Digital Face Manipulation pour l'article, et DFFD: Diverse Fake Face Dataset pour les datasets.

Modèles Utilisés

EfficientNet

EfficientNet est une famille de modèles de convolution neuronale qui optimisent la précision et l'efficacité des calculs. Pour plus d'informations, consultez EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks.

Vision Transformer (ViT)

Vision Transformer (ViT) utilise des mécanismes d'attention pour traiter des images avec une précision impressionnante. Pour plus d'informations, consultez An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.

Présentation

Vous pouvez consulter presentation.pdf dans ce repo, si vous voulez savoir des détailles de ce projet.

Résultats

Tous les résultats sont disponible en forme de graphiques dans train-results et inference.

Validation (À 30ème epoch)

	Accuracy	Precision	Recall	F1
EffNetB0	0.7499	0.7483	0.7528	0.7505
EffNetB0 + ViT	0.8854	0.9355	0.8278	0.8784
EffNetB1 + ViT	0.9040	0.9113	0.8949	0.9030

Inference (AUC)

	AUC
EffNetB0	0.880
EffNetB0 + ViT	0.981
EffNetB1 + ViT	0.984

wxm2018 / vit_deepfake Goto Github PK

vit_deepfake's Introduction

Détection de Deepfake : EfficientNet + Vision Transformer

Table des matières

Introduction

Installation

Dataset

DFFD: Diverse Fake Face Dataset

Modèles Utilisés

EfficientNet

Vision Transformer (ViT)

Présentation

Résultats

Validation (À 30ème epoch)

Inference (AUC)

vit_deepfake's People

Contributors

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent