Git Product home page Git Product logo

wia-projet's Introduction

wia-projet

Projet d'école sur l'extraction de relations au sein de corpus.

Objectif du programme

L'objectif du programme est de récolter des informations à partir d'un texte sur les relations entre les différents personnages, fictifs ou pas. Par exemple, dans un texte fictif, une phrase tel que "Alice est la soeur de Bob" relie Alice à Bob dans une catégorie famille. On peut ainsi lister tous les personnages disponibles dans le texte puis en ressortir les relations potentielles entre protagoniste de la narration.

Utilisation du programme

Prérequis

Pour faire ce programme, on, utilise conda pour créer un environnement virtuel dédiée à la matière WIA. Puis, on installe ceci: spacy 2.1 (pip install spacy )

neuralcoref (pip install neuralcoref)

python -m spacy download en_core_web_sm (modèle utilisé)

Une version plus récente de spacy existe mais à cause de difficultés de fonctionnement liés à neuralcoref, une version plus ancienne a été testé et fonctionne correctement. Ne pas oublier d'installer des modèles telles que 'en_core_web_[sm-md-lg]'.

Exécution du programme

Le programme se lance en introduisant la chemin du corpus et le chemin du corpus annoté (avec la liste des relations entre deux personnages). On peut aussi activer la recherche de coréférences ou pas. Attention !!! La coréférence peut prendre beaucoup de temps.

Contribution

Auteur: BOAKNIN Jonathan

Mail: [email protected]

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.