Git Product home page Git Product logo

Comments (7)

erickrf avatar erickrf commented on May 29, 2024

Olá! Bom, aqui no github tem só o código da nlpnet, independente de modelo treinado. As tags usadas dependem dos dados usados.

Se você estiver usando os modelos disponíveis para português e inglês na documentação oficial, posso ajudar. Qual tarefa especificamente (POS, SRL, parsing)?

from nlpnet.

jeffprestes avatar jeffprestes commented on May 29, 2024

Olá Erick,

para começar, obrigado pela gentileza de responder as minhas dúvidas. Estou começando e minhas dúvidas devem soar básicas.
As tags POS que o NLPNET suporta são as mesmas que estão neste site: http://lxcenter.di.fc.ul.pt/tools/pt/LXTaggerPT.html , senão, onde posso encontrar?

Novamente, muito obrigado.

from nlpnet.

erickrf avatar erickrf commented on May 29, 2024

Ok Jeff. A nlpnet em si suporta qualquer conjunto de tags, que ela aprende a partir do corpus em que for treinada. O conjunto de tags do LXTagger, até onde eu saiba, não existe em nenhum corpus disponível para treinar novos modelos, ou seja, é próprio dos desenvolvedores.

O conjunto usado com a nlpnet em português normalmente é o da terceira versão do Mac-Morpho, que está no link que passei acima. Infelizmente, não sei de nenhum lugar onde haja uma tabela simples e atualizada com todas as tags, porque foram feitas pequenas alterações nelas na segunda e na terceira versão do corpus.

Existe o manual do Mac-Morpho original, que tem uma tabela com as tags no final. As diferenças dessas tags para as atuais é que 1) algumas não existem mais e 2) outras foram criadas para contrações como um merge de duas, p.ex. PREP+ART para contração de preposição e artigo.

Se você realmente quiser entender o que mudou de uma versão para a outra, tem esse artigo.

from nlpnet.

jeffprestes avatar jeffprestes commented on May 29, 2024

Erick,

obrigado, agora já compreendi e localizei as tabelas de De -> Para.
E sim, estou pensando em usar o nlpnet para funções avançadas no meu Bot no Facebook Messenger. Vou fazer alguns testes com POS e SRL e talvez volte a fazer algumas perguntas.

Parabéns pelo projeto e mais uma vez obrigado!

from nlpnet.

jeffprestes avatar jeffprestes commented on May 29, 2024

Erick,

obrigado pelas informações. Estamos trabalhando num wrapper do nlpnet para linguagem Go. Estamos tornando ele um webservice.
Porém ao pedir para ele executar uma analise SRL da expressão: a roupa do rei de roma foi roida pelo rato um dos retornos é o codigo AM-MNR. Nos dois documentos supra citados por você não encontramos nada que possa nos esclarecer o que é AM-MNR.
Achamos ser mister haver um HTML contendo uma tabela de correspondências entre os códigos. Assim ajudará muito os usuários do NLP net e quem tem interesse em usar uma ferramenta open source para fazer processamento de linguagem natural em português e de código aberto. Temos interesse em ajudá-lo nessa tarefa, sendo esse o espírito do código aberto e livre. Porém, para tanto, precisamos da colaboração de pessoas especialistas que saibam o que significa cada sigla.
Então peço-te dois favores:
a) pode nos esclarecer o que é AM-MNR?
b) quem poderíamos (pessoa + email) que poderíamos conversar para obter as informações sobre todas as siglas para gerar esse "dicionário" em HTML ?

Novamente muito obrigado!

from nlpnet.

erickrf avatar erickrf commented on May 29, 2024

Olá, e desculpe pela demora em responder.

Bom, as tags de SRL são diferentes das de POS, pois vêm de projetos diferentes. As tags do modelo que você usou são do Propbank-BR, que são as mesmas do Propbank original em inglês. Mais informações sobre o projeto estão no site, e o arquivo Tutorial contém as descrições das tags.

Respondendo:
a) AM-MNR é um argumento de modo (MNR sendo abreviado de manner). Aparentemente, foi um erro do modelo, porque muitas vezes os AM-MNR começam com "pelo".

b) Espero que os arquivos do projeto tenham informação suficiente. Algumas dúvidas pontuais eu mesmo posso responder.

De modo geral, você faz bem em apontar a escassez de informações sobre o significado das tags. Estamos acostumados com a maioria dos usuários de sistemas de NLP serem também pesquisadores de NLP e portanto familiarizados com nomenclaturas e tags, de modo que a documentação da nlpnet é dedicada somente ao funcionamento do código em si.

from nlpnet.

jeffprestes avatar jeffprestes commented on May 29, 2024

Obrigado Erick. Tenho interesse em levar esse excelente de trabalho de vocês para fora da academia para beneficiar muita gente. Mandei uma mensagem a você no seu email da USP.
Abraços!

from nlpnet.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.