Comments (7)
Olá! Bom, aqui no github tem só o código da nlpnet, independente de modelo treinado. As tags usadas dependem dos dados usados.
Se você estiver usando os modelos disponíveis para português e inglês na documentação oficial, posso ajudar. Qual tarefa especificamente (POS, SRL, parsing)?
from nlpnet.
Olá Erick,
para começar, obrigado pela gentileza de responder as minhas dúvidas. Estou começando e minhas dúvidas devem soar básicas.
As tags POS que o NLPNET suporta são as mesmas que estão neste site: http://lxcenter.di.fc.ul.pt/tools/pt/LXTaggerPT.html , senão, onde posso encontrar?
Novamente, muito obrigado.
from nlpnet.
Ok Jeff. A nlpnet em si suporta qualquer conjunto de tags, que ela aprende a partir do corpus em que for treinada. O conjunto de tags do LXTagger, até onde eu saiba, não existe em nenhum corpus disponível para treinar novos modelos, ou seja, é próprio dos desenvolvedores.
O conjunto usado com a nlpnet em português normalmente é o da terceira versão do Mac-Morpho, que está no link que passei acima. Infelizmente, não sei de nenhum lugar onde haja uma tabela simples e atualizada com todas as tags, porque foram feitas pequenas alterações nelas na segunda e na terceira versão do corpus.
Existe o manual do Mac-Morpho original, que tem uma tabela com as tags no final. As diferenças dessas tags para as atuais é que 1) algumas não existem mais e 2) outras foram criadas para contrações como um merge de duas, p.ex. PREP+ART para contração de preposição e artigo.
Se você realmente quiser entender o que mudou de uma versão para a outra, tem esse artigo.
from nlpnet.
Erick,
obrigado, agora já compreendi e localizei as tabelas de De -> Para.
E sim, estou pensando em usar o nlpnet para funções avançadas no meu Bot no Facebook Messenger. Vou fazer alguns testes com POS e SRL e talvez volte a fazer algumas perguntas.
Parabéns pelo projeto e mais uma vez obrigado!
from nlpnet.
Erick,
obrigado pelas informações. Estamos trabalhando num wrapper do nlpnet para linguagem Go. Estamos tornando ele um webservice.
Porém ao pedir para ele executar uma analise SRL da expressão: a roupa do rei de roma foi roida pelo rato
um dos retornos é o codigo AM-MNR. Nos dois documentos supra citados por você não encontramos nada que possa nos esclarecer o que é AM-MNR.
Achamos ser mister haver um HTML contendo uma tabela de correspondências entre os códigos. Assim ajudará muito os usuários do NLP net e quem tem interesse em usar uma ferramenta open source para fazer processamento de linguagem natural em português e de código aberto. Temos interesse em ajudá-lo nessa tarefa, sendo esse o espírito do código aberto e livre. Porém, para tanto, precisamos da colaboração de pessoas especialistas que saibam o que significa cada sigla.
Então peço-te dois favores:
a) pode nos esclarecer o que é AM-MNR?
b) quem poderíamos (pessoa + email) que poderíamos conversar para obter as informações sobre todas as siglas para gerar esse "dicionário" em HTML ?
Novamente muito obrigado!
from nlpnet.
Olá, e desculpe pela demora em responder.
Bom, as tags de SRL são diferentes das de POS, pois vêm de projetos diferentes. As tags do modelo que você usou são do Propbank-BR, que são as mesmas do Propbank original em inglês. Mais informações sobre o projeto estão no site, e o arquivo Tutorial contém as descrições das tags.
Respondendo:
a) AM-MNR é um argumento de modo (MNR sendo abreviado de manner). Aparentemente, foi um erro do modelo, porque muitas vezes os AM-MNR começam com "pelo".
b) Espero que os arquivos do projeto tenham informação suficiente. Algumas dúvidas pontuais eu mesmo posso responder.
De modo geral, você faz bem em apontar a escassez de informações sobre o significado das tags. Estamos acostumados com a maioria dos usuários de sistemas de NLP serem também pesquisadores de NLP e portanto familiarizados com nomenclaturas e tags, de modo que a documentação da nlpnet é dedicada somente ao funcionamento do código em si.
from nlpnet.
Obrigado Erick. Tenho interesse em levar esse excelente de trabalho de vocês para fora da academia para beneficiar muita gente. Mandei uma mensagem a você no seu email da USP.
Abraços!
from nlpnet.
Related Issues (20)
- nlpnet giving error when loading own embedding in english language HOT 8
- Error when using pip to install
- Dependency parser for portuguese HOT 2
- Need clarity on Dependency Relations output by Dependency Parser. HOT 1
- where to get the model for posTag for english ? HOT 4
- Invalid data directory HOT 2
- Error POS Training HOT 10
- problem on initial import HOT 5
- h5py Depency isn't listed in setup.py HOT 1
- [IOError: Failed to interpret file 'models/srl-class-predicates.npz' as a pickle] Error while running nlpnet-test.py HOT 4
- KeyError while using nlpnet-test.py with --id HOT 1
- Python 3.7.3 incompability HOT 2
- nlpnet POSTagger returns error message when allow_pickle=False HOT 5
- "can't multiply sequence" when SRLTagger HOT 4
- Error when installing nlpnet with pip3 on Mac Catalina HOT 5
- nlpnet install error HOT 5
- nlpnet install error with pip on linux HOT 3
- nlpnet import error HOT 2
- Python==3.10 and Numpy==1.23 HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from nlpnet.