You are viewing a plain text version of this content. The canonical link for it is here.
Posted to users@opennlp.apache.org by Ricardo <r....@gmail.com> on 2017/04/16 21:21:32 UTC

Model conversion

Hi,

Do I need to convert a CONLL format model file like what I found at
Linguateca?
http://www.linguateca.pt/Floresta/levantamento.html

Thanks

Ricardo

Re: Model conversion

Posted by William Colen <wi...@gmail.com>.
Maybe you should try first Cogroo. It is based on OpenNLP and was also
trained with Bosque:
https://github.com/cogroo/cogroo4/wiki/API-CoGrOO-4

If you like to go directly with OpenNLP:
Documents: https://opennlp.apache.org/documentation.html
Ready to use models: http://opennlp.sourceforge.net/models-1.5/



2017-04-18 17:26 GMT-03:00 Ricardo <r....@gmail.com>:

> Hi William,
>
> The corpus that I want to use is called "Bosque". (link below)
>
> What I need is to parse law text written in Portuguese. I have to find out
> if this model is good enough for my task or if I need to build my own
> model.
>
> Based on the following links, do i need to convert some file or there is a
> ready to use model?
>
> Thanks for your help !
>
> Ricardo Silva
>
> http://www.linguateca.pt/Floresta/levantamento.html
>
>
>
>
>
>
>
>
>
>
> *CGD*, formato dependencial: BosqueCP.cgd
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4_cgd.txt>,
> BosqueCF.cgd
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4_cgd.txt> Última
> modificação: 14 de setembro de 2006,
> versão 7.4 Bosque_CP_7.5_cgde_2203216.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.5_cgde_2203216.gz
> >,
> Bosque_CF_7.5_cgde_2203216.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.5_cgde_2203216.gz
> >
> Última
> modificação: 22 de março de 2016, versão 7.5 AD, árvores deitadas, formato
> de estrutura sintagmática: BosqueCP.ad
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_8.0.ad.txt>,
> BosqueCF.ad
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_8.0.ad.txt> Última
> modificação do conteúdo: 6 de outubro de 2008, versão 8.0 CoNNL, formato
> obtido de conversão direta do formato CGD para
> CONLL: Bosque_CP_7.4.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4.conll.gz>,
> Bosque_CF_7.4.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4.conll.gz>,
> Bosque_CP_7.5_cgde_22032016.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_
> 7.5_cgde_22032016.conll.gz>,Bosque_CF_7.5_cgde_22032016.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_
> 7.5_cgde_22032016.conll.gz>
> CGDE
> em Universal dependencies
> <http://universaldependencies.org/u/overview/syntax.html> em formato
> CoNLL: bosque_CP.udep.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/bosque_CP.udep.conll.gz>,
> bosque_CF.udep.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/bosque_CF.udep.conll.gz>
> Última
> modificação do conteúdo: 22 de março de 2016, versão 7.5  *
>
>
> Em seg, 17 de abr de 2017 às 02:35, William Colen <william.colen@gmail.com
> >
> escreveu:
>
> > Can you be more specific?
> > We support Arvores Deitadas format. Can you point to the corpus your are
> > trying to use and to OpenNLP tool you are going to train?
> >
> > Thank you
> > William Colen
> >
> > 2017-04-16 18:21 GMT-03:00 Ricardo <r....@gmail.com>:
> >
> > > Hi,
> > >
> > > Do I need to convert a CONLL format model file like what I found at
> > > Linguateca?
> > > http://www.linguateca.pt/Floresta/levantamento.html
> > >
> > > Thanks
> > >
> > > Ricardo
> > >
> >
>

Re: Model conversion

Posted by Ricardo <r....@gmail.com>.
Hi William,

The corpus that I want to use is called "Bosque". (link below)

What I need is to parse law text written in Portuguese. I have to find out
if this model is good enough for my task or if I need to build my own model.

Based on the following links, do i need to convert some file or there is a
ready to use model?

Thanks for your help !

Ricardo Silva

http://www.linguateca.pt/Floresta/levantamento.html










*CGD*, formato dependencial: BosqueCP.cgd
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4_cgd.txt>,
BosqueCF.cgd
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4_cgd.txt> Última
modificação: 14 de setembro de 2006,
versão 7.4 Bosque_CP_7.5_cgde_2203216.gz
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.5_cgde_2203216.gz>,
Bosque_CF_7.5_cgde_2203216.gz
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.5_cgde_2203216.gz>
Última
modificação: 22 de março de 2016, versão 7.5 AD, árvores deitadas, formato
de estrutura sintagmática: BosqueCP.ad
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_8.0.ad.txt>, BosqueCF.ad
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_8.0.ad.txt> Última
modificação do conteúdo: 6 de outubro de 2008, versão 8.0 CoNNL, formato
obtido de conversão direta do formato CGD para
CONLL: Bosque_CP_7.4.conll.gz
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4.conll.gz>,
Bosque_CF_7.4.conll.gz
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4.conll.gz>,
Bosque_CP_7.5_cgde_22032016.conll.gz
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.5_cgde_22032016.conll.gz>,Bosque_CF_7.5_cgde_22032016.conll.gz
<http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.5_cgde_22032016.conll.gz>
CGDE
em Universal dependencies
<http://universaldependencies.org/u/overview/syntax.html> em formato
CoNLL: bosque_CP.udep.conll.gz
<http://www.linguateca.pt/Floresta/ficheiros/bosque_CP.udep.conll.gz>,
bosque_CF.udep.conll.gz
<http://www.linguateca.pt/Floresta/ficheiros/bosque_CF.udep.conll.gz> Última
modificação do conteúdo: 22 de março de 2016, versão 7.5  *


Em seg, 17 de abr de 2017 às 02:35, William Colen <wi...@gmail.com>
escreveu:

> Can you be more specific?
> We support Arvores Deitadas format. Can you point to the corpus your are
> trying to use and to OpenNLP tool you are going to train?
>
> Thank you
> William Colen
>
> 2017-04-16 18:21 GMT-03:00 Ricardo <r....@gmail.com>:
>
> > Hi,
> >
> > Do I need to convert a CONLL format model file like what I found at
> > Linguateca?
> > http://www.linguateca.pt/Floresta/levantamento.html
> >
> > Thanks
> >
> > Ricardo
> >
>

Re: Model conversion

Posted by William Colen <wi...@gmail.com>.
Can you be more specific?
We support Arvores Deitadas format. Can you point to the corpus your are
trying to use and to OpenNLP tool you are going to train?

Thank you
William Colen

2017-04-16 18:21 GMT-03:00 Ricardo <r....@gmail.com>:

> Hi,
>
> Do I need to convert a CONLL format model file like what I found at
> Linguateca?
> http://www.linguateca.pt/Floresta/levantamento.html
>
> Thanks
>
> Ricardo
>