You are viewing a plain text version of this content. The canonical link for it is here.
Posted to solr-user@lucene.apache.org by Silvia Suárez <ss...@anpro21.com> on 2013/10/14 10:16:56 UTC

Re: Please any idea? Highlighting exact phrases with solr

Good morning,

Please, help me giving any idea/solution to the problem?

Thanks a lot in advance

Sil,

Silvia Suárez Barón
I+D+I
<http://www.anpro21.com/>
972 989 470  / ssb@anpro21.com /   <http://www.anpro21.com/twitter>
<http://www.anpro21.com/facebook>
  <http://www.linkedin.com/pub/silvia-a-su%C3%A1rez-bar%C3%B3n-phd/10/b30/26a>
  <http://blog.anpro21.com/>

*
*
*Tecnologías y SaaS para el análisis de marcas comerciales.*


Nota:
Usted ha recibido este mensaje al estar en la libreta de direcciones del
remitente, en los archivos de la empresa o mediante el sistema de
“responder” al ser usted la persona que contactó por este medio con el
remitente. En caso de no querer recibir ningún email mas del remitente o de
cualquier miembro de la organización a la que pertenece, por favor,
responda a este email solicitando la baja de su dirección en nuestros
archivos.

Advertencia legal:
Este mensaje y, en su caso, los ficheros anexos son confidenciales,
especialmente en lo que respecta a los datos personales, y se dirigen
exclusivamente al destinatario referenciado. Si usted no lo es y lo ha
recibido por error o tiene conocimiento del mismo por cualquier motivo, le
rogamos que nos lo comunique por este medio y proceda a destruirlo o
borrarlo, y que en todo caso se abstenga de utilizar, reproducir, alterar,
archivar o comunicar a terceros el presente mensaje y ficheros anexos, todo
ello bajo pena de incurrir en responsabilidades legales.


2013/10/11 Silvia Suárez <ss...@anpro21.com>

> Dear Koji,
>
> Thanks a lot for your answer and Sorry about my english
>
> I tried to configure FastVectorHighlighter<http://wiki.apache.org/solr/HighlightingParameters#hl.useFastVectorHighlighter>
>
> However, I have this error:
>
>
> <lst name="error">
> <str name="msg">
> fragCharSize(1) is too small. It must be 18 or higher.
> </str>
> <str name="trace">
> java.lang.IllegalArgumentException: fragCharSize(1) is too small. It must
> be 18 or higher. at
> org.apache.lucene.search.vectorhighlight.BaseFragListBuilder.createFieldFragList(BaseFragListBuilder.java:51)
> at
> org.apache.lucene.search.vectorhighlight.WeightedFragListBuilder.createFieldFragList(WeightedFragListBuilder.java:38)
> at
> org.apache.lucene.search.vectorhighlight.FastVectorHighlighter.getFieldFragList(FastVectorHighlighter.java:195)
> at
> org.apache.lucene.search.vectorhighlight.FastVectorHighlighter.getBestFragments(FastVectorHighlighter.java:184)
> at
> org.apache.solr.highlight.DefaultSolrHighlighter.doHighlightingByFastVectorHighlighter(DefaultSolrHighlighter.java:588)
> at
> org.apache.solr.highlight.DefaultSolrHighlighter.doHighlighting(DefaultSolrHighlighter.java:413)
> at
> org.apache.solr.handler.component.HighlightComponent.process(HighlightComponent.java:139)
> at
> org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:208)
> at
> org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:135)
> at org.apache.solr.core.SolrCore.execute(SolrCore.java:1816) at
> org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:656)
> at
> org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:359)
> at
> org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:155)
> at
> org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1307)
> at
> org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:453)
> at
> org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:137)
> at
> org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:560)
> at
> org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.java:231)
> at
> org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1072)
> at
> org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:382)
> at
> org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.java:193)
> at
> org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1006)
> at
> org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:135)
> at
> org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:255)
> at
> org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:154)
> at
> org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:116)
> at org.eclipse.jetty.server.Server.handle(Server.java:365) at
> org.eclipse.jetty.server.AbstractHttpConnection.handleRequest(AbstractHttpConnection.java:485)
> at
> org.eclipse.jetty.server.BlockingHttpConnection.handleRequest(BlockingHttpConnection.java:53)
> at
> org.eclipse.jetty.server.AbstractHttpConnection.headerComplete(AbstractHttpConnection.java:926)
> at
> org.eclipse.jetty.server.AbstractHttpConnection$RequestHandler.headerComplete(AbstractHttpConnection.java:988)
> at org.eclipse.jetty.http.HttpParser.parseNext(HttpParser.java:635) at
> org.eclipse.jetty.http.HttpParser.parseAvailable(HttpParser.java:235) at
> org.eclipse.jetty.server.BlockingHttpConnection.handle(BlockingHttpConnection.java:72)
> at
> org.eclipse.jetty.server.bio.SocketConnector$ConnectorEndPoint.run(SocketConnector.java:264)
> at
> org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)
> at
> org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:543)
> at java.lang.Thread.run(Thread.java:722)
> </str>
> <int name="code">500</int>
> </lst>
> </response>
>
>
>
> Then, If I modify like this: (setHighlightFragsize(1) -->
> setHighlightFragsize(80)):
>
> SolrQuery solrQuery = new SolrQuery();
>
>     solrQuery.setQuery(queryEnt);
>     solrQuery.set("collectionName", myCollection);
>         solrQuery.addHighlightField("texto")
>                  .addHighlightField("titular")
>                  .setHighlightSnippets(50)
>                  .setHighlightFragsize(80);
>         solrQuery.setHighlight(true);
>         solrQuery.setHighlightRequireFieldMatch(true);
>         solrQuery.set("hl.useFastVectorHighlighter", true);
>         solrQuery.setHighlightSimplePre("<span class=\"item\">");
>         solrQuery.setHighlightSimplePost("</span>");
>         solrQuery.set("hl.usePhraseHighlighter", true);
>
>
> Then, It works (error disappears),  but Highlighting does not work :( :
>
> <lst name="highlighting">
> <lst name="35254502"/>
> <lst name="35237409"/>
> </lst>
> <lst name="termVectors">
> <str name="uniqueKeyFieldName">c_noticia</str>
> <lst name="warnings">
> <arr name="noTermVectors">
> <str>c_region</str>
> <str>c_idioma</str>
> <str>c_pais</str>
> <str>c_tipo</str>
> <str>c_categoria</str>
> <str>fecha_captura</str>
> <str>medio</str>
> <str>c_fuente_docu</str>
> </arr>
> </lst>
> <lst name="35254502">
> <str name="uniqueKey">35254502</str>
> </lst>
> <lst name="35237409">
> <str name="uniqueKey">35237409</str>
> </lst>
> </lst>
> </response>
>
>
>
> My solrconfig.xml is:
>
>   <requestHandler name="/select" class="solr.SearchHandler">
>     <!-- default values for query parameters can be specified, these
>          will be overridden by parameters in the request
>       -->
>     <!-- <lst name="defaults">
>        <str name="echoParams">explicit</str>
>        <int name="rows">10</int>
>        <str name="df">text</str>
>      </lst>-->
>     <lst name="defaults">
>       <str name="echoParams">explicit</str>
>       <int name="rows">10</int>
>        <str name="df">texto</str>
>       <bool name="hl.usePhraseHighlighter">true</bool>
>       <str name="df">texto</str>
>       <bool name="tv">true</bool>
>     </lst>
>      <arr name="last-components">
>       <str>tvComponent</str>
>     </arr>
>
>
> missing something?
> Thanks a lot, in advance, for your help,
>
> Sil.
>
>
>
>
> *
> *
> *Tecnologías y SaaS para el análisis de marcas comerciales.*
>
>
> Nota:
> Usted ha recibido este mensaje al estar en la libreta de direcciones del
> remitente, en los archivos de la empresa o mediante el sistema de
> “responder” al ser usted la persona que contactó por este medio con el
> remitente. En caso de no querer recibir ningún email mas del remitente o de
> cualquier miembro de la organización a la que pertenece, por favor,
> responda a este email solicitando la baja de su dirección en nuestros
> archivos.
>
> Advertencia legal:
> Este mensaje y, en su caso, los ficheros anexos son confidenciales,
> especialmente en lo que respecta a los datos personales, y se dirigen
> exclusivamente al destinatario referenciado. Si usted no lo es y lo ha
> recibido por error o tiene conocimiento del mismo por cualquier motivo, le
> rogamos que nos lo comunique por este medio y proceda a destruirlo o
> borrarlo, y que en todo caso se abstenga de utilizar, reproducir, alterar,
> archivar o comunicar a terceros el presente mensaje y ficheros anexos, todo
> ello bajo pena de incurrir en responsabilidades legales.
>
>
> 2013/10/10 Koji Sekiguchi <ko...@r.email.ne.jp>
>
>> (13/10/10 18:17), Silvia Suárez wrote:
>>
>>> I am using solrj as client for indexing documents on the solr server I am
>>> new to solr, And I am having problem with the highlighting in solr.
>>> Highlighting exact phrases with solr does not work.
>>>
>>> For example if the search keyword is: "dulce hogar" it returns:
>>>
>>> <span class="item"> dulce </span> <span class="item"> hogar </span>
>>>
>>>   And it should be:
>>>
>>> <span class="item"> dulce hogar </span>
>>>
>>> I don't understand which is the problem. Can someone  helpme please!?
>>>
>>
>> Unfortunately, it is the feature.
>> FVH can support phrase-unit highlighting.
>>
>> http://wiki.apache.org/solr/**HighlightingParameters#hl.**
>> useFastVectorHighlighter<http://wiki.apache.org/solr/HighlightingParameters#hl.useFastVectorHighlighter>
>>
>> koji
>> --
>> http://soleami.com/blog/**automatically-acquiring-**
>> synonym-knowledge-from-**wikipedia.html<http://soleami.com/blog/automatically-acquiring-synonym-knowledge-from-wikipedia.html>
>>
>
>

Re: Please any idea? Highlighting exact phrases with solr

Posted by Silvia Suárez <ss...@anpro21.com>.
Dear All and Bryan,

Thanks a lot for your help,

with reindex data, I got it working!  :)

Thanks again for your time

Sil,


*
*
*Tecnologías y SaaS para el análisis de marcas comerciales.*


Nota:
Usted ha recibido este mensaje al estar en la libreta de direcciones del
remitente, en los archivos de la empresa o mediante el sistema de
“responder” al ser usted la persona que contactó por este medio con el
remitente. En caso de no querer recibir ningún email mas del remitente o de
cualquier miembro de la organización a la que pertenece, por favor,
responda a este email solicitando la baja de su dirección en nuestros
archivos.

Advertencia legal:
Este mensaje y, en su caso, los ficheros anexos son confidenciales,
especialmente en lo que respecta a los datos personales, y se dirigen
exclusivamente al destinatario referenciado. Si usted no lo es y lo ha
recibido por error o tiene conocimiento del mismo por cualquier motivo, le
rogamos que nos lo comunique por este medio y proceda a destruirlo o
borrarlo, y que en todo caso se abstenga de utilizar, reproducir, alterar,
archivar o comunicar a terceros el presente mensaje y ficheros anexos, todo
ello bajo pena de incurrir en responsabilidades legales.


El 14 de octubre de 2013 23:00, Bryan Loofbourrow <
bloofbourrow@knowledgemosaic.com> escribió:

> Sil,
>
> When you switched over to using the Fast Vector Highlighter, did you
> change your schema so that the fields that you want to highlight provide
> term vector information, and reindex your documents? Term vectors are
> necessary when using the Fast Vector Highlighter. Posting your schema may
> show valueable clues to the problem you're seeing. For example, the wiki
> HighlightingParameters page says you should have 'termVectors=on' etc, but
> if you actually put termVectors="on" in your field definition, I don't
> think that would work; it's actually termVectors="true".
>
> -- Bryan
>
> > -----Original Message-----
> > From: Silvia Suárez [mailto:ssb@anpro21.com]
> > Sent: Monday, October 14, 2013 1:17 AM
> > To: solr-user@lucene.apache.org; Koji Sekiguchi
> > Subject: Re: Please any idea? Highlighting exact phrases with solr
> >
> > Good morning,
> >
> > Please, help me giving any idea/solution to the problem?
> >
> > Thanks a lot in advance
> >
> > Sil,
> >
> > Silvia Suárez Barón
> > I+D+I
> > <http://www.anpro21.com/>
> > 972 989 470  / ssb@anpro21.com /   <http://www.anpro21.com/twitter>
> > <http://www.anpro21.com/facebook>
> >   <http://www.linkedin.com/pub/silvia-a-su%C3%A1rez-bar%C3%B3n-
> > phd/10/b30/26a>
> >   <http://blog.anpro21.com/>
> >
> > *
> > *
> > *Tecnologías y SaaS para el análisis de marcas comerciales.*
> >
> >
> > Nota:
> > Usted ha recibido este mensaje al estar en la libreta de direcciones del
> > remitente, en los archivos de la empresa o mediante el sistema de
> > “responder” al ser usted la persona que contactó por este medio con el
> > remitente. En caso de no querer recibir ningún email mas del remitente o
> > de
> > cualquier miembro de la organización a la que pertenece, por favor,
> > responda a este email solicitando la baja de su dirección en nuestros
> > archivos.
> >
> > Advertencia legal:
> > Este mensaje y, en su caso, los ficheros anexos son confidenciales,
> > especialmente en lo que respecta a los datos personales, y se dirigen
> > exclusivamente al destinatario referenciado. Si usted no lo es y lo ha
> > recibido por error o tiene conocimiento del mismo por cualquier motivo,
> le
> > rogamos que nos lo comunique por este medio y proceda a destruirlo o
> > borrarlo, y que en todo caso se abstenga de utilizar, reproducir,
> alterar,
> > archivar o comunicar a terceros el presente mensaje y ficheros anexos,
> > todo
> > ello bajo pena de incurrir en responsabilidades legales.
> >
> >
> > 2013/10/11 Silvia Suárez <ss...@anpro21.com>
> >
> > > Dear Koji,
> > >
> > > Thanks a lot for your answer and Sorry about my english
> > >
> > > I tried to configure
> >
> FastVectorHighlighter<http://wiki.apache.org/solr/HighlightingParameters#h
> > l.useFastVectorHighlighter>
> > >
> > > However, I have this error:
> > >
> > >
> > > <lst name="error">
> > > <str name="msg">
> > > fragCharSize(1) is too small. It must be 18 or higher.
> > > </str>
> > > <str name="trace">
> > > java.lang.IllegalArgumentException: fragCharSize(1) is too small. It
> > must
> > > be 18 or higher. at
> > >
> >
> org.apache.lucene.search.vectorhighlight.BaseFragListBuilder.createFieldFr
> > agList(BaseFragListBuilder.java:51)
> > > at
> > >
> >
> org.apache.lucene.search.vectorhighlight.WeightedFragListBuilder.createFie
> > ldFragList(WeightedFragListBuilder.java:38)
> > > at
> > >
> >
> org.apache.lucene.search.vectorhighlight.FastVectorHighlighter.getFieldFra
> > gList(FastVectorHighlighter.java:195)
> > > at
> > >
> >
> org.apache.lucene.search.vectorhighlight.FastVectorHighlighter.getBestFrag
> > ments(FastVectorHighlighter.java:184)
> > > at
> > >
> >
> org.apache.solr.highlight.DefaultSolrHighlighter.doHighlightingByFastVecto
> > rHighlighter(DefaultSolrHighlighter.java:588)
> > > at
> > >
> >
> org.apache.solr.highlight.DefaultSolrHighlighter.doHighlighting(DefaultSol
> > rHighlighter.java:413)
> > > at
> > >
> >
> org.apache.solr.handler.component.HighlightComponent.process(HighlightComp
> > onent.java:139)
> > > at
> > >
> >
> org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHa
> > ndler.java:208)
> > > at
> > >
> >
> org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBas
> > e.java:135)
> > > at org.apache.solr.core.SolrCore.execute(SolrCore.java:1816) at
> > >
> >
> org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java
> > :656)
> > > at
> > >
> >
> org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.jav
> > a:359)
> > > at
> > >
> >
> org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.jav
> > a:155)
> > > at
> > >
> >
> org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandl
> > er.java:1307)
> > > at
> > >
> >
> org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:453)
> > > at
> > >
> >
> org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:1
> > 37)
> > > at
> > >
> >
> org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:560
> > )
> > > at
> > >
> >
> org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.ja
> > va:231)
> > > at
> > >
> >
> org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.ja
> > va:1072)
> > > at
> > >
> >
> org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:382)
> > > at
> > >
> >
> org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.jav
> > a:193)
> > > at
> > >
> >
> org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.jav
> > a:1006)
> > > at
> > >
> >
> org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:1
> > 35)
> > > at
> > >
> >
> org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHa
> > ndlerCollection.java:255)
> > > at
> > >
> >
> org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollectio
> > n.java:154)
> > > at
> > >
> >
> org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java
> > :116)
> > > at org.eclipse.jetty.server.Server.handle(Server.java:365) at
> > >
> >
> org.eclipse.jetty.server.AbstractHttpConnection.handleRequest(AbstractHttp
> > Connection.java:485)
> > > at
> > >
> >
> org.eclipse.jetty.server.BlockingHttpConnection.handleRequest(BlockingHttp
> > Connection.java:53)
> > > at
> > >
> >
> org.eclipse.jetty.server.AbstractHttpConnection.headerComplete(AbstractHtt
> > pConnection.java:926)
> > > at
> > >
> >
> org.eclipse.jetty.server.AbstractHttpConnection$RequestHandler.headerCompl
> > ete(AbstractHttpConnection.java:988)
> > > at org.eclipse.jetty.http.HttpParser.parseNext(HttpParser.java:635) at
> > > org.eclipse.jetty.http.HttpParser.parseAvailable(HttpParser.java:235)
> at
> > >
> >
> org.eclipse.jetty.server.BlockingHttpConnection.handle(BlockingHttpConnect
> > ion.java:72)
> > > at
> > >
> >
> org.eclipse.jetty.server.bio.SocketConnector$ConnectorEndPoint.run(SocketC
> > onnector.java:264)
> > > at
> > >
> >
> org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.jav
> > a:608)
> > > at
> > >
> >
> org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java
> > :543)
> > > at java.lang.Thread.run(Thread.java:722)
> > > </str>
> > > <int name="code">500</int>
> > > </lst>
> > > </response>
> > >
> > >
> > >
> > > Then, If I modify like this: (setHighlightFragsize(1) -->
> > > setHighlightFragsize(80)):
> > >
> > > SolrQuery solrQuery = new SolrQuery();
> > >
> > >     solrQuery.setQuery(queryEnt);
> > >     solrQuery.set("collectionName", myCollection);
> > >         solrQuery.addHighlightField("texto")
> > >                  .addHighlightField("titular")
> > >                  .setHighlightSnippets(50)
> > >                  .setHighlightFragsize(80);
> > >         solrQuery.setHighlight(true);
> > >         solrQuery.setHighlightRequireFieldMatch(true);
> > >         solrQuery.set("hl.useFastVectorHighlighter", true);
> > >         solrQuery.setHighlightSimplePre("<span class=\"item\">");
> > >         solrQuery.setHighlightSimplePost("</span>");
> > >         solrQuery.set("hl.usePhraseHighlighter", true);
> > >
> > >
> > > Then, It works (error disappears),  but Highlighting does not work :(
> :
> > >
> > > <lst name="highlighting">
> > > <lst name="35254502"/>
> > > <lst name="35237409"/>
> > > </lst>
> > > <lst name="termVectors">
> > > <str name="uniqueKeyFieldName">c_noticia</str>
> > > <lst name="warnings">
> > > <arr name="noTermVectors">
> > > <str>c_region</str>
> > > <str>c_idioma</str>
> > > <str>c_pais</str>
> > > <str>c_tipo</str>
> > > <str>c_categoria</str>
> > > <str>fecha_captura</str>
> > > <str>medio</str>
> > > <str>c_fuente_docu</str>
> > > </arr>
> > > </lst>
> > > <lst name="35254502">
> > > <str name="uniqueKey">35254502</str>
> > > </lst>
> > > <lst name="35237409">
> > > <str name="uniqueKey">35237409</str>
> > > </lst>
> > > </lst>
> > > </response>
> > >
> > >
> > >
> > > My solrconfig.xml is:
> > >
> > >   <requestHandler name="/select" class="solr.SearchHandler">
> > >     <!-- default values for query parameters can be specified, these
> > >          will be overridden by parameters in the request
> > >       -->
> > >     <!-- <lst name="defaults">
> > >        <str name="echoParams">explicit</str>
> > >        <int name="rows">10</int>
> > >        <str name="df">text</str>
> > >      </lst>-->
> > >     <lst name="defaults">
> > >       <str name="echoParams">explicit</str>
> > >       <int name="rows">10</int>
> > >        <str name="df">texto</str>
> > >       <bool name="hl.usePhraseHighlighter">true</bool>
> > >       <str name="df">texto</str>
> > >       <bool name="tv">true</bool>
> > >     </lst>
> > >      <arr name="last-components">
> > >       <str>tvComponent</str>
> > >     </arr>
> > >
> > >
> > > missing something?
> > > Thanks a lot, in advance, for your help,
> > >
> > > Sil.
> > >
> > >
> > >
> > >
> > > *
> > > *
> > > *Tecnologías y SaaS para el análisis de marcas comerciales.*
> > >
> > >
> > > Nota:
> > > Usted ha recibido este mensaje al estar en la libreta de direcciones
> del
> > > remitente, en los archivos de la empresa o mediante el sistema de
> > > “responder” al ser usted la persona que contactó por este medio con el
> > > remitente. En caso de no querer recibir ningún email mas del remitente
> o
> > de
> > > cualquier miembro de la organización a la que pertenece, por favor,
> > > responda a este email solicitando la baja de su dirección en nuestros
> > > archivos.
> > >
> > > Advertencia legal:
> > > Este mensaje y, en su caso, los ficheros anexos son confidenciales,
> > > especialmente en lo que respecta a los datos personales, y se dirigen
> > > exclusivamente al destinatario referenciado. Si usted no lo es y lo ha
> > > recibido por error o tiene conocimiento del mismo por cualquier
> motivo,
> > le
> > > rogamos que nos lo comunique por este medio y proceda a destruirlo o
> > > borrarlo, y que en todo caso se abstenga de utilizar, reproducir,
> > alterar,
> > > archivar o comunicar a terceros el presente mensaje y ficheros anexos,
> > todo
> > > ello bajo pena de incurrir en responsabilidades legales.
> > >
> > >
> > > 2013/10/10 Koji Sekiguchi <ko...@r.email.ne.jp>
> > >
> > >> (13/10/10 18:17), Silvia Suárez wrote:
> > >>
> > >>> I am using solrj as client for indexing documents on the solr server
> I
> > am
> > >>> new to solr, And I am having problem with the highlighting in solr.
> > >>> Highlighting exact phrases with solr does not work.
> > >>>
> > >>> For example if the search keyword is: "dulce hogar" it returns:
> > >>>
> > >>> <span class="item"> dulce </span> <span class="item"> hogar </span>
> > >>>
> > >>>   And it should be:
> > >>>
> > >>> <span class="item"> dulce hogar </span>
> > >>>
> > >>> I don't understand which is the problem. Can someone  helpme
> please!?
> > >>>
> > >>
> > >> Unfortunately, it is the feature.
> > >> FVH can support phrase-unit highlighting.
> > >>
> > >> http://wiki.apache.org/solr/**HighlightingParameters#hl.**
> > >>
> >
> useFastVectorHighlighter<http://wiki.apache.org/solr/HighlightingParameter
> > s#hl.useFastVectorHighlighter>
> > >>
> > >> koji
> > >> --
> > >> http://soleami.com/blog/**automatically-acquiring-**
> > >> synonym-knowledge-from-
> >
> **wikipedia.html<http://soleami.com/blog/automatically-acquiring-synonym-
> > knowledge-from-wikipedia.html>
> > >>
> > >
> > >
>

RE: Please any idea? Highlighting exact phrases with solr

Posted by Bryan Loofbourrow <bl...@knowledgemosaic.com>.
Sil,

When you switched over to using the Fast Vector Highlighter, did you
change your schema so that the fields that you want to highlight provide
term vector information, and reindex your documents? Term vectors are
necessary when using the Fast Vector Highlighter. Posting your schema may
show valueable clues to the problem you're seeing. For example, the wiki
HighlightingParameters page says you should have 'termVectors=on' etc, but
if you actually put termVectors="on" in your field definition, I don't
think that would work; it's actually termVectors="true".

-- Bryan

> -----Original Message-----
> From: Silvia Suárez [mailto:ssb@anpro21.com]
> Sent: Monday, October 14, 2013 1:17 AM
> To: solr-user@lucene.apache.org; Koji Sekiguchi
> Subject: Re: Please any idea? Highlighting exact phrases with solr
>
> Good morning,
>
> Please, help me giving any idea/solution to the problem?
>
> Thanks a lot in advance
>
> Sil,
>
> Silvia Suárez Barón
> I+D+I
> <http://www.anpro21.com/>
> 972 989 470  / ssb@anpro21.com /   <http://www.anpro21.com/twitter>
> <http://www.anpro21.com/facebook>
>   <http://www.linkedin.com/pub/silvia-a-su%C3%A1rez-bar%C3%B3n-
> phd/10/b30/26a>
>   <http://blog.anpro21.com/>
>
> *
> *
> *Tecnologías y SaaS para el análisis de marcas comerciales.*
>
>
> Nota:
> Usted ha recibido este mensaje al estar en la libreta de direcciones del
> remitente, en los archivos de la empresa o mediante el sistema de
> “responder” al ser usted la persona que contactó por este medio con el
> remitente. En caso de no querer recibir ningún email mas del remitente o
> de
> cualquier miembro de la organización a la que pertenece, por favor,
> responda a este email solicitando la baja de su dirección en nuestros
> archivos.
>
> Advertencia legal:
> Este mensaje y, en su caso, los ficheros anexos son confidenciales,
> especialmente en lo que respecta a los datos personales, y se dirigen
> exclusivamente al destinatario referenciado. Si usted no lo es y lo ha
> recibido por error o tiene conocimiento del mismo por cualquier motivo,
le
> rogamos que nos lo comunique por este medio y proceda a destruirlo o
> borrarlo, y que en todo caso se abstenga de utilizar, reproducir,
alterar,
> archivar o comunicar a terceros el presente mensaje y ficheros anexos,
> todo
> ello bajo pena de incurrir en responsabilidades legales.
>
>
> 2013/10/11 Silvia Suárez <ss...@anpro21.com>
>
> > Dear Koji,
> >
> > Thanks a lot for your answer and Sorry about my english
> >
> > I tried to configure
>
FastVectorHighlighter<http://wiki.apache.org/solr/HighlightingParameters#h
> l.useFastVectorHighlighter>
> >
> > However, I have this error:
> >
> >
> > <lst name="error">
> > <str name="msg">
> > fragCharSize(1) is too small. It must be 18 or higher.
> > </str>
> > <str name="trace">
> > java.lang.IllegalArgumentException: fragCharSize(1) is too small. It
> must
> > be 18 or higher. at
> >
>
org.apache.lucene.search.vectorhighlight.BaseFragListBuilder.createFieldFr
> agList(BaseFragListBuilder.java:51)
> > at
> >
>
org.apache.lucene.search.vectorhighlight.WeightedFragListBuilder.createFie
> ldFragList(WeightedFragListBuilder.java:38)
> > at
> >
>
org.apache.lucene.search.vectorhighlight.FastVectorHighlighter.getFieldFra
> gList(FastVectorHighlighter.java:195)
> > at
> >
>
org.apache.lucene.search.vectorhighlight.FastVectorHighlighter.getBestFrag
> ments(FastVectorHighlighter.java:184)
> > at
> >
>
org.apache.solr.highlight.DefaultSolrHighlighter.doHighlightingByFastVecto
> rHighlighter(DefaultSolrHighlighter.java:588)
> > at
> >
>
org.apache.solr.highlight.DefaultSolrHighlighter.doHighlighting(DefaultSol
> rHighlighter.java:413)
> > at
> >
>
org.apache.solr.handler.component.HighlightComponent.process(HighlightComp
> onent.java:139)
> > at
> >
>
org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHa
> ndler.java:208)
> > at
> >
>
org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBas
> e.java:135)
> > at org.apache.solr.core.SolrCore.execute(SolrCore.java:1816) at
> >
>
org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java
> :656)
> > at
> >
>
org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.jav
> a:359)
> > at
> >
>
org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.jav
> a:155)
> > at
> >
>
org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandl
> er.java:1307)
> > at
> >
>
org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:453)
> > at
> >
>
org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:1
> 37)
> > at
> >
>
org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:560
> )
> > at
> >
>
org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.ja
> va:231)
> > at
> >
>
org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.ja
> va:1072)
> > at
> >
>
org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:382)
> > at
> >
>
org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.jav
> a:193)
> > at
> >
>
org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.jav
> a:1006)
> > at
> >
>
org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:1
> 35)
> > at
> >
>
org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHa
> ndlerCollection.java:255)
> > at
> >
>
org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollectio
> n.java:154)
> > at
> >
>
org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java
> :116)
> > at org.eclipse.jetty.server.Server.handle(Server.java:365) at
> >
>
org.eclipse.jetty.server.AbstractHttpConnection.handleRequest(AbstractHttp
> Connection.java:485)
> > at
> >
>
org.eclipse.jetty.server.BlockingHttpConnection.handleRequest(BlockingHttp
> Connection.java:53)
> > at
> >
>
org.eclipse.jetty.server.AbstractHttpConnection.headerComplete(AbstractHtt
> pConnection.java:926)
> > at
> >
>
org.eclipse.jetty.server.AbstractHttpConnection$RequestHandler.headerCompl
> ete(AbstractHttpConnection.java:988)
> > at org.eclipse.jetty.http.HttpParser.parseNext(HttpParser.java:635) at
> > org.eclipse.jetty.http.HttpParser.parseAvailable(HttpParser.java:235)
at
> >
>
org.eclipse.jetty.server.BlockingHttpConnection.handle(BlockingHttpConnect
> ion.java:72)
> > at
> >
>
org.eclipse.jetty.server.bio.SocketConnector$ConnectorEndPoint.run(SocketC
> onnector.java:264)
> > at
> >
>
org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.jav
> a:608)
> > at
> >
>
org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java
> :543)
> > at java.lang.Thread.run(Thread.java:722)
> > </str>
> > <int name="code">500</int>
> > </lst>
> > </response>
> >
> >
> >
> > Then, If I modify like this: (setHighlightFragsize(1) -->
> > setHighlightFragsize(80)):
> >
> > SolrQuery solrQuery = new SolrQuery();
> >
> >     solrQuery.setQuery(queryEnt);
> >     solrQuery.set("collectionName", myCollection);
> >         solrQuery.addHighlightField("texto")
> >                  .addHighlightField("titular")
> >                  .setHighlightSnippets(50)
> >                  .setHighlightFragsize(80);
> >         solrQuery.setHighlight(true);
> >         solrQuery.setHighlightRequireFieldMatch(true);
> >         solrQuery.set("hl.useFastVectorHighlighter", true);
> >         solrQuery.setHighlightSimplePre("<span class=\"item\">");
> >         solrQuery.setHighlightSimplePost("</span>");
> >         solrQuery.set("hl.usePhraseHighlighter", true);
> >
> >
> > Then, It works (error disappears),  but Highlighting does not work :(
:
> >
> > <lst name="highlighting">
> > <lst name="35254502"/>
> > <lst name="35237409"/>
> > </lst>
> > <lst name="termVectors">
> > <str name="uniqueKeyFieldName">c_noticia</str>
> > <lst name="warnings">
> > <arr name="noTermVectors">
> > <str>c_region</str>
> > <str>c_idioma</str>
> > <str>c_pais</str>
> > <str>c_tipo</str>
> > <str>c_categoria</str>
> > <str>fecha_captura</str>
> > <str>medio</str>
> > <str>c_fuente_docu</str>
> > </arr>
> > </lst>
> > <lst name="35254502">
> > <str name="uniqueKey">35254502</str>
> > </lst>
> > <lst name="35237409">
> > <str name="uniqueKey">35237409</str>
> > </lst>
> > </lst>
> > </response>
> >
> >
> >
> > My solrconfig.xml is:
> >
> >   <requestHandler name="/select" class="solr.SearchHandler">
> >     <!-- default values for query parameters can be specified, these
> >          will be overridden by parameters in the request
> >       -->
> >     <!-- <lst name="defaults">
> >        <str name="echoParams">explicit</str>
> >        <int name="rows">10</int>
> >        <str name="df">text</str>
> >      </lst>-->
> >     <lst name="defaults">
> >       <str name="echoParams">explicit</str>
> >       <int name="rows">10</int>
> >        <str name="df">texto</str>
> >       <bool name="hl.usePhraseHighlighter">true</bool>
> >       <str name="df">texto</str>
> >       <bool name="tv">true</bool>
> >     </lst>
> >      <arr name="last-components">
> >       <str>tvComponent</str>
> >     </arr>
> >
> >
> > missing something?
> > Thanks a lot, in advance, for your help,
> >
> > Sil.
> >
> >
> >
> >
> > *
> > *
> > *Tecnologías y SaaS para el análisis de marcas comerciales.*
> >
> >
> > Nota:
> > Usted ha recibido este mensaje al estar en la libreta de direcciones
del
> > remitente, en los archivos de la empresa o mediante el sistema de
> > “responder” al ser usted la persona que contactó por este medio con el
> > remitente. En caso de no querer recibir ningún email mas del remitente
o
> de
> > cualquier miembro de la organización a la que pertenece, por favor,
> > responda a este email solicitando la baja de su dirección en nuestros
> > archivos.
> >
> > Advertencia legal:
> > Este mensaje y, en su caso, los ficheros anexos son confidenciales,
> > especialmente en lo que respecta a los datos personales, y se dirigen
> > exclusivamente al destinatario referenciado. Si usted no lo es y lo ha
> > recibido por error o tiene conocimiento del mismo por cualquier
motivo,
> le
> > rogamos que nos lo comunique por este medio y proceda a destruirlo o
> > borrarlo, y que en todo caso se abstenga de utilizar, reproducir,
> alterar,
> > archivar o comunicar a terceros el presente mensaje y ficheros anexos,
> todo
> > ello bajo pena de incurrir en responsabilidades legales.
> >
> >
> > 2013/10/10 Koji Sekiguchi <ko...@r.email.ne.jp>
> >
> >> (13/10/10 18:17), Silvia Suárez wrote:
> >>
> >>> I am using solrj as client for indexing documents on the solr server
I
> am
> >>> new to solr, And I am having problem with the highlighting in solr.
> >>> Highlighting exact phrases with solr does not work.
> >>>
> >>> For example if the search keyword is: "dulce hogar" it returns:
> >>>
> >>> <span class="item"> dulce </span> <span class="item"> hogar </span>
> >>>
> >>>   And it should be:
> >>>
> >>> <span class="item"> dulce hogar </span>
> >>>
> >>> I don't understand which is the problem. Can someone  helpme
please!?
> >>>
> >>
> >> Unfortunately, it is the feature.
> >> FVH can support phrase-unit highlighting.
> >>
> >> http://wiki.apache.org/solr/**HighlightingParameters#hl.**
> >>
>
useFastVectorHighlighter<http://wiki.apache.org/solr/HighlightingParameter
> s#hl.useFastVectorHighlighter>
> >>
> >> koji
> >> --
> >> http://soleami.com/blog/**automatically-acquiring-**
> >> synonym-knowledge-from-
>
**wikipedia.html<http://soleami.com/blog/automatically-acquiring-synonym-
> knowledge-from-wikipedia.html>
> >>
> >
> >