You are viewing a plain text version of this content. The canonical link for it is here.
Posted to users-fr@cocoon.apache.org by Bruno Merkele <bm...@gmail.com> on 2005/12/21 21:44:54 UTC

Cocoon, lucene et le français

Bonjour,

Heureux utilisateur de cocoon depuis plusieurs mois, je souhaiterais
intégrer des fonctionnalités de recherche à mon application.
Les contenus à indexer étant principalement en français, j'ai remarqué
que le StandardAnalyser s'en sortait parfois mal avec notre langue.

J'ai vu qu'il existait un FrenchAnalyser ici:
http://svn.apache.org/repos/asf/lucene/java/trunk/contrib/analyzers/src/java/org/apache/lucene/analysis/fr/

Ma question est donc:
Quel est la marche à suivre pour utiliser ce code dans Cocoon? dois je
refaire l'archive jar de lucene? dois je recompiler tout cocoon?
(Je me suis pour le moment limité à utiliser Cocoon comme il était
livré, en modifiant tout au plus blocks.properties et
build.properties. )

Merci d'avance et bonne soirée :-)

Bruno

---------------------------------------------------------------------
Liste francophone Apache Cocoon -- http://cocoon.apache.org/fr/
Pour vous desinscrire : mailto:users-fr-unsubscribe@cocoon.apache.org
Autres commandes : mailto:users-fr-help@cocoon.apache.org


Re: Cocoon, lucene et le français

Posted by Jean-Baptiste Quenot <jb...@anyware-tech.com>.
* Bruno Merkele:

> Quel est la marche à suivre pour utiliser ce code dans Cocoon?

Il   faut   mettre  la   classe   compilée   dans  le   répertoire
WEB-INF/classes  de  ton  application, dans  une  arborescence  de
répertoires conforme au nom du package de la classe.

Dans mon application, j'ai un répertoire
WEB-INF/classes/org/apache/lucene/analysis/fr/ contenant les
différentes classes nécessaires à l'indexation Lucène en français.
-- 
Jean-Baptiste Quenot
Systèmes d'Information
ANYWARE TECHNOLOGIES
Tel : +33 (0)5 61 00 52 90
Fax : +33 (0)5 61 00 51 46
http://www.anyware-tech.com/

---------------------------------------------------------------------
Liste francophone Apache Cocoon -- http://cocoon.apache.org/fr/
Pour vous desinscrire : mailto:users-fr-unsubscribe@cocoon.apache.org
Autres commandes : mailto:users-fr-help@cocoon.apache.org


Re: Cocoon, lucene et le français

Posted by Bertrand Delacretaz <bd...@apache.org>.
Le 21 déc. 05, à 21:44, Bruno Merkele a écrit :

> ...J'ai vu qu'il existait un FrenchAnalyser ici:
> http://svn.apache.org/repos/asf/lucene/java/trunk/contrib/analyzers/ 
> src/java/org/apache/lucene/analysis/fr/
>
> Ma question est donc:
> Quel est la marche à suivre pour utiliser ce code dans Cocoon? dois je
> refaire l'archive jar de lucene? dois je recompiler tout cocoon?...

Je n'ai pas d'infos très précises, mais en lisant le code du bloc  
Lucene, on constate que le choix de l'Analyzer est configurable à  
certains endroits, mais malheureusement hardcodé à d'autres.

Dans le LuceneIndexTransformer, par exemple:

   Analyzer analyzer =  
LuceneCocoonHelper.getAnalyzer(queryConfiguration.analyzerClassname);

Et ce paramètre est configurable par l'élément "analyzer" du  
transformer.

Il y a un exemple de cette config dans les samples de ce bloc, dans  
content2lucene.xsl:

     <lucene:index
       analyzer="org.apache.lucene.analysis.standard.StandardAnalyzer"
       directory="index2"
       create="false"
       merge-factor="10">

Donc, si ton code utilise ce transformer, tu pourras choisir l'analyzer  
par son nom de classe, classe qui devra bien entendu être accessible à  
Cocoon dans un jar. Dans d'autres composants (chercher "Analyzer" dans  
le code du bloc Lucene pour les détails), le choix d'analyzer  
nécessiterait un patch du code pour le rendre configurable.

-Bertrand