You are viewing a plain text version of this content. The canonical link for it is here.
Posted to dev@lucene.apache.org by Tun Lin <ch...@singnet.com.sg> on 2003/12/03 02:42:02 UTC

Translation.

Hi,

Can anyone translate this text for me? I cannot understand the instructions.
Please help!

Thanks.

===========
 ____________
|            |
| LUCY 1.1   |   readme.txt    Ultimo aggiornamento: 18/03/2003
|____________|





STRUTTURA


Lucy 1.1	-> Lucene 1.2
		-> HTMLParser 1.2
		-> PdfBox 0.5.6
		-> wvWare 0.7.2-3
		-> xlhtml 0.4.9
		-> antiword 0.33
		-> Xpdf 2.01 
		-> Snowball 0.1
		-> NGramJ 01.12.11
		-> it.corila.lucy	-> IndexAll.java
					-> SearchIndex.java
					-> HTMLDocument.java
					-> PDFDocument.java
					-> ExternalParser.java
					-> ItalianStemFilter.java
					-> EnglishStemFilter.java
					-> ApostropheFilter.java
					-> IndexAnalyzer.java
					-> SearchAnalyzer.java
					-> LanguageCategorizer
					-> NgramjCategorizer.java





DESCRIZIONE

Lucy e' in grado di indicizzare tutti i files con estensione txt, html, pdf,
doc, ppt, xls contenuti in una cartella base e nelle sue sottocartelle. Consente
ricerche da linea di comando DOS oppure mediante interfaccia web. Gestisce testi
in Italiano e Inglese con procedure di elaborazione lessicale specifiche.





SISTEMI OPERATIVI SUPPORTATI

Windows 98 / Windows 2000 / Windows XP





REQUISITI DI SISTEMA

Nessuno tranne i permessi necessari alla scrittura di files su una cartella del
sistema
Per utilizzare il modulo di ricerca con interfaccia web e' necessario disporre
di Apache Tomcat, versione 3 o 4.




INSTALLAZIONE

Lanciare la procedura automatica di installazione Lucy1.1.exe, oppure
scompattare
il file Lucy1.1.zip in una cartella (NB: il percorso non deve contenere spazi).
L'applicazione utilizza di default una propria java virtual machine. E'
possibile utilizzarne un'altra gia' installata nel sistema modificando il valore
della variabile MYJAVAPATH nel file jvm.bat
In questo caso la cartella jre puo' essere eliminata per ridurre l'occupazione
di spazio su disco di circa 40 MBytes.




CONFIGURAZIONE

Modificare i valori delle variabili contenute nel file properties.txt, nella
cartella base dell'applicazione:


lucy.path: cartella in cui si e' installata l'applicazione 

log.files.dir: cartella in cui verranno creati i files di log

del.temp.files: eliminazione dei files temporanei alla fine dell'indicizzazione
(yes/no)

doc.parser: parser da utilizzare per i files .doc (antiword/wvware)

pdf.parser: parser da utilizzare per i files .pdf (xpdf/pdfbox)

index.dir: cartella in cui verranno memorizzati gli indici

index.name: nome dell'indice che deve essere creato

indexing.folder: cartella che deve essere indicizzata


IMPORTANTE: tutti i percorsi devono essere indicati utilizzando come separatori
di directory due barre rovesciate (\\) anziche' una barra singola




MODALITA' DI UTILIZZO

I tre files batch nella cartella base dell'applicazione sono attivabili
direttamente da Windows con doppio click.

indicizza.bat					       crea un indice

aggiorna.bat					       modifica un indice

cerca.bat					       effettua ricerche su un
indice

Tutti i parametri necessari (nome e localizzazione dell'indice, percorso della
cartella da indicizzare) vanno specificati a priori nel file properties.txt


E' possibile in alternativa utilizzare le procedure da riga di comando dos,
sempre con la modifica preventiva del file properties.txt
In questo caso inoltre, mediante la sintassi:

cerca percorso-indice

si possono effettuare ricerche su altri indici creati in precedenza, senza
modificare il file properties.txt




NOTE SULL'UTILIZZO DEI PARSERS

I valori di default impostati per i parsers sono quelli consigliati per la prima
esecuzione dell'indicizzazione. In un secondo momento e' possibile modificarli
ai valori alternativi e procedere a un aggiornamento dell'indice. In questo modo
i documenti che non sono stati indicizzati per errori di parsing vengono
processati anche dai due parsers alternativi.

Qualora il processo di parsing portasse ad errori di sistema che costringessero
a interrompere il processo di indicizzazione, l'utente potra' riprendere
l'indicizzazione da dove si e' interrotta utilizzando la procedura di
aggiornamento, avendo cura di rimuovere - prima di lanciarla - il file
write.lock dalla cartella che contiene i file dell'indice.





UTILIZZO COME WEB APPLICATION PER RICERCHE TESTUALI

Se nel sistema e' installato il motore per servlet e jsp Apache Tomcat, e'
possibile effettuare le ricerche sugli indici tramite un'interfaccia web. Se e'
presente anche una web server application le ricerche possono avvenire da un
browser remoto connesso a internet. La procedura di configurazione e' la
seguente:


- copiare il file lucyweb.war nella sottocartella webapps di Tomcat 


- far partire Tomcat mediante la procedura di startup, in modo che il file war
venga scompattato


- nel file configuration.jsp della cartella webapps\lucyweb cosi' ottenuta,
devono essere impostate tre variabili:

  1) indexLocation deve puntare alla cartella in cui e' contenuto l'indice sul
quale si vogliono compiere le ricerche

  2) siteIP deve contenere l'ip della macchina di pubblicazione dei documenti

  3) serverRoot deve essere uguale al percorso su disco della cartella di
pubblicazione del web server

  Nel caso non si disponga di un web server e quindi si effettuino le ricerche
con interafaccia web solo in locale, le ultime due variabili devono essere
lasciate vuote ("")


- per accedere localmente alla pagina delle ricerche digitare nella barra
indirizzi del browser l'url 
  
  http://localhost:8080/lucyweb 

  Per l'accesso da browser remoto usare l'indirizzo ip del server seguito dal
percorso della cartella lucyweb.



La sintassi ammessa per le query e' consultabile in una pagina di help on line.



NOTA: l'indice non potra' essere eliminato se prima non viene eseguito lo
shutdown di Tomcat. Potra' pero' essere aggiornato in contemporanea a processi
di ricerca.

==============


Re: Translation.

Posted by Otis Gospodnetic <ot...@yahoo.com>.
Uh, I get to do this dirty job. :(

Lucene-user and lucene-dev are not the appropriate fora for questions
such as this one.
Please ask the original author of the text for help, or use an online
translation service, such as the one at http://babelfish.av.com

Also, for questions about Lucene usage, problems, help, etc. please
email _only_ lucene-user mailing list.  The lucene-dev mailing list is
used by developers of Lucene, and not developers who are using Lucene.

Thanks,
Otis


--- Tun Lin <ch...@singnet.com.sg> wrote:
> Hi,
> 
> Can anyone translate this text for me? I cannot understand the
> instructions.
> Please help!
> 
> Thanks.
> 
> ===========
>  ____________
> |            |
> | LUCY 1.1   |   readme.txt    Ultimo aggiornamento: 18/03/2003
> |____________|
> 
> 
> 
> 
> 
> STRUTTURA
> 
> 
> Lucy 1.1	-> Lucene 1.2
> 		-> HTMLParser 1.2
> 		-> PdfBox 0.5.6
> 		-> wvWare 0.7.2-3
> 		-> xlhtml 0.4.9
> 		-> antiword 0.33
> 		-> Xpdf 2.01 
> 		-> Snowball 0.1
> 		-> NGramJ 01.12.11
> 		-> it.corila.lucy	-> IndexAll.java
> 					-> SearchIndex.java
> 					-> HTMLDocument.java
> 					-> PDFDocument.java
> 					-> ExternalParser.java
> 					-> ItalianStemFilter.java
> 					-> EnglishStemFilter.java
> 					-> ApostropheFilter.java
> 					-> IndexAnalyzer.java
> 					-> SearchAnalyzer.java
> 					-> LanguageCategorizer
> 					-> NgramjCategorizer.java
> 
> 
> 
> 
> 
> DESCRIZIONE
> 
> Lucy e' in grado di indicizzare tutti i files con estensione txt,
> html, pdf,
> doc, ppt, xls contenuti in una cartella base e nelle sue
> sottocartelle. Consente
> ricerche da linea di comando DOS oppure mediante interfaccia web.
> Gestisce testi
> in Italiano e Inglese con procedure di elaborazione lessicale
> specifiche.
> 
> 
> 
> 
> 
> SISTEMI OPERATIVI SUPPORTATI
> 
> Windows 98 / Windows 2000 / Windows XP
> 
> 
> 
> 
> 
> REQUISITI DI SISTEMA
> 
> Nessuno tranne i permessi necessari alla scrittura di files su una
> cartella del
> sistema
> Per utilizzare il modulo di ricerca con interfaccia web e' necessario
> disporre
> di Apache Tomcat, versione 3 o 4.
> 
> 
> 
> 
> INSTALLAZIONE
> 
> Lanciare la procedura automatica di installazione Lucy1.1.exe, oppure
> scompattare
> il file Lucy1.1.zip in una cartella (NB: il percorso non deve
> contenere spazi).
> L'applicazione utilizza di default una propria java virtual machine.
> E'
> possibile utilizzarne un'altra gia' installata nel sistema
> modificando il valore
> della variabile MYJAVAPATH nel file jvm.bat
> In questo caso la cartella jre puo' essere eliminata per ridurre
> l'occupazione
> di spazio su disco di circa 40 MBytes.
> 
> 
> 
> 
> CONFIGURAZIONE
> 
> Modificare i valori delle variabili contenute nel file
> properties.txt, nella
> cartella base dell'applicazione:
> 
> 
> lucy.path: cartella in cui si e' installata l'applicazione 
> 
> log.files.dir: cartella in cui verranno creati i files di log
> 
> del.temp.files: eliminazione dei files temporanei alla fine
> dell'indicizzazione
> (yes/no)
> 
> doc.parser: parser da utilizzare per i files .doc (antiword/wvware)
> 
> pdf.parser: parser da utilizzare per i files .pdf (xpdf/pdfbox)
> 
> index.dir: cartella in cui verranno memorizzati gli indici
> 
> index.name: nome dell'indice che deve essere creato
> 
> indexing.folder: cartella che deve essere indicizzata
> 
> 
> IMPORTANTE: tutti i percorsi devono essere indicati utilizzando come
> separatori
> di directory due barre rovesciate (\\) anziche' una barra singola
> 
> 
> 
> 
> MODALITA' DI UTILIZZO
> 
> I tre files batch nella cartella base dell'applicazione sono
> attivabili
> direttamente da Windows con doppio click.
> 
> indicizza.bat					       crea un indice
> 
> aggiorna.bat					       modifica un indice
> 
> cerca.bat					       effettua ricerche su un
> indice
> 
> Tutti i parametri necessari (nome e localizzazione dell'indice,
> percorso della
> cartella da indicizzare) vanno specificati a priori nel file
> properties.txt
> 
> 
> E' possibile in alternativa utilizzare le procedure da riga di
> comando dos,
> sempre con la modifica preventiva del file properties.txt
> In questo caso inoltre, mediante la sintassi:
> 
> cerca percorso-indice
> 
> si possono effettuare ricerche su altri indici creati in precedenza,
> senza
> modificare il file properties.txt
> 
> 
> 
> 
> NOTE SULL'UTILIZZO DEI PARSERS
> 
> I valori di default impostati per i parsers sono quelli consigliati
> per la prima
> esecuzione dell'indicizzazione. In un secondo momento e' possibile
> modificarli
> ai valori alternativi e procedere a un aggiornamento dell'indice. In
> questo modo
> i documenti che non sono stati indicizzati per errori di parsing
> vengono
> processati anche dai due parsers alternativi.
> 
> Qualora il processo di parsing portasse ad errori di sistema che
> costringessero
> a interrompere il processo di indicizzazione, l'utente potra'
> riprendere
> l'indicizzazione da dove si e' interrotta utilizzando la procedura di
> aggiornamento, avendo cura di rimuovere - prima di lanciarla - il
> file
> write.lock dalla cartella che contiene i file dell'indice.
> 
> 
> 
> 
> 
> UTILIZZO COME WEB APPLICATION PER RICERCHE TESTUALI
> 
> Se nel sistema e' installato il motore per servlet e jsp Apache
> Tomcat, e'
> possibile effettuare le ricerche sugli indici tramite un'interfaccia
> web. Se e'
> presente anche una web server application le ricerche possono
> avvenire da un
> browser remoto connesso a internet. La procedura di configurazione e'
> la
> seguente:
> 
> 
> - copiare il file lucyweb.war nella sottocartella webapps di Tomcat 
> 
> 
> - far partire Tomcat mediante la procedura di startup, in modo che il
> file war
> venga scompattato
> 
> 
> - nel file configuration.jsp della cartella webapps\lucyweb cosi'
> ottenuta,
> devono essere impostate tre variabili:
> 
>   1) indexLocation deve puntare alla cartella in cui e' contenuto
> l'indice sul
> quale si vogliono compiere le ricerche
> 
>   2) siteIP deve contenere l'ip della macchina di pubblicazione dei
> documenti
> 
>   3) serverRoot deve essere uguale al percorso su disco della
> cartella di
> pubblicazione del web server
> 
>   Nel caso non si disponga di un web server e quindi si effettuino le
> ricerche
> con interafaccia web solo in locale, le ultime due variabili devono
> essere
> lasciate vuote ("")
> 
> 
> - per accedere localmente alla pagina delle ricerche digitare nella
> barra
> indirizzi del browser l'url 
>   
>   http://localhost:8080/lucyweb 
> 
>   Per l'accesso da browser remoto usare l'indirizzo ip del server
> seguito dal
> percorso della cartella lucyweb.
> 
> 
> 
> La sintassi ammessa per le query e' consultabile in una pagina di
> help on line.
> 
> 
> 
> NOTA: l'indice non potra' essere eliminato se prima non viene
> eseguito lo
> shutdown di Tomcat. Potra' pero' essere aggiornato in contemporanea a
> processi
> di ricerca.
> 
> ==============
> 
> 


__________________________________
Do you Yahoo!?
Free Pop-Up Blocker - Get it now
http://companion.yahoo.com/

---------------------------------------------------------------------
To unsubscribe, e-mail: lucene-user-unsubscribe@jakarta.apache.org
For additional commands, e-mail: lucene-user-help@jakarta.apache.org