You are viewing a plain text version of this content. The canonical link for it is here.
Posted to java-commits@lucene.apache.org by us...@apache.org on 2009/07/06 15:50:18 UTC
svn commit: r791483 [1/5] - /lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/

Author: uschindler
Date: Mon Jul  6 13:50:17 2009
New Revision: 791483

URL: http://svn.apache.org/viewvc?rev=791483&view=rev
Log:
Convert and cleanup the test files to UTF-8. What is still broken is the incorrect usage of KOI8 and CP1251 encodings. Added svn:eol-style=native to all files again.

Added:
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/resUTF8.htm   (with props)
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/stemsUTF8.txt   (with props)
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/testUTF8.txt   (with props)
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/wordsUTF8.txt   (with props)
Removed:
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/resUnicode.htm
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/stemsUnicode.txt
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/testUnicode.txt
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/wordsUnicode.txt
Modified:
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianAnalyzer.java
    lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianStem.java

Modified: lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianAnalyzer.java
URL: http://svn.apache.org/viewvc/lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianAnalyzer.java?rev=791483&r1=791482&r2=791483&view=diff
==============================================================================
--- lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianAnalyzer.java (original)
+++ lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianAnalyzer.java Mon Jul  6 13:50:17 2009
@@ -62,13 +62,13 @@
         RussianAnalyzer ra = new RussianAnalyzer(RussianCharsets.UnicodeRussian);
         inWords =
             new InputStreamReader(
-                new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/testUnicode.txt")),
-                "Unicode");
+                new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/testUTF8.txt")),
+                "UTF-8");
 
         sampleUnicode =
             new InputStreamReader(
-                new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/resUnicode.htm")),
-                "Unicode");
+                new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/resUTF8.htm")),
+                "UTF-8");
 
         TokenStream in = ra.tokenStream("all", inWords);
 

Modified: lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianStem.java
URL: http://svn.apache.org/viewvc/lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianStem.java?rev=791483&r1=791482&r2=791483&view=diff
==============================================================================
--- lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianStem.java (original)
+++ lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/TestRussianStem.java Mon Jul  6 13:50:17 2009
@@ -50,8 +50,8 @@
         BufferedReader inWords =
             new BufferedReader(
                 new InputStreamReader(
-                    new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/wordsUnicode.txt")),
-                    "Unicode"));
+                    new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/wordsUTF8.txt")),
+                    "UTF-8"));
         while ((str = inWords.readLine()) != null)
         {
             words.add(str);
@@ -62,8 +62,8 @@
         BufferedReader inStems =
             new BufferedReader(
                 new InputStreamReader(
-                    new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/stemsUnicode.txt")),
-                    "Unicode"));
+                    new FileInputStream(new File(dataDir, "/org/apache/lucene/analysis/ru/stemsUTF8.txt")),
+                    "UTF-8"));
         while ((str = inStems.readLine()) != null)
         {
             stems.add(str);

Added: lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/resUTF8.htm
URL: http://svn.apache.org/viewvc/lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/resUTF8.htm?rev=791483&view=auto
==============================================================================
--- lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/resUTF8.htm (added)
+++ lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/resUTF8.htm Mon Jul  6 13:50:17 2009
@@ -0,0 +1 @@
+ï»¿[Ð²Ð¼ÐµÑÑ][ÑÐ¸Ð»][ÑÐ»ÐµÐºÑÑÐ¾Ð¼Ð°Ð³Ð½Ð¸ÑÐ½][ÑÐ½ÐµÑÐ³][Ð¸Ð¼ÐµÐ»][Ð¿ÑÐµÐ´ÑÑÐ°Ð²Ð»ÐµÐ½][ÑÐºÐ°Ð¶][Ð¶ÑÐµÑ][Ð´ÑÐµÐ²Ð½][ÐµÐ³Ð¸Ð¿Ñ][Ð·Ð½Ð°Ð½][ÑÑÐ°Ð½][ÑÐ°Ð¹Ð½][ÑÐ·Ðº][ÐºÑÑÐ³][Ð¿Ð¾ÑÐ²ÑÑÐµÐ½][Ð²ÑÑÐº][Ð²ÑÐµÐ¼ÐµÐ½][Ð²Ð¸ÑÐ¾Ðº][Ð¿ÑÐ¸Ð½][ÑÐ¾Ð±][Ð½Ð¾Ð²][ÑÐµÑÐ½Ð¾Ð»Ð¾Ð³][ÑÐ°Ð¼][Ð´ÐµÐ»][ÑÐ°ÑÐºÑÑÐ²Ð°][Ð¿Ð¾ÑÐ°ÐµÐ½][Ð·Ð½Ð°Ð½][Ð¿ÑÐµÐ¶Ð½][Ð²ÐµÐº][Ð³Ð¾Ð²Ð¾Ñ][Ð½Ð¾Ð²][Ð¸Ð½ÑÐ¾ÑÐ¼Ð°Ñ][ÑÑÐ°Ð½Ð¾Ð²][Ð´Ð¾ÑÑÑÐ¿Ð½][ÑÐ¸ÑÐ¾Ðº][ÐºÑÑÐ³][Ð¿Ð¾Ð»ÑÐ·Ð¾Ð²Ð°ÑÐµÐ»][ÑÐµÑ][ÑÐ»ÑÑÐ°][ÑÐ¾Ð·Ð½Ð°Ð½][Ð¾Ð±ÑÐµÑÑÐ²][Ð³Ð¾Ñ
 Ð¾Ð²][Ð²Ð¾ÑÐ¿ÑÐ¸Ð½Ñ][Ð²Ð¾ÑÐ¿Ð¾Ð»ÑÐ·Ð¾Ð²Ð°]
\ No newline at end of file

Propchange: lucene/java/trunk/contrib/analyzers/src/test/org/apache/lucene/analysis/ru/resUTF8.htm
------------------------------------------------------------------------------
    svn:eol-style = native