You are viewing a plain text version of this content. The canonical link for it is here.
Posted to commits@lucene.apache.org by rm...@apache.org on 2010/05/17 13:28:05 UTC
svn commit: r945090 [2/2] - in /lucene/dev/trunk: lucene/contrib/ modules/analysis/common/src/java/org/apache/lucene/analysis/el/ modules/analysis/common/src/resources/org/apache/lucene/analysis/el/ modules/analysis/common/src/test/org/apache/lucene/an...

Added: lucene/dev/trunk/modules/analysis/common/src/test/org/apache/lucene/analysis/el/TestGreekStemmer.java
URL: http://svn.apache.org/viewvc/lucene/dev/trunk/modules/analysis/common/src/test/org/apache/lucene/analysis/el/TestGreekStemmer.java?rev=945090&view=auto
==============================================================================
--- lucene/dev/trunk/modules/analysis/common/src/test/org/apache/lucene/analysis/el/TestGreekStemmer.java (added)
+++ lucene/dev/trunk/modules/analysis/common/src/test/org/apache/lucene/analysis/el/TestGreekStemmer.java Mon May 17 11:28:04 2010
@@ -0,0 +1,508 @@
+package org.apache.lucene.analysis.el;
+
+import org.apache.lucene.analysis.Analyzer;
+import org.apache.lucene.analysis.BaseTokenStreamTestCase;
+
+public class TestGreekStemmer extends BaseTokenStreamTestCase {
+  Analyzer a = new GreekAnalyzer(TEST_VERSION_CURRENT);
+
+  public void testMasculineNouns() throws Exception {
+    // -Î¿Ï
+    checkOneTerm(a, "Î¬Î½Î¸ÏÏÏÎ¿Ï", "Î±Î½Î¸ÏÏÏ");
+    checkOneTerm(a, "Î±Î½Î¸ÏÏÏÎ¿Ï", "Î±Î½Î¸ÏÏÏ");
+    checkOneTerm(a, "Î¬Î½Î¸ÏÏÏÎ¿", "Î±Î½Î¸ÏÏÏ");
+    checkOneTerm(a, "Î¬Î½Î¸ÏÏÏÎµ", "Î±Î½Î¸ÏÏÏ");
+    checkOneTerm(a, "Î¬Î½Î¸ÏÏÏÎ¿Î¹", "Î±Î½Î¸ÏÏÏ");
+    checkOneTerm(a, "Î±Î½Î¸ÏÏÏÏÎ½", "Î±Î½Î¸ÏÏÏ");
+    checkOneTerm(a, "Î±Î½Î¸ÏÏÏÎ¿ÏÏ", "Î±Î½Î¸ÏÏÏ");
+    checkOneTerm(a, "Î¬Î½Î¸ÏÏÏÎ¿Î¹", "Î±Î½Î¸ÏÏÏ");
+    
+    // -Î·Ï
+    checkOneTerm(a, "ÏÎµÎ»Î¬ÏÎ·Ï", "ÏÎµÎ»Î±Ï");
+    checkOneTerm(a, "ÏÎµÎ»Î¬ÏÎ·", "ÏÎµÎ»Î±Ï");
+    checkOneTerm(a, "ÏÎµÎ»Î¬ÏÎµÏ", "ÏÎµÎ»Î±Ï");
+    checkOneTerm(a, "ÏÎµÎ»Î±ÏÏÎ½", "ÏÎµÎ»Î±Ï");
+    
+    // -Î±Ï/-ÎµÏ
+    checkOneTerm(a, "ÎµÎ»ÎÏÎ±Î½ÏÎ±Ï", "ÎµÎ»ÎµÏÎ±Î½Ï");
+    checkOneTerm(a, "ÎµÎ»ÎÏÎ±Î½ÏÎ±", "ÎµÎ»ÎµÏÎ±Î½Ï");
+    checkOneTerm(a, "ÎµÎ»ÎÏÎ±Î½ÏÎµÏ", "ÎµÎ»ÎµÏÎ±Î½Ï");
+    checkOneTerm(a, "ÎµÎ»ÎµÏÎ¬Î½ÏÏÎ½", "ÎµÎ»ÎµÏÎ±Î½Ï");
+    
+    // -Î±Ï/-Î±Î´ÎµÏ
+    checkOneTerm(a, "Î¼ÏÎ±Î¼ÏÎ¬Ï", "Î¼ÏÎ±Î¼Ï");
+    checkOneTerm(a, "Î¼ÏÎ±Î¼ÏÎ¬", "Î¼ÏÎ±Î¼Ï");
+    checkOneTerm(a, "Î¼ÏÎ±Î¼ÏÎ¬Î´ÎµÏ", "Î¼ÏÎ±Î¼Ï");
+    checkOneTerm(a, "Î¼ÏÎ±Î¼ÏÎ¬Î´ÏÎ½", "Î¼ÏÎ±Î¼Ï");
+    
+    // -Î·Ï/-Î·Î´ÎµÏ
+    checkOneTerm(a, "Î¼ÏÎ±ÎºÎ¬Î»Î·Ï", "Î¼ÏÎ±ÎºÎ±Î»");
+    checkOneTerm(a, "Î¼ÏÎ±ÎºÎ¬Î»Î·", "Î¼ÏÎ±ÎºÎ±Î»");
+    checkOneTerm(a, "Î¼ÏÎ±ÎºÎ¬Î»Î·Î´ÎµÏ", "Î¼ÏÎ±ÎºÎ±Î»");
+    checkOneTerm(a, "Î¼ÏÎ±ÎºÎ¬Î»Î·Î´ÏÎ½", "Î¼ÏÎ±ÎºÎ±Î»");
+    
+    // -ÎµÏ
+    checkOneTerm(a, "ÎºÎ±ÏÎÏ", "ÎºÎ±Ï");
+    checkOneTerm(a, "ÎºÎ±ÏÎ", "ÎºÎ±Ï");
+    checkOneTerm(a, "ÎºÎ±ÏÎÎ´ÎµÏ", "ÎºÎ±Ï");
+    checkOneTerm(a, "ÎºÎ±ÏÎÎ´ÏÎ½", "ÎºÎ±Ï");
+    
+    // -ÎÎ±Ï/ÎµÎ¯Ï
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎÎ±Ï", "Î³ÏÎ±Î¼Î¼Î±ÏÎµ");
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎÎ±", "Î³ÏÎ±Î¼Î¼Î±ÏÎµ");
+    // plural forms conflate w/ each other, not w/ the sing forms
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎµÎ¯Ï", "Î³ÏÎ±Î¼Î¼Î±Ï");
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎÏÎ½", "Î³ÏÎ±Î¼Î¼Î±Ï");
+    
+    // -Î¿ÏÏ/Î¿Î¹
+    checkOneTerm(a, "Î±ÏÏÏÎ»Î¿ÏÏ", "Î±ÏÎ¿ÏÎ»");
+    checkOneTerm(a, "Î±ÏÏÏÎ»Î¿Ï", "Î±ÏÎ¿ÏÎ»");
+    checkOneTerm(a, "Î±ÏÏÏÎ»Î¿Î¹", "Î±ÏÎ¿ÏÎ»");
+    checkOneTerm(a, "Î±ÏÏÏÎ»ÏÎ½", "Î±ÏÎ¿ÏÎ»");
+    
+    // -Î¿ÏÏ/-Î¿ÏÎ´ÎµÏ
+    checkOneTerm(a, "ÏÎ±ÏÏÎ¿ÏÏ", "ÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎ±ÏÏÎ¿Ï", "ÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎ±ÏÏÎ¿ÏÎ´ÎµÏ", "ÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎ±ÏÏÎ¿ÏÎ´ÏÎ½", "ÏÎ±ÏÏ");
+    
+    // -Î·Ï/-ÎµÎ¹Ï
+    checkOneTerm(a, "Î»Î¬ÏÏÎ·Ï", "Î»Î±ÏÏ");
+    checkOneTerm(a, "Î»Î¬ÏÏÎ·", "Î»Î±ÏÏ");
+    checkOneTerm(a, "Î»Î¬ÏÏÎµÎ¹Ï", "Î»Î±ÏÏ");
+    checkOneTerm(a, "Î»Î¬ÏÏÎµÏÎ½", "Î»Î±ÏÏ");
+    
+    // -ÏÏ
+    checkOneTerm(a, "ÏÎÎ»ÎµÎºÏÏ", "ÏÎµÎ»ÎµÎº");
+    checkOneTerm(a, "ÏÎÎ»ÎµÎºÏ", "ÏÎµÎ»ÎµÎº");
+    checkOneTerm(a, "ÏÎµÎ»ÎÎºÎµÎ¹Ï", "ÏÎµÎ»ÎµÎº");
+    checkOneTerm(a, "ÏÎµÎ»ÎÎºÎµÏÎ½", "ÏÎµÎ»ÎµÎº");
+    
+    // -ÏÏ
+    // note: nom./voc. doesn't conflate w/ the rest
+    checkOneTerm(a, "Î¼ÎÎ½ÏÏÏ", "Î¼ÎµÎ½ÏÏÏ");
+    checkOneTerm(a, "Î¼ÎÎ½ÏÎ¿ÏÎ¿Ï", "Î¼ÎµÎ½ÏÎ¿Ï");
+    checkOneTerm(a, "Î¼ÎÎ½ÏÎ¿ÏÎ±", "Î¼ÎµÎ½ÏÎ¿Ï");
+    checkOneTerm(a, "Î¼ÎÎ½ÏÎ¿ÏÎµÏ", "Î¼ÎµÎ½ÏÎ¿Ï");
+    checkOneTerm(a, "Î¼ÎµÎ½ÏÏÏÏÎ½", "Î¼ÎµÎ½ÏÎ¿Ï");
+    
+    // -ÏÎ½
+    checkOneTerm(a, "Î±Î³ÏÎ½Î±Ï", "Î±Î³ÏÎ½");
+    checkOneTerm(a, "Î±Î³ÏÎ½Î¿Ï", "Î±Î³ÏÎ½");
+    checkOneTerm(a, "Î±Î³ÏÎ½Î±", "Î±Î³ÏÎ½");
+    checkOneTerm(a, "Î±Î³ÏÎ½Î±", "Î±Î³ÏÎ½");
+    checkOneTerm(a, "Î±Î³ÏÎ½ÎµÏ", "Î±Î³ÏÎ½");
+    checkOneTerm(a, "Î±Î³ÏÎ½ÏÎ½", "Î±Î³ÏÎ½");
+    
+    // -Î±Ï/-Î·Î´ÎµÏ
+    checkOneTerm(a, "Î±ÎÏÎ±Ï", "Î±ÎµÏ");
+    checkOneTerm(a, "Î±ÎÏÎ±", "Î±ÎµÏ");
+    checkOneTerm(a, "Î±ÎÏÎ·Î´ÎµÏ", "Î±ÎµÏ");
+    checkOneTerm(a, "Î±ÎÏÎ·Î´ÏÎ½", "Î±ÎµÏ");
+    
+    // -Î·Ï/-Î·ÏÎµÏ
+    checkOneTerm(a, "Î³ÏÎ·Ï", "Î³Î¿");
+    checkOneTerm(a, "Î³ÏÎ·", "Î³Î¿Î·"); // too short
+    // the two plural forms conflate
+    checkOneTerm(a, "Î³ÏÎ·ÏÎµÏ", "Î³Î¿Î·Ï");
+    checkOneTerm(a, "Î³Î¿Î®ÏÏÎ½", "Î³Î¿Î·Ï");
+  }
+  
+  public void testFeminineNouns() throws Exception {
+    // -Î±/-ÎµÏ,-ÏÎ½
+    checkOneTerm(a, "ÏÎ¿ÏÎ¬", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÎ¬Ï", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÎÏ", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÏÎ½", "ÏÎ¿Ï");
+    
+    // -Î±/-ÎµÏ,-ÏÎ½
+    checkOneTerm(a, "Î±Î³ÎµÎ»Î¬Î´Î±", "Î±Î³ÎµÎ»Î±Î´");
+    checkOneTerm(a, "Î±Î³ÎµÎ»Î¬Î´Î±Ï", "Î±Î³ÎµÎ»Î±Î´");
+    checkOneTerm(a, "Î±Î³ÎµÎ»Î¬Î´ÎµÏ", "Î±Î³ÎµÎ»Î±Î´");
+    checkOneTerm(a, "Î±Î³ÎµÎ»Î¬Î´ÏÎ½", "Î±Î³ÎµÎ»Î±Î´");
+    
+    // -Î·/-ÎµÏ
+    checkOneTerm(a, "Î¶Î¬ÏÎ±ÏÎ·", "Î¶Î±ÏÎ±Ï");
+    checkOneTerm(a, "Î¶Î¬ÏÎ±ÏÎ·Ï", "Î¶Î±ÏÎ±Ï");
+    checkOneTerm(a, "Î¶Î¬ÏÎ±ÏÎµÏ", "Î¶Î±ÏÎ±Ï");
+    checkOneTerm(a, "Î¶Î±ÏÎ¬ÏÎµÏÎ½", "Î¶Î±ÏÎ±Ï");
+    
+    // -Î·/-ÎµÎ¹Ï
+    checkOneTerm(a, "ÏÎ·Î»ÎµÏÏÎ±ÏÎ·", "ÏÎ·Î»ÎµÎ¿ÏÎ±Ï");
+    checkOneTerm(a, "ÏÎ·Î»ÎµÏÏÎ±ÏÎ·Ï", "ÏÎ·Î»ÎµÎ¿ÏÎ±Ï");
+    checkOneTerm(a, "ÏÎ·Î»ÎµÎ¿ÏÎ¬ÏÎµÎ¹Ï", "ÏÎ·Î»ÎµÎ¿ÏÎ±Ï");
+    checkOneTerm(a, "ÏÎ·Î»ÎµÎ¿ÏÎ¬ÏÎµÏÎ½", "ÏÎ·Î»ÎµÎ¿ÏÎ±Ï");
+    
+    // -Î±/-Î±Î´ÎµÏ
+    checkOneTerm(a, "Î¼Î±Î¼Î¬", "Î¼Î±Î¼");
+    checkOneTerm(a, "Î¼Î±Î¼Î¬Ï", "Î¼Î±Î¼");
+    checkOneTerm(a, "Î¼Î±Î¼Î¬Î´ÎµÏ", "Î¼Î±Î¼");
+    checkOneTerm(a, "Î¼Î±Î¼Î¬Î´ÏÎ½", "Î¼Î±Î¼");
+    
+    // -Î¿Ï
+    checkOneTerm(a, "Î»ÎµÏÏÏÏÎ¿Ï", "Î»ÎµÏÏÎ¿Ï");
+    checkOneTerm(a, "Î»ÎµÏÏÏÏÎ¿Ï", "Î»ÎµÏÏÎ¿Ï");
+    checkOneTerm(a, "Î»ÎµÏÏÏÏÎ¿", "Î»ÎµÏÏÎ¿Ï");
+    checkOneTerm(a, "Î»ÎµÏÏÏÏÎµ", "Î»ÎµÏÏÎ¿Ï");
+    checkOneTerm(a, "Î»ÎµÏÏÏÏÎ¿Î¹", "Î»ÎµÏÏÎ¿Ï");
+    checkOneTerm(a, "Î»ÎµÏÏÏÏÏÎ½", "Î»ÎµÏÏÎ¿Ï");
+    checkOneTerm(a, "Î»ÎµÏÏÏÏÎ¿ÏÏ", "Î»ÎµÏÏÎ¿Ï");
+    
+    // -Î¿Ï
+    checkOneTerm(a, "Î±Î»ÎµÏÎ¿Ï", "Î±Î»ÎµÏ");
+    checkOneTerm(a, "Î±Î»ÎµÏÎ¿ÏÏ", "Î±Î»ÎµÏ");
+    checkOneTerm(a, "Î±Î»ÎµÏÎ¿ÏÎ´ÎµÏ", "Î±Î»ÎµÏ");
+    checkOneTerm(a, "Î±Î»ÎµÏÎ¿ÏÎ´ÏÎ½", "Î±Î»ÎµÏ");
+    
+    // -ÎÎ±Ï/ÎµÎ¯Ï
+    // note: not all forms conflate
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎÎ±Ï", "Î³ÏÎ±Î¼Î¼Î±ÏÎµ");
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎÏÏ", "Î³ÏÎ±Î¼Î¼Î±Ï");
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎÎ±", "Î³ÏÎ±Î¼Î¼Î±ÏÎµ");
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎµÎ¯Ï", "Î³ÏÎ±Î¼Î¼Î±Ï");
+    checkOneTerm(a, "Î³ÏÎ±Î¼Î¼Î±ÏÎÏÎ½", "Î³ÏÎ±Î¼Î¼Î±Ï");
+  }
+  
+  public void testNeuterNouns() throws Exception {
+    // ending with -Î¿
+    // note: nom doesnt conflate
+    checkOneTerm(a, "Î²Î¹Î²Î»Î¯Î¿", "Î²Î¹Î²Î»Î¹");
+    checkOneTerm(a, "Î²Î¹Î²Î»Î¯Î¿Ï", "Î²Î¹Î²Î»");
+    checkOneTerm(a, "Î²Î¹Î²Î»Î¯Î±", "Î²Î¹Î²Î»");
+    checkOneTerm(a, "Î²Î¹Î²Î»Î¯ÏÎ½", "Î²Î¹Î²Î»");
+    
+    // ending with -Î¹
+    checkOneTerm(a, "ÏÎ¿ÏÎ»Î¯", "ÏÎ¿ÏÎ»");
+    checkOneTerm(a, "ÏÎ¿ÏÎ»Î¹Î¿Ï", "ÏÎ¿ÏÎ»");
+    checkOneTerm(a, "ÏÎ¿ÏÎ»Î¹Î¬", "ÏÎ¿ÏÎ»");
+    checkOneTerm(a, "ÏÎ¿ÏÎ»Î¹ÏÎ½", "ÏÎ¿ÏÎ»");
+    
+    // ending with -Î±
+    // note: nom. doesnt conflate
+    checkOneTerm(a, "ÏÏÏÎ²Î»Î·Î¼Î±", "ÏÏÎ¿Î²Î»Î·Î¼");
+    checkOneTerm(a, "ÏÏÎ¿Î²Î»Î®Î¼Î±ÏÎ¿Ï", "ÏÏÎ¿Î²Î»Î·Î¼Î±");
+    checkOneTerm(a, "ÏÏÎ¿Î²Î»Î®Î¼Î±ÏÎ±", "ÏÏÎ¿Î²Î»Î·Î¼Î±");
+    checkOneTerm(a, "ÏÏÎ¿Î²Î»Î·Î¼Î¬ÏÏÎ½", "ÏÏÎ¿Î²Î»Î·Î¼Î±");
+    
+    // ending with -Î¿Ï/-Î¿ÏÏ
+    checkOneTerm(a, "ÏÎÎ»Î±Î³Î¿Ï", "ÏÎµÎ»Î±Î³");
+    checkOneTerm(a, "ÏÎµÎ»Î¬Î³Î¿ÏÏ", "ÏÎµÎ»Î±Î³");
+    checkOneTerm(a, "ÏÎµÎ»Î¬Î³Î·", "ÏÎµÎ»Î±Î³");
+    checkOneTerm(a, "ÏÎµÎ»Î¬Î³ÏÎ½", "ÏÎµÎ»Î±Î³");
+    
+    // ending with -ÏÏ/-ÏÏÎ¿Ï
+    checkOneTerm(a, "Î³ÎµÎ³Î¿Î½ÏÏ", "Î³ÎµÎ³Î¿Î½");
+    checkOneTerm(a, "Î³ÎµÎ³Î¿Î½ÏÏÎ¿Ï", "Î³ÎµÎ³Î¿Î½");
+    checkOneTerm(a, "Î³ÎµÎ³Î¿Î½ÏÏÎ±", "Î³ÎµÎ³Î¿Î½");
+    checkOneTerm(a, "Î³ÎµÎ³Î¿Î½ÏÏÏÎ½", "Î³ÎµÎ³Î¿Î½");
+    
+    // ending with -Ï/-Î¹Î¿Ï
+    checkOneTerm(a, "Î²ÏÎ¬Î´Ï", "Î²ÏÎ±Î´");
+    checkOneTerm(a, "Î²ÏÎ¬Î´Î¹", "Î²ÏÎ±Î´");
+    checkOneTerm(a, "Î²ÏÎ±Î´Î¹Î¿Ï", "Î²ÏÎ±Î´");
+    checkOneTerm(a, "Î²ÏÎ¬Î´Î¹Î±", "Î²ÏÎ±Î´");
+    checkOneTerm(a, "Î²ÏÎ±Î´Î¹ÏÎ½", "Î²ÏÎ±Î´");
+    
+    // ending with -Ï/-Î±ÏÎ¿Ï
+    // note: nom. doesnt conflate
+    checkOneTerm(a, "Î´ÏÏÏ", "Î´Î¿Ï");
+    checkOneTerm(a, "Î´ÏÏÎ±ÏÎ¿Ï", "Î´Î¿ÏÎ±Ï");
+    checkOneTerm(a, "Î´ÏÏÎ±ÏÎ±", "Î´Î¿ÏÎ±Ï");
+    checkOneTerm(a, "Î´Î¿ÏÎ¬ÏÏÎ½", "Î´Î¿ÏÎ±Ï");
+    
+    // ending with -Î±Ï
+    checkOneTerm(a, "ÎºÏÎÎ±Ï", "ÎºÏÎµ");
+    checkOneTerm(a, "ÎºÏÎÎ±ÏÎ¿Ï", "ÎºÏÎµ");
+    checkOneTerm(a, "ÎºÏÎÎ±ÏÎ±", "ÎºÏÎµ");
+    checkOneTerm(a, "ÎºÏÎµÎ¬ÏÏÎ½", "ÎºÏÎµ");
+    
+    // ending with -ÏÏ
+    checkOneTerm(a, "Î»ÏÎºÏÏÏÏ", "Î»ÏÎºÎ¿ÏÏ");
+    checkOneTerm(a, "Î»ÏÎºÏÏÏÏÎ¿Ï", "Î»ÏÎºÎ¿ÏÏ");
+    checkOneTerm(a, "Î»ÏÎºÏÏÏÏÎ±", "Î»ÏÎºÎ¿ÏÏ");
+    checkOneTerm(a, "Î»ÏÎºÎ¿ÏÏÏÏÎ½", "Î»ÏÎºÎ¿ÏÏ");
+    
+    // ending with -Î¿Î½/-Î¿Ï
+    // note: nom. doesnt conflate
+    checkOneTerm(a, "Î¼ÎÏÎ¿Î½", "Î¼ÎµÏÎ¿Î½");
+    checkOneTerm(a, "Î¼ÎÏÎ¿Ï", "Î¼ÎµÏ");
+    checkOneTerm(a, "Î¼ÎÏÎ±", "Î¼ÎµÏ");
+    checkOneTerm(a, "Î¼ÎÏÏÎ½", "Î¼ÎµÏ");
+    
+    // ending in -Î¿Î½/-Î¿Î½ÏÎ¿Ï
+    // note: nom. doesnt conflate
+    checkOneTerm(a, "ÎµÎ½Î´Î¹Î±ÏÎÏÎ¿Î½", "ÎµÎ½Î´Î¹Î±ÏÎµÏÎ¿Î½");
+    checkOneTerm(a, "ÎµÎ½Î´Î¹Î±ÏÎÏÎ¿Î½ÏÎ¿Ï", "ÎµÎ½Î´Î¹Î±ÏÎµÏÎ¿Î½Ï");
+    checkOneTerm(a, "ÎµÎ½Î´Î¹Î±ÏÎÏÎ¿Î½ÏÎ±", "ÎµÎ½Î´Î¹Î±ÏÎµÏÎ¿Î½Ï");
+    checkOneTerm(a, "ÎµÎ½Î´Î¹Î±ÏÎµÏÏÎ½ÏÏÎ½", "ÎµÎ½Î´Î¹Î±ÏÎµÏÎ¿Î½Ï");
+    
+    // ending with -ÎµÎ½/-ÎµÎ½ÏÎ¿Ï
+    checkOneTerm(a, "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎÎ½", "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎµÎ½");
+    checkOneTerm(a, "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎÎ½ÏÎ¿Ï", "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎµÎ½Ï");
+    checkOneTerm(a, "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎÎ½ÏÎ±", "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎµÎ½Ï");
+    checkOneTerm(a, "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎÎ½ÏÏÎ½", "Î±Î½Î±ÎºÎ¿Î¹Î½ÏÎ¸ÎµÎ½Ï");
+    
+    // ending with -Î±Î½/-Î±Î½ÏÎ¿Ï
+    checkOneTerm(a, "ÏÏÎ¼ÏÎ±Î½", "ÏÏÎ¼Ï");
+    checkOneTerm(a, "ÏÏÎ¼ÏÎ±Î½ÏÎ¿Ï", "ÏÏÎ¼ÏÎ±Î½Ï");
+    checkOneTerm(a, "ÏÏÎ¼ÏÎ±Î½ÏÎ±", "ÏÏÎ¼ÏÎ±Î½Ï");
+    checkOneTerm(a, "ÏÏÎ¼ÏÎ¬Î½ÏÏÎ½", "ÏÏÎ¼ÏÎ±Î½Ï");
+    
+    // ending with  -Î±/-Î±ÎºÏÎ¿Ï
+    checkOneTerm(a, "Î³Î¬Î»Î±", "Î³Î±Î»");
+    checkOneTerm(a, "Î³Î¬Î»Î±ÎºÏÎ¿Ï", "Î³Î±Î»Î±ÎºÏ");
+    checkOneTerm(a, "Î³Î¬Î»Î±ÏÎ±", "Î³Î±Î»Î±Ï");
+    checkOneTerm(a, "Î³Î±Î»Î¬ÎºÏÏÎ½", "Î³Î±Î»Î±ÎºÏ");
+  }
+  
+  public void testAdjectives() throws Exception {
+    // ending with -Î®Ï, -ÎÏ/-ÎµÎ¯Ï, -Î®
+    checkOneTerm(a, "ÏÏÎ½ÎµÏÎ®Ï", "ÏÏÎ½ÎµÏ");
+    checkOneTerm(a, "ÏÏÎ½ÎµÏÎ¿ÏÏ", "ÏÏÎ½ÎµÏ");
+    checkOneTerm(a, "ÏÏÎ½ÎµÏÎ®", "ÏÏÎ½ÎµÏ");
+    checkOneTerm(a, "ÏÏÎ½ÎµÏÏÎ½", "ÏÏÎ½ÎµÏ");
+    checkOneTerm(a, "ÏÏÎ½ÎµÏÎµÎ¯Ï", "ÏÏÎ½ÎµÏ");
+    checkOneTerm(a, "ÏÏÎ½ÎµÏÎÏ", "ÏÏÎ½ÎµÏ");
+    
+    // ending with -Î·Ï, -ÎµÏ/-ÎµÎ¹Ï, -Î·
+    checkOneTerm(a, "ÏÏÎ½Î®Î¸Î·Ï", "ÏÏÎ½Î·Î¸");
+    checkOneTerm(a, "ÏÏÎ½Î®Î¸Î¿ÏÏ", "ÏÏÎ½Î·Î¸");
+    checkOneTerm(a, "ÏÏÎ½Î®Î¸Î·", "ÏÏÎ½Î·Î¸");
+    // note: doesn't conflate
+    checkOneTerm(a, "ÏÏÎ½Î®Î¸ÎµÎ¹Ï", "ÏÏÎ½");
+    checkOneTerm(a, "ÏÏÎ½Î®Î¸ÏÎ½", "ÏÏÎ½Î·Î¸");
+    checkOneTerm(a, "ÏÏÎ½Î·Î¸ÎµÏ", "ÏÏÎ½Î·Î¸");
+    
+    // ending with -ÏÏ, -Ï/-ÎµÎ¹Ï, -Î¹Î±
+    checkOneTerm(a, "Î²Î±Î¸ÏÏ", "Î²Î±Î¸");
+    checkOneTerm(a, "Î²Î±Î¸ÎÎ¿Ï", "Î²Î±Î¸Îµ");
+    checkOneTerm(a, "Î²Î±Î¸Ï", "Î²Î±Î¸");
+    checkOneTerm(a, "Î²Î±Î¸ÎµÎ¯Ï", "Î²Î±Î¸");
+    checkOneTerm(a, "Î²Î±Î¸ÎÏÎ½", "Î²Î±Î¸");
+    
+    checkOneTerm(a, "Î²Î±Î¸Î¹Î¬", "Î²Î±Î¸");
+    checkOneTerm(a, "Î²Î±Î¸Î¹Î¬Ï", "Î²Î±Î¸Î¹");
+    checkOneTerm(a, "Î²Î±Î¸Î¹ÎÏ", "Î²Î±Î¸Î¹");
+    checkOneTerm(a, "Î²Î±Î¸Î¹ÏÎ½", "Î²Î±Î¸");
+    
+    checkOneTerm(a, "Î²Î±Î¸ÎÎ±", "Î²Î±Î¸Îµ");
+    
+    // comparative/superlative
+    checkOneTerm(a, "ÏÎ·Î»ÏÏ", "ÏÎ·Î»");
+    checkOneTerm(a, "ÏÎ·Î»ÏÏÎµÏÎ¿Ï", "ÏÎ·Î»");
+    checkOneTerm(a, "ÏÎ·Î»ÏÏÎ±ÏÎ¿Ï", "ÏÎ·Î»");
+    
+    checkOneTerm(a, "ÏÏÎ±Î¯Î¿Ï", "ÏÏÎ±Î¹");
+    checkOneTerm(a, "ÏÏÎ±Î¹ÏÏÎµÏÎ¿Ï", "ÏÏÎ±Î¹");
+    checkOneTerm(a, "ÏÏÎ±Î¹ÏÏÎ±ÏÎ¿Ï", "ÏÏÎ±Î¹");
+    
+    checkOneTerm(a, "ÎµÏÎ¹ÎµÎ¹ÎºÎ®Ï", "ÎµÏÎ¹ÎµÎ¹Îº");
+    checkOneTerm(a, "ÎµÏÎ¹ÎµÎ¹ÎºÎÏÏÎµÏÎ¿Ï", "ÎµÏÎ¹ÎµÎ¹Îº");
+    checkOneTerm(a, "ÎµÏÎ¹ÎµÎ¹ÎºÎÏÏÎ±ÏÎ¿Ï", "ÎµÏÎ¹ÎµÎ¹Îº");
+  }
+  
+
+  public void testVerbs() throws Exception {
+    // note, past/present verb stems will not conflate (from the paper)
+    //-Ï,-Î±/-.Ï,-.Î±
+    checkOneTerm(a, "Î¿ÏÎ¯Î¶Ï", "Î¿ÏÎ¹Î¶");
+    checkOneTerm(a, "ÏÏÎ¹Î¶Î±", "Î¿ÏÎ¹Î¶");
+    checkOneTerm(a, "ÏÏÎ¹Î¶Îµ", "Î¿ÏÎ¹Î¶");
+    checkOneTerm(a, "Î¿ÏÎ¯Î¶Î¿Î½ÏÎ±Ï", "Î¿ÏÎ¹Î¶");
+    checkOneTerm(a, "Î¿ÏÎ¯Î¶Î¿Î¼Î±Î¹", "Î¿ÏÎ¹Î¶");
+    checkOneTerm(a, "Î¿ÏÎ¹Î¶ÏÎ¼Î¿ÏÎ½", "Î¿ÏÎ¹Î¶");
+    checkOneTerm(a, "Î¿ÏÎ¯Î¶ÎµÏÎ±Î¹", "Î¿ÏÎ¹Î¶");
+    
+    checkOneTerm(a, "ÏÏÎ¹ÏÎ±", "Î¿ÏÎ¹Ï");
+    checkOneTerm(a, "Î¿ÏÎ¯ÏÏ", "Î¿ÏÎ¹Ï");
+    checkOneTerm(a, "ÏÏÎ¹ÏÎµ", "Î¿ÏÎ¹Ï");
+    checkOneTerm(a, "Î¿ÏÎ¯ÏÎµÎ¹", "Î¿ÏÎ¹Ï");
+    
+    checkOneTerm(a, "Î¿ÏÎ¯ÏÏÎ·ÎºÎ±", "Î¿ÏÎ¹ÏÏ");
+    checkOneTerm(a, "Î¿ÏÎ¹ÏÏÏ", "Î¿ÏÎ¹ÏÏ");
+    checkOneTerm(a, "Î¿ÏÎ¹ÏÏÎµÎ¯Ï", "Î¿ÏÎ¹ÏÏ");
+    checkOneTerm(a, "Î¿ÏÎ¹ÏÏÎµÎ¯", "Î¿ÏÎ¹ÏÏ");
+    
+    checkOneTerm(a, "Î¿ÏÎ¹ÏÎ¼ÎÎ½Î¿", "Î¿ÏÎ¹ÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "Î¿ÏÎ¹ÏÎ¼ÎÎ½Î·", "Î¿ÏÎ¹ÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "Î¿ÏÎ¹ÏÎ¼ÎÎ½Î¿Ï", "Î¿ÏÎ¹ÏÎ¼ÎµÎ½");
+    
+    // -Ï,-Î±/-Î¾Ï,-Î¾Î±
+    checkOneTerm(a, "Î±Î½Î¿Î¯Î³Ï", "Î±Î½Î¿Î¹Î³");
+    checkOneTerm(a, "Î¬Î½Î¿Î¹Î³Î±", "Î±Î½Î¿Î¹Î³");
+    checkOneTerm(a, "Î¬Î½Î¿Î¹Î³Îµ", "Î±Î½Î¿Î¹Î³");
+    checkOneTerm(a, "Î±Î½Î¿Î¯Î³Î¿Î½ÏÎ±Ï", "Î±Î½Î¿Î¹Î³");
+    checkOneTerm(a, "Î±Î½Î¿Î¯Î³Î¿Î¼Î±Î¹", "Î±Î½Î¿Î¹Î³");
+    checkOneTerm(a, "Î±Î½Î¿Î¹Î³ÏÎ¼Î¿ÏÎ½", "Î±Î½Î¿Î¹Î³");
+    
+    checkOneTerm(a, "Î¬Î½Î¿Î¹Î¾Î±", "Î±Î½Î¿Î¹Î¾");
+    checkOneTerm(a, "Î±Î½Î¿Î¯Î¾Ï", "Î±Î½Î¿Î¹Î¾");
+    checkOneTerm(a, "Î¬Î½Î¿Î¹Î¾Îµ", "Î±Î½Î¿Î¹Î¾");
+    checkOneTerm(a, "Î±Î½Î¿Î¯Î¾ÎµÎ¹", "Î±Î½Î¿Î¹Î¾");
+    
+    checkOneTerm(a, "Î±Î½Î¿Î¯ÏÏÎ·ÎºÎ±", "Î±Î½Î¿Î¹ÏÏ");
+    checkOneTerm(a, "Î±Î½Î¿Î¹ÏÏÏ", "Î±Î½Î¿Î¹ÏÏ");
+    checkOneTerm(a, "Î±Î½Î¿Î¯ÏÏÎ·ÎºÎ±", "Î±Î½Î¿Î¹ÏÏ");
+    checkOneTerm(a, "Î±Î½Î¿Î¹ÏÏÎµÎ¯Ï", "Î±Î½Î¿Î¹ÏÏ");
+    checkOneTerm(a, "Î±Î½Î¿Î¹ÏÏÎµÎ¯", "Î±Î½Î¿Î¹ÏÏ");
+    
+    checkOneTerm(a, "Î±Î½Î¿Î¯Î¾Î¿Ï", "Î±Î½Î¿Î¹Î¾");
+    
+    //-Ï/-Î¬Ï,-Î¿ÏÏÎ±/-Î¬ÏÏ,-Î±ÏÎ±
+    checkOneTerm(a, "ÏÎµÏÎ½Ï", "ÏÎµÏÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ½Î¬Ï", "ÏÎµÏÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ½Î¿ÏÏÎ±", "ÏÎµÏÎ½");
+    checkOneTerm(a, "ÏÎÏÎ½Î±Î³Î±", "ÏÎµÏÎ½");
+    checkOneTerm(a, "ÏÎÏÎ½Î±", "ÏÎµÏÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ½ÏÎ½ÏÎ±Ï", "ÏÎµÏÎ½");
+    
+    checkOneTerm(a, "ÏÎÏÎ±ÏÎ±", "ÏÎµÏÎ±Ï");
+    checkOneTerm(a, "ÏÎµÏÎ¬ÏÏ", "ÏÎµÏÎ±Ï");
+    checkOneTerm(a, "ÏÎÏÎ±ÏÎµ", "ÏÎµÏÎ±Ï");
+    checkOneTerm(a, "ÏÎµÏÎ¬ÏÎµÎ¹", "ÏÎµÏÎ±Ï");
+    
+    checkOneTerm(a, "ÏÎµÏÎ½Î¹ÎÎ¼Î±Î¹", "ÏÎµÏÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ½Î¹ÏÎ¼Î¿ÏÎ½", "ÏÎµÏÎ½");
+   
+    checkOneTerm(a, "ÏÎµÏÎ¬ÏÏÎ·ÎºÎ±", "ÏÎµÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÏÏ", "ÏÎµÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÏÎµÎ¯Ï", "ÏÎµÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÏÎµÎ¯", "ÏÎµÏÎ±ÏÏ");
+
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÎ¼ÎÎ½Î¿", "ÏÎµÏÎ±ÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÎ¼ÎÎ½Î·", "ÏÎµÏÎ±ÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÎ¼ÎÎ½Î¿Ï", "ÏÎµÏÎ±ÏÎ¼ÎµÎ½");
+    
+    // -Ï/-Î¬Ï,-Î¿ÏÏÎ±/-Î¬Î¾Ï,-Î±Î¾Î±
+    checkOneTerm(a, "ÏÎµÏÏ", "ÏÎµÏ");
+    checkOneTerm(a, "ÏÎµÏÎ¬Ï", "ÏÎµÏ");
+    checkOneTerm(a, "ÏÎµÏÎ¿ÏÏÎ±", "ÏÎµÏ");
+    checkOneTerm(a, "ÏÎÏÎ±Î³Î±", "ÏÎµÏ");
+    checkOneTerm(a, "ÏÎÏÎ±", "ÏÎµÏ");
+    checkOneTerm(a, "ÏÎµÏÏÎ½ÏÎ±Ï", "ÏÎµÏ");
+    checkOneTerm(a, "ÏÎµÏÎ¹ÎÎ¼Î±Î¹", "ÏÎµÏ");
+    checkOneTerm(a, "ÏÎµÏÎ¹ÏÎ¼Î¿ÏÎ½", "ÏÎµÏ");
+    
+    checkOneTerm(a, "ÏÎÏÎ±Î¾Î±", "ÏÎµÏÎ±Î¾");
+    checkOneTerm(a, "ÏÎµÏÎ¬Î¾Ï", "ÏÎµÏÎ±Î¾");
+    checkOneTerm(a, "ÏÎÏÎ±Î¾Îµ", "ÏÎµÏÎ±Î¾");
+    checkOneTerm(a, "ÏÎµÏÎ¬Î¾ÎµÎ¹", "ÏÎµÏÎ±Î¾");
+
+    checkOneTerm(a, "ÏÎµÏÎ¬ÏÏÎ·ÎºÎ±", "ÏÎµÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÏÏ", "ÏÎµÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÏÎµÎ¯Ï", "ÏÎµÏÎ±ÏÏ");
+    checkOneTerm(a, "ÏÎµÏÎ±ÏÏÎµÎ¯", "ÏÎµÏÎ±ÏÏ");
+    
+    checkOneTerm(a, "ÏÎµÏÎ±Î¼ÎÎ½Î¿", "ÏÎµÏÎ±Î¼ÎµÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ±Î¼ÎÎ½Î·", "ÏÎµÏÎ±Î¼ÎµÎ½");
+    checkOneTerm(a, "ÏÎµÏÎ±Î¼ÎÎ½Î¿Ï", "ÏÎµÏÎ±Î¼ÎµÎ½");
+    
+    // -Ï/-Î¬Ï,-Î¿ÏÏÎ± / -ÎÏÏ,-ÎµÏÎ±
+    checkOneTerm(a, "ÎºÎ±Î»Ï", "ÎºÎ±Î»");
+    checkOneTerm(a, "ÎºÎ±Î»Î¿ÏÏÎ±", "ÎºÎ±Î»");
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÎ¯Ï", "ÎºÎ±Î»");
+    checkOneTerm(a, "ÎºÎ±Î»ÏÎ½ÏÎ±Ï", "ÎºÎ±Î»");
+    
+    checkOneTerm(a, "ÎºÎ±Î»Î¿ÏÎ¼Î±Î¹", "ÎºÎ±Î»");
+    // pass. imperfect /imp. progressive doesnt conflate
+    checkOneTerm(a, "ÎºÎ±Î»Î¿ÏÎ¼Î¿ÏÎ½", "ÎºÎ±Î»Î¿ÏÎ¼");
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÎ¯ÏÎ±Î¹", "ÎºÎ±Î»ÎµÎ¹ÏÎ±");
+    
+    checkOneTerm(a, "ÎºÎ±Î»ÎÏÏÎ·ÎºÎ±", "ÎºÎ±Î»ÎµÏÏ");
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÏÏÏ", "ÎºÎ±Î»ÎµÏÏ");
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÏÏÎµÎ¯Ï", "ÎºÎ±Î»ÎµÏÏ");
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÏÏÎµÎ¯", "ÎºÎ±Î»ÎµÏÏ");
+    
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÏÎ¼ÎÎ½Î¿", "ÎºÎ±Î»ÎµÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÏÎ¼ÎÎ½Î·", "ÎºÎ±Î»ÎµÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÎºÎ±Î»ÎµÏÎ¼ÎÎ½Î¿Ï", "ÎºÎ±Î»ÎµÏÎ¼ÎµÎ½");
+    
+    checkOneTerm(a, "ÏÎ¿ÏÏ", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÎ¬Ï", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÎ¿ÏÏÎ±", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÏÏÎ±Î³Î±", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÏÏÎ±", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÏÎ½ÏÎ±Ï", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÎ¹ÎÎ¼Î±Î¹", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÎ¹ÏÎ¼Î¿ÏÎ½", "ÏÎ¿Ï");
+    checkOneTerm(a, "ÏÎ¿ÏÎ¹ÎÏÎ±Î¹", "ÏÎ¿Ï");
+    
+    checkOneTerm(a, "ÏÏÏÎµÏÎ±", "ÏÎ¿ÏÎµÏ");
+    checkOneTerm(a, "ÏÎ¿ÏÎÏÏ", "ÏÎ¿ÏÎµÏ");
+    checkOneTerm(a, "ÏÏÏÎµÏÎµ", "ÏÎ¿ÏÎµÏ");
+    checkOneTerm(a, "ÏÎ¿ÏÎÏÎµÎ¹", "ÏÎ¿ÏÎµÏ");
+    
+    checkOneTerm(a, "ÏÎ¿ÏÎÎ¸Î·ÎºÎ±", "ÏÎ¿ÏÎµÎ¸");
+    checkOneTerm(a, "ÏÎ¿ÏÎµÎ¸Ï", "ÏÎ¿ÏÎµÎ¸");
+    checkOneTerm(a, "ÏÎ¿ÏÎµÎ¸ÎµÎ¯Ï", "ÏÎ¿ÏÎµÎ¸");
+    checkOneTerm(a, "ÏÎ¿ÏÎµÎ¸ÎµÎ¯", "ÏÎ¿ÏÎµÎ¸");
+    
+    checkOneTerm(a, "ÏÎ¿ÏÎµÎ¼ÎÎ½Î¿", "ÏÎ¿ÏÎµÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÏÎ¿ÏÎµÎ¼ÎÎ½Î·", "ÏÎ¿ÏÎµÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÏÎ¿ÏÎµÎ¼ÎÎ½Î¿Ï", "ÏÎ¿ÏÎµÎ¼ÎµÎ½");
+    
+    // -Ï/-Î¬Ï,-Î¿ÏÏÎ± / -Î®ÏÏ,-Î·ÏÎ±
+    checkOneTerm(a, "ÎºÏÎ±ÏÏ", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ¬Ï", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ¿ÏÏÎ±", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ¬ÏÎ±Î³Î±", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ¬ÏÎ±", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÏÎ½ÏÎ±Ï", "ÎºÏÎ±Ï");
+    
+    checkOneTerm(a, "ÎºÏÎ¬ÏÎ·ÏÎ±", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ®ÏÏ", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ¬ÏÎ·ÏÎµ", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ®ÏÎµÎ¹", "ÎºÏÎ±Ï");
+    
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ¿ÏÎ¼Î±Î¹", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ¹ÎÎ¼Î±Î¹", "ÎºÏÎ±Ï");
+    // this imperfect form doesnt conflate 
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ¿ÏÎ¼Î¿ÏÎ½", "ÎºÏÎ±ÏÎ¿ÏÎ¼");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ¹ÏÎ¼Î¿ÏÎ½", "ÎºÏÎ±Ï");
+    // this imp. prog form doesnt conflate
+    checkOneTerm(a, "ÎºÏÎ±ÏÎµÎ¯ÏÎ±Î¹", "ÎºÏÎ±ÏÎµÎ¹ÏÎ±");
+
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ®Î¸Î·ÎºÎ±", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ·Î¸Ï", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ·Î¸ÎµÎ¯Ï", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ·Î¸ÎµÎ¯", "ÎºÏÎ±Ï");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ®ÏÎ¿Ï", "ÎºÏÎ±Ï");
+    
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ·Î¼ÎÎ½Î¿", "ÎºÏÎ±ÏÎ·Î¼ÎµÎ½");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ·Î¼ÎÎ½Î·", "ÎºÏÎ±ÏÎ·Î¼ÎµÎ½");
+    checkOneTerm(a, "ÎºÏÎ±ÏÎ·Î¼ÎÎ½Î¿Ï", "ÎºÏÎ±ÏÎ·Î¼ÎµÎ½");
+    
+    // -.Î¼Î±Î¹,-.Î¼Î¿ÏÎ½ / -.Ï,-.Î·ÎºÎ±
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î¬Î¼Î±Î¹", "ÎºÎ¿Î¹Î¼");
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼ÏÎ¼Î¿ÏÎ½", "ÎºÎ¿Î¹Î¼");
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î¬ÏÎ±Î¹", "ÎºÎ¿Î¹Î¼");
+    
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î®Î¸Î·ÎºÎ±", "ÎºÎ¿Î¹Î¼");
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î·Î¸Ï", "ÎºÎ¿Î¹Î¼");
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î®ÏÎ¿Ï", "ÎºÎ¿Î¹Î¼");
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î·Î¸ÎµÎ¯", "ÎºÎ¿Î¹Î¼");
+    
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î¹ÏÎ¼ÎÎ½Î¿", "ÎºÎ¿Î¹Î¼Î¹ÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î¹ÏÎ¼ÎÎ½Î·", "ÎºÎ¿Î¹Î¼Î¹ÏÎ¼ÎµÎ½");
+    checkOneTerm(a, "ÎºÎ¿Î¹Î¼Î¹ÏÎ¼ÎÎ½Î¿Ï", "ÎºÎ¿Î¹Î¼Î¹ÏÎ¼ÎµÎ½");
+  }
+  
+  public void testExceptions() throws Exception {
+    checkOneTerm(a, "ÎºÎ±Î¸ÎµÏÏÏÏÎ±", "ÎºÎ±Î¸ÎµÏÏ");
+    checkOneTerm(a, "ÎºÎ±Î¸ÎµÏÏÏÏÎ¿Ï", "ÎºÎ±Î¸ÎµÏÏ");
+    checkOneTerm(a, "ÎºÎ±Î¸ÎµÏÏÏÏ", "ÎºÎ±Î¸ÎµÏÏ");
+    checkOneTerm(a, "ÎºÎ±Î¸ÎµÏÏÏÏÏÎ½", "ÎºÎ±Î¸ÎµÏÏ");
+    
+    checkOneTerm(a, "ÏÎ¿ÏÎ¼Îµ", "ÏÎ¿ÏÎ¼");
+    checkOneTerm(a, "ÏÎ¿ÏÎ¼", "ÏÎ¿ÏÎ¼");
+    
+    checkOneTerm(a, "ÏÏÎ¿ÏÎ±Î³ÎµÏ", "ÏÏÎ¿ÏÎ±Î³");
+    checkOneTerm(a, "ÏÏÎ¿ÏÎ±Î³", "ÏÏÎ¿ÏÎ±Î³");
+    
+    checkOneTerm(a, "ÎµÎ¼ÎµÏÎµ", "ÎµÎ¼ÎµÏ");
+    checkOneTerm(a, "ÎµÎ¼ÎµÏ", "ÎµÎ¼ÎµÏ");
+    
+    checkOneTerm(a, "Î±ÏÏÎ¿Î½ÏÎ±Ï", "Î±ÏÏÎ¿Î½Ï");
+    checkOneTerm(a, "Î±ÏÏÎ¿Î½ÏÏÎ½", "Î±ÏÏÎ¿Î½Ï");
+  }
+}

Propchange: lucene/dev/trunk/modules/analysis/common/src/test/org/apache/lucene/analysis/el/TestGreekStemmer.java
------------------------------------------------------------------------------
    svn:eol-style = native

Modified: lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekLowerCaseFilterFactory.java
URL: http://svn.apache.org/viewvc/lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekLowerCaseFilterFactory.java?rev=945090&r1=945089&r2=945090&view=diff
==============================================================================
--- lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekLowerCaseFilterFactory.java (original)
+++ lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekLowerCaseFilterFactory.java Mon May 17 11:28:04 2010
@@ -33,6 +33,7 @@ public class GreekLowerCaseFilterFactory
   @Override
   public void init(Map<String, String> args) {
     super.init(args);
+    assureMatchVersion();
     if (args.containsKey("charset"))
       throw new SolrException(ErrorCode.SERVER_ERROR,
           "The charset parameter is no longer supported.  "

Added: lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekStemFilterFactory.java
URL: http://svn.apache.org/viewvc/lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekStemFilterFactory.java?rev=945090&view=auto
==============================================================================
--- lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekStemFilterFactory.java (added)
+++ lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekStemFilterFactory.java Mon May 17 11:28:04 2010
@@ -0,0 +1,30 @@
+package org.apache.solr.analysis;
+
+/**
+ * Licensed to the Apache Software Foundation (ASF) under one or more
+ * contributor license agreements.  See the NOTICE file distributed with
+ * this work for additional information regarding copyright ownership.
+ * The ASF licenses this file to You under the Apache License, Version 2.0
+ * (the "License"); you may not use this file except in compliance with
+ * the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+import org.apache.lucene.analysis.TokenStream;
+import org.apache.lucene.analysis.el.GreekStemFilter;
+
+/** Factory for {@link GreekStemFilter} */
+public class GreekStemFilterFactory extends BaseTokenFilterFactory {
+
+  public TokenStream create(TokenStream input) {
+    return new GreekStemFilter(input);
+  }
+
+}

Propchange: lucene/dev/trunk/solr/src/java/org/apache/solr/analysis/GreekStemFilterFactory.java
------------------------------------------------------------------------------
    svn:eol-style = native

Modified: lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekLowerCaseFilterFactory.java
URL: http://svn.apache.org/viewvc/lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekLowerCaseFilterFactory.java?rev=945090&r1=945089&r2=945090&view=diff
==============================================================================
--- lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekLowerCaseFilterFactory.java (original)
+++ lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekLowerCaseFilterFactory.java Mon May 17 11:28:04 2010
@@ -31,10 +31,11 @@ public class TestGreekLowerCaseFilterFac
   /**
    * Ensure the filter actually lowercases (and a bit more) greek text.
    */
-  public void testStemming() throws Exception {
+  public void testNormalization() throws Exception {
     Reader reader = new StringReader("ÎÎ¬ÏÎ¿Ï ÎÎÎªÎÎ£");
     Tokenizer tokenizer = new WhitespaceTokenizer(DEFAULT_VERSION, reader);
     GreekLowerCaseFilterFactory factory = new GreekLowerCaseFilterFactory();
+    factory.init(DEFAULT_VERSION_PARAM);
     TokenStream stream = factory.create(tokenizer);
     assertTokenStreamContents(stream, new String[] { "Î¼Î±Î¹Î¿Ï", "Î¼Î±Î¹Î¿Ï" });
   }

Added: lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekStemFilterFactory.java
URL: http://svn.apache.org/viewvc/lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekStemFilterFactory.java?rev=945090&view=auto
==============================================================================
--- lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekStemFilterFactory.java (added)
+++ lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekStemFilterFactory.java Mon May 17 11:28:04 2010
@@ -0,0 +1,40 @@
+package org.apache.solr.analysis;
+
+import java.io.Reader;
+import java.io.StringReader;
+
+import org.apache.lucene.analysis.TokenStream;
+import org.apache.lucene.analysis.Tokenizer;
+import org.apache.lucene.analysis.WhitespaceTokenizer;
+import org.apache.lucene.analysis.el.GreekLowerCaseFilter;
+
+/**
+ * Licensed to the Apache Software Foundation (ASF) under one or more
+ * contributor license agreements.  See the NOTICE file distributed with
+ * this work for additional information regarding copyright ownership.
+ * The ASF licenses this file to You under the Apache License, Version 2.0
+ * (the "License"); you may not use this file except in compliance with
+ * the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+/**
+ * Simple tests to ensure the Greek stem filter factory is working.
+ */
+public class TestGreekStemFilterFactory extends BaseTokenTestCase {
+  public void testStemming() throws Exception {
+    Reader reader = new StringReader("Î¬Î½Î¸ÏÏÏÎ¿Ï");
+    Tokenizer tokenizer = new WhitespaceTokenizer(DEFAULT_VERSION, reader);
+    TokenStream normalized = new GreekLowerCaseFilter(DEFAULT_VERSION, tokenizer);
+    GreekStemFilterFactory factory = new GreekStemFilterFactory();
+    TokenStream stream = factory.create(normalized);
+    assertTokenStreamContents(stream, new String[] { "Î±Î½Î¸ÏÏÏ" });
+  }
+}

Propchange: lucene/dev/trunk/solr/src/test/org/apache/solr/analysis/TestGreekStemFilterFactory.java
------------------------------------------------------------------------------
    svn:eol-style = native