You are viewing a plain text version of this content. The canonical link for it is here.
Posted to commits@tika.apache.org by ta...@apache.org on 2016/02/19 21:25:14 UTC

[35/52] [partial] tika git commit: move test files to parser-modules

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/big-preamble.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/big-preamble.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/big-preamble.html
new file mode 100644
index 0000000..545addd
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/big-preamble.html
@@ -0,0 +1,827 @@
+<script language="javascript">
+
+function addToList(from,to)
+{
+    if(from.selectedIndex >= 0) {
+        isPresent = false;
+        var options=to.getElementsByTagName("option");
+
+        if(from.item(from.selectedIndex).value == "0") {
+            for(i=to.options.length-1; i>= 0; i--) {
+                to.removeChild(options[i]);
+            }
+        }
+        for (i=0; i< to.options.length; i++)
+        {
+            if(options[i].value == from.item(from.selectedIndex).value || options[i].value == "0")
+                isPresent = true;
+        }
+        if(!isPresent) {
+            var oOption = document.createElement("option");;
+            to.appendChild(oOption);
+            oOption.value = from.item(from.selectedIndex).value;
+            oOption.text  = from.item(from.selectedIndex).text;
+        }
+    }
+}
+
+function delFromList(to)
+{
+    if(to.selectedIndex >= 0) {
+      var options=to.getElementsByTagName("option");
+      to.removeChild(options[to.selectedIndex]);
+    }
+}
+
+function fillListToGet(form, to)
+{
+    var options=to.getElementsByTagName("option");
+    for (i=0; i< to.options.length; i++)
+    {
+        form.action += "&"+to.name+"="+options[i].value;
+    }
+}
+
+</script>
+<script language="javascript">
+
+function addToList(from,to)
+{
+    if(from.selectedIndex >= 0) {
+        isPresent = false;
+        var options=to.getElementsByTagName("option");
+
+        if(from.item(from.selectedIndex).value == "0") {
+            for(i=to.options.length-1; i>= 0; i--) {
+                to.removeChild(options[i]);
+            }
+        }
+        for (i=0; i< to.options.length; i++)
+        {
+            if(options[i].value == from.item(from.selectedIndex).value || options[i].value == "0")
+                isPresent = true;
+        }
+        if(!isPresent) {
+            var oOption = document.createElement("option");;
+            to.appendChild(oOption);
+            oOption.value = from.item(from.selectedIndex).value;
+            oOption.text  = from.item(from.selectedIndex).text;
+        }
+    }
+}
+
+function delFromList(to)
+{
+    if(to.selectedIndex >= 0) {
+      var options=to.getElementsByTagName("option");
+      to.removeChild(options[to.selectedIndex]);
+    }
+}
+
+function fillListToGet(form, to)
+{
+    var options=to.getElementsByTagName("option");
+    for (i=0; i< to.options.length; i++)
+    {
+        form.action += "&"+to.name+"="+options[i].value;
+    }
+}
+
+function fillOtherGet(form)
+{
+  if (document.all.price_from != "") {
+    form.action += "&price_from="+document.all.price_from.value;
+  }
+  if (document.all.price_to != "") {
+    form.action += "&price_to="+document.all.price_to.value;
+  }
+  if (document.all.square_from != "") {
+    form.action += "&square_from="+document.all.square_from.value;
+  }
+  if (document.all.square_to != "") {
+    form.action += "&square_to="+document.all.square_to.value;
+  }
+  if (document.all.MKAD != "") {
+    form.action += "&MKAD="+document.all.MKAD.value;
+  }
+}
+
+</script>
+<script language="javascript">
+
+function addToList(from,to)
+{
+    if(from.selectedIndex >= 0) {
+        isPresent = false;
+        var options=to.getElementsByTagName("option");
+
+        if(from.item(from.selectedIndex).value == "0") {
+            for(i=to.options.length-1; i>= 0; i--) {
+                to.removeChild(options[i]);
+            }
+        }
+        for (i=0; i< to.options.length; i++)
+        {
+            if(options[i].value == from.item(from.selectedIndex).value || options[i].value == "0")
+                isPresent = true;
+        }
+        if(!isPresent) {
+            var oOption = document.createElement("option");
+            to.appendChild(oOption);
+            oOption.value = from.item(from.selectedIndex).value;
+            oOption.text  = from.item(from.selectedIndex).text;
+        }
+    }
+}
+
+function delFromList(to)
+{
+    if(to.selectedIndex >= 0) {
+      var options=to.getElementsByTagName("option");
+      to.removeChild(options[to.selectedIndex]);
+    }
+}
+
+function fillListToGet(form, to)
+{
+    var options=to.getElementsByTagName("option");
+    for (i=0; i< to.options.length; i++)
+    {
+        form.action += "&"+to.name+"="+options[i].value;
+    }
+}
+
+function fillOtherGet(form)
+{
+  if (document.all.price_from != "") {
+    form.action += "&price_from="+document.all.price_from.value;
+  }
+  if (document.all.price_to != "") {
+    form.action += "&price_to="+document.all.price_to.value;
+  }
+  if (document.all.square_from != "") {
+    form.action += "&square_from="+document.all.square_from.value;
+  }
+  if (document.all.square_to != "") {
+    form.action += "&square_to="+document.all.square_to.value;
+  }
+  if (document.all.MKAD != "") {
+    form.action += "&MKAD="+document.all.MKAD.value;
+  }
+}
+
+</script>
+
+<html>
+<head>
+<title>������ �������, ����� ��������,  ������ ������ � ������. ������������ ������������. ������ �������� "���������-������������"
+
+</title>
+<link rel="SHORTCUT ICON" href="/favicon.ico" />
+<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
+<meta http-equiv="Content-Language" content="ru">
+<meta name="Keywords" content="��������� ������������, ������, �����, �����, ����, ��������,  �������,  ���������, �����, �������, �������, �������, ���, ������, �������, ������������, ����������, �������, ������������, ������, ������, ����">
+<meta name="Description" content="��������� ������������ "��������� ������������", "������� ����" ������. ������ � ������� ������������ � ����� ������������ � ������ � �����������: �������, ���������, ����������������, �������� � ������ ������� ���������, ��������, �������, ��������, ����, ����. ������ �������, ������, ���������. ����� ��������. ����� ������. ������ ����.">
+<meta http-equiv="description" content="��������� ������������ "��������� ������������", "������� ����" ������. ������ � ������� ������������ � ����� ������������ � ������ � �����������: �������, ���������, ����������������, �������� � ������ ������� ���������, ��������, �������, ��������, ����, ����. ������ �������, ������, ���������. ����� ��������. ����� ������. ������ ����.">
+<meta name="revisit" content="7 days">
+<meta name='yandex-verification' content='77a043af80883202' />
+
+<link rel="stylesheet" href="continent.css" type="text/css">
+</head>
+<body bgcolor="#FFFFFF" text="#000000" leftmargin="0" topmargin="0" marginwidth="0" marginheight="0">
+<table width="100%" border="0" cellspacing="0" cellpadding="0" height="100%">
+  <tr>
+    <td height="10"> 
+      <noindex><table width="100%" border="0" cellspacing="0" cellpadding="0">
+        <tr>
+          <td><a title="������ ������� ������� ������" href="/default.asp"><img src="imgs/logo2.gif" Alt="������ ������� �������, ������, ������, �������, ���������" width="205" height="68" style="margin-top:13px; margin-bottom:3px; margin-left:13px;" border=0></a></td>
+          <td align=center valign=bottom>
+          
+            <a href='http://office.realty-guide.ru/rot/?key=289' target=_blank><img src='/imgs/banners/ban32.gif' border=0 width=500 height=75></a>
+          
+          </td>
+        </tr>
+      </table></noindex>
+    </td>
+  </tr>
+  <tr>
+    <td valign="top" height="100%"> 
+      <table width="100%" border="0" cellspacing="0" cellpadding="0" height="100%">
+        <tr>
+          <td width="228" bgcolor="#546154" valign="top" align=center> 
+            <table width="100%" border="0" cellspacing="0" cellpadding="0" height=402>
+              <tr> 
+                <td height="147" background="imgs/hd_bg2.gif" valign="top"><img src="imgs/h_fl.jpg" width="202" height="136" style="margin-top: 10px; margin-left: 14px;" alt="������ ������� �������, ������, ������, �������, ���������"></td>
+              </tr>
+              <tr> 
+                <td height="255" valign="top">
+                  <OBJECT classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000"
+ codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,0,0"
+ WIDTH="228" HEIGHT="250" id="menu10" ALIGN="">
+ <PARAM NAME=movie VALUE="menu10.swf"> <PARAM NAME=quality VALUE=high> <PARAM NAME=bgcolor VALUE=#525E52> <EMBED src="menu10.swf" quality=high bgcolor=#525E52  WIDTH="228" HEIGHT="250" NAME="menu10" ALIGN=""
+ TYPE="application/x-shockwave-flash" PLUGINSPAGE="http://www.macromedia.com/go/getflashplayer"></EMBED>
+</OBJECT>
+                </td>
+              </tr>
+            </table>
+<a href="/kommvip.asp"><img width=169 height=114 src="/imgs/vipbanner3.gif" border=0 alt="� ������ ������� �� ������ ������������ �� ������������� ��� �������� �� ������ ������������ ������������: ������ ������, �������, ���������, ����, ����������, ��������� ���������� ���������� � �.�., ������������ ������� ��������� ������������ ������� � ���������� ���������-������������"></a>
+<br>
+<br>
+<a href="/arendavip.asp"><img width=169 height=114 src="/imgs/vipbanner_arenda.jpg" border=0 alt="� ������ ������� �� ������ ������������ �� ������������ ������������� �� ������ �����: ������ �������, ������ ���������, ������ ���, ������ ����� � �.�., ������������ ������� ��������� ������������ ������� � ���������� ���������-������������"></a>
+<br>
+<br>
+<noindex><a target=_blank title="���������� ������� ������" href="http://www.lagunadom.ru"><img width=169 height=114 src="/ban/ban_169_114.gif" border=0 alt="���������� ������� ������"></a></noindex>
+<br>
+<br>
+<br>
+<br>
+<noindex><!--a target=_blank title="������������� ����, ���������� ����, ����, ������������� ���, ���������� ��� - ��������-������� ���������� ����" href="http://www.nyelki.ru"><img width=169 height=94 src="/imgs/banner.jpg" border=0 alt="������������� ����, ���������� ����, ����, ������������� ���, ���������� ��� - ��������-������� ���������� ����"></a>
+<br>
+<br>
+<br>
+<br-->
+<!-- Yandex.Metrika -->
+<script src="//mc.yandex.ru/resource/watch.js" type="text/javascript"></script>
+<script type="text/javascript">
+try { var yaCounter177293 = new Ya.Metrika(177293); } catch(e){}
+</script>
+<noscript><div style="position: absolute;"><img src="//mc.yandex.ru/watch/177293" alt="" /></div></noscript>
+<!-- Yandex.Metrika -->
+<!--Rating@Mail.ru COUNTER--><script language="JavaScript" type="text/javascript"><!--
+d=document;var a='';a+=';r='+escape(d.referrer)
+js=10//--></script><script language="JavaScript1.1" type="text/javascript"><!--
+a+=';j='+navigator.javaEnabled()
+js=11//--></script><script language="JavaScript1.2" type="text/javascript"><!--
+s=screen;a+=';s='+s.width+'*'+s.height
+a+=';d='+(s.colorDepth?s.colorDepth:s.pixelDepth)
+js=12//--></script><script language="JavaScript1.3" type="text/javascript"><!--
+js=13//--></script><script language="JavaScript" type="text/javascript"><!--
+d.write('<a target=_blank href="http://top.mail.ru/jump?from=782596"'+
+' target=_top><img src="http://top.list.ru/counter'+
+'?id=782596;t=54;js='+js+a+';rand='+Math.random()+
+'" alt="�������@Mail.ru"'+' border=0 height=31 width=88/><\/a>')
+if(11<js)d.write('<'+'!-- ')//--></script><noscript><a
+target=_blank href="http://top.mail.ru/jump?from=782596"><img
+src="http://top.list.ru/counter?js=na;id=782596;t=54"
+border=0 height=31 width=88
+alt="�������@Mail.ru"/></a></noscript><script language="JavaScript" type="text/javascript"><!--
+if(11<js)d.write('--'+'>')//--></script><!--/COUNTER--></noindex>
+<br>
+ <br><br>
+          </td>
+          <td valign="top" bgcolor="#546154" height="100%"> 
+            <table width="100%" border="0" cellspacing="0" cellpadding="0" height="100%">
+              <tr>
+                <td height="4" background="imgs/hd_bg1.gif" align="right" valign="top" style="padding-right:13px; font-size:4px;">&nbsp;</td>
+              </tr>
+              <tr>
+                <td valign="top" style="padding-right:13px;" height="20" align=right background="imgs/hd_bg1n.gif">
+                  <table border=0 cellspacing=0 cellpadding=0 height=20>
+                  <tr>
+
+                    <td><img src="/imgs/tabl1_p.gif" height=20></td>
+                    <td valign=bottom background="/imgs/tabl2_p.gif"><div style="padding-bottom:2px;"><a style="color:#000000; text-decoration:none;" href="/basket.asp">�������</a></td>
+                    <td><img src="/imgs/tablr_pa.gif" height=20></td>
+                    <td valign=bottom background="/imgs/tabl2_a.gif"><div style="padding-bottom:2px; font-weight:bold; text-transform:uppercase;">���������-������������</div></div></td>
+                    <td><img src="/imgs/tabl3_a.gif" height=20></td>
+
+                  </tr>
+                  </table>
+                </td>
+              </tr>
+              <tr>
+                <td valign="top" style="padding-bottom:13px;padding-right:13px;" height="100%">
+
+<style>
+a:link {  color: #000000; text-decoration: none;}
+a:visited {  color: #000000; text-decoration: none;}
+a:active {  color: #000000; text-decoration: none;}
+a:hover {  color: #1FB21F; text-decoration: underline;}
+h2 { margin:0px; padding:0px; font-weight: normal; font-size: 8pt; text-decoration:none;}
+</style>
+<table width="100%" border="0" cellspacing="0" cellpadding="0" bgcolor=#FFFFFF>
+<tr>
+  <td valign=top align=left><img src="/imgs/fp2.gif" width=37 height=31></td>
+  <td valign=top align=right><img src="/imgs/fp1.gif" width=257 height=24></td>
+</tr>
+</table>
+<table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+<tr>
+  <td valign=top>
+    <table width="100%" border="0" cellspacing="1" cellpadding="0" bgcolor=#FFFFFF>
+    <tr>
+      <td width=12 valign=top><img src="/imgs/fp_li2.gif" width=8 height=15></td>
+      <td>
+        <h1>���������-������������:</h1>
+<p style="font-family:Times New Roman; font-size:14px; margin-top:10px; margin-bottom:0px;"><b>��������� ������������ "���������-������������"</b>, �������� � 1999 ����, ������������ ����� ������� �������������� �� ����� ������������ �. ������, ������� ������������ ������������ ������������ � �������������� ������ � ������� �������.</p>
+<p style="font-family:Times New Roman; font-size:14px; margin-top:10px; margin-bottom:0px;">�������� "<b>���������-������������</b>" ���������� ���������� ������ ������ ���� ������������ �������� "������ � ������ � �����������" �� �������� ������� � ������������ ��������������� ���������������� ����� � ������.</p>
+<p style="font-family:Times New Roman; font-size:14px; margin-top:10px; margin-bottom:0px;">�� ���������� ��������� <b>����������� ������</b>:</p>
+<ul style="font-family:Times New Roman; font-size:14px; margin-top:10px; margin-bottom:0px;">
+<li><b>������ � ������� ������������ ������������ � ������ � �����������</b>: �������, ���������, ����������������, �������� � ������ ������� ���������.
+<li><b>�������, ������ ������ � ������-�������</b>, ������ ������ �����, ������ ����� ��� ��������.
+<li><b>������ � ������� ����� ������������ � ������</b>: ��������, �������.
+<li><b>������ � ������� ���������� ������������ � �����������</b>: ��������, ����, ����.
+<li><b>����������� ������������� ������ �� ������ � �����-������� ����� � ������� ���������</b>.
+<li><b>���������� � ����������� �������������������� ����������</b>.
+<li><b>������������� ���������� �������������</b>.
+</ul>
+<br>&nbsp;
+      </td>
+    </tr>
+    </table>
+    <table width="100%" border="0" cellspacing="0"  style="padding-left:12px;" cellpadding="0" bgcolor=#FFFFFF>
+    <tr>
+      <td valign=top width=50%><h1 style="color:red">������ ����� ������������</h1></td>
+      <td valign=top width=50%><h1 style="color:red">������ ������������ ������������</h1></td>
+    </tr>
+    <tr>
+      <td valign=top><br><h1>������ ������� � ������</h1></td>
+      <td valign=top><br><h1>������ ������ � ���������</h1></td>
+    </tr>
+    <tr>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ������� � ������" border=0 class=img1 src="/imgs/fp_i1.jpg"></td>
+          <td valign=top class=fp_small>����� �������� � ������ ���� ��������� ������������ ������� ������ � �������. 150 ����������� ����� �������� ���������. ���� �� ������ ������� ����������� ������ ���.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ �������" href="arenda_all.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ �������</h2></a></div>
+            <a title="�������� � ������" href="arenda_dball.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ������ � ���������" border=0 class=img1 src="/imgs/fp_i2.jpg"></td>
+          <td valign=top class=fp_small>������ ������. ����� ������� ��������� � ������. ����� 2000 ��������� ������ � ������. 100 ����� ����������� ����� ���� ������ ����. ���� �� ������ ������ ����������� ��������. ���� ������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ ������" href="komm.asp?kommtype_id=1&kommtype_id=8"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ ������</h2></a></div>
+            <a title="����� � ������" href="komm_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������ � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+    </tr>
+    <tr>
+      <td valign=top><br><h1>������ ������ � ������</h1></td>
+      <td valign=top><br><h1>������ ������� � ������</h1></td>
+    </tr>
+    <tr>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ������ � ������" border=0 class=img1 src="/imgs/fp_i3.jpg"></td>
+          <td valign=top class=fp_small>������ ������ � ����� ������ ������ �� 1 ���� � �������� �������. � ��� ����� ����� ��������� � ������ ������� � ������������ ��������. ������ ����� �������? ������ �������� ������!</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ ������" href="arenda_all.asp?roomamount=-1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ ������</h2></a></div>
+            <a title="������� � ������" href="arenda_dball.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������ � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ������� � ������" border=0 class=img1 src="/imgs/fp_i4.jpg"></td>
+          <td valign=top class=fp_small>����� ����� � ������ ��� �����������. �� ����� ����� �� ������ ����� ��������� ����������� �� ������ ��������� ��������� � ��������. ���� �������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ �������" href="komm.asp?kommtype_id=2"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ �������</h2></a></div>
+            <a title="������ � ������" href="komm_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+    </tr>
+    <tr>
+      <td valign=top><br><h1>������ ������� �������. ���� �������.</h1></td>
+      <td valign=top><br><h1>������ ���������������� ���������</h1></td>
+    </tr>
+    <tr>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ������� �������" border=0 class=img1 src="/imgs/fp_i5.jpg"></td>
+          <td valign=top class=fp_small>��� ���, ��� ����� ����� ������� �������� ��� �������� � ������. � ��� �� ����� ����� 1000 �������� ������� ������������ � ������. ���� �������. ����� ������� ��������? �����������, �� �������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ �������" href="arenda_all.asp?elit=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ ������� �������</h2></a></div>
+            <a title="�������� � ������" href="arenda_dball.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������� ������� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ���������������� ���������" border=0 class=img1 src="/imgs/fp_i6.jpg"></td>
+          <td valign=top class=fp_small>��� ���, ��� ����� ����� ��� ����� ������������ � ������ ��� �����������. � ��� �� ���� �� ������ ����� ������� ����� ��������� ��� ������������ . ���� ���������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ �����������" href="komm.asp?kommtype_id=4"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ �����������</h2></a></div>
+            <a title="������������ � ������" href="komm_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ����������� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+    </tr>
+    <tr>
+      <td valign=top><br><h1>���������� ������ �������</h1></td>
+      <td valign=top><br><h1>������ ���������</h1></td>
+    </tr>
+    <tr>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="���������� ������ �������" border=0 class=img1 src="/imgs/fp_i7.jpg"></td>
+          <td valign=top class=fp_small>������ �������, ��������������� � ������ �������� ���������, ��������� ������������ ���������� ����� �������� � ������ ���������. ���� ������� � ���������� ������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ �������" href="arendaday_results.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� ���������� ������ �������</h2></a></div>
+            <a title="�������� � ������" href="arendaday_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������� � ���������� ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ���������" border=0 class=img1 src="/imgs/fp_i8.jpg"></td>
+          <td valign=top class=fp_small>��� ���, ��� ����� ����� ��� ����� �������. �� ���������� ������� ����� �������� ��������� � �������� � �������� ������� ������. ���� ���������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ ���������" href="komm.asp?kommtype_id=3"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ ���������</h2></a></div>
+            <a title="�������� � ������" href="komm_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ��������� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+    </tr>
+    <tr>
+      <td valign=top><br><h1>������ ��������� � ��� � �����������</h1></td>
+      <td valign=top><br><h1>������ ��������� ��� ��������� � ����</h1></td>
+    </tr>
+    <tr>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ��������� � ���" border=0 class=img1 src="/imgs/fp_i9.jpg"></td>
+          <td valign=top class=fp_small>���, ���� ���������� ������ �������� ��� ����������� ���� � �����������, ��������� ������������ ���������� ������� ����� ���������� ������������ . ����� ��� ����� ������� � ���� ��� ������. ����.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ ��������� ���" href="arenda_cottage.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� ������ ���������, ���</h2></a></div>
+            <a title="�������� ���� � ������" href="cottage_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ���������, ���, ����� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ���������� � ����" border=0 class=img1 src="/imgs/fp_i10.jpg"></td>
+          <td valign=top class=fp_small>������ ����� ��������� ��� ��������, ��� ��� ����. �� ���� ����� �� ������ ����� ����������� �� ������ ������������ ������������ ��� ������������ ������� � ����. ����� ��� ����� ��������, ����, ��� � ������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ ���������� ����" href="komm.asp?kommtype_id=5&kommtype_id=6"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ ����������, ����</h2></a></div>
+            <a title="��������� � ���� � ������" href="komm_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ���������� � ���� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+    </tr>
+    <tr>
+      <td valign=top><br><h1>���������� ������ ��������� � �����������</h1></td>
+      <td valign=top><br><h1>������ ��������� ���������� ����������</h1></td>
+    </tr>
+    <tr>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="���������� ������ ���������" border=0 class=img1 src="/imgs/fp_i13.jpg"></td>
+          <td valign=top class=fp_small>�� ������ �������� �������� ��� ��������� � ���������� ����? ���� ��������� ������������ ���������� ����� ������� ���������. ����  ���������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ ���������" href="arenda_cottageday.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� ���������� ������ ���������</h2></a></div>
+            <a title="�������� � ������" href="cottageday_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ��������� � ���������� ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+      <td valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������ ��������� ���������� ����������" border=0 class=img1 src="/imgs/fp_i15.jpg"></td>
+          <td valign=top class=fp_small>����� ��������� ���������� ����������. ������� ����������� ����� ��� � ������. ���� �� ������������ ������������ ����������� ���������. ����.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������ ���������" href="komm.asp?kommtype_id=7"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������ ��������� ���������� ����������</h2></a></div>
+            <a title="��������� � ������" href="komm_db.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ��������� ���������� ���������� � ������</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+    </tr>
+    <tr>
+      <td colspan=2 valign=top><br><h1 style="color:red">������� ������������ ������������</h1></td>
+    </tr>
+    <tr>
+      <td colspan=2 align=center valign=top>
+        <table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+        <tr>
+          <td valign=top width=60><img width=60 height=60 alt="������� ������������ ������������" border=0 class=img1 src="/imgs/fp_i14.jpg"></td>
+          <td valign=top class=fp_small>���� �� ������ ������ ��������� ��� �������: ����, �������, �����, ������������, �� �� ������ ������������ � ������������� �� ������� ������������ ������������ ��� ������� ���� ������ �� ������� ��������� � ������. ����-������� ������������ �� �������.</td>
+        </tr>
+        <tr>
+          <td colspan=2>
+            <a title="������� ������" href="kommP.asp?kommtype_id=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������� ������</h2></a></div>
+            <a title="������� �������" href="kommP.asp?kommtype_id=2"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������� �������</h2></a></div>
+            <a title="������� ���������" href="kommP.asp?kommtype_id=3"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������� ���������</h2></a></div>
+            <a title="������� ����������" href="kommP.asp?kommtype_id=5"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������� ����������</h2></a></div>
+            <a title="������� ����" href="kommP.asp?kommtype_id=6"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������� ����</h2></a></div>
+            <a title="������� �����������" href="kommP.asp?kommtype_id=4"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������� ���������������� ���������</h2></a></div>
+            <a title="������� ���������" href="kommP.asp?kommtype_id=7"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����������� �� ������� ���</h2></a></div>
+          </td>
+        </tr>
+        </table>
+      </td>
+    </tr>
+    </table>
+    <table width="100%" border="0" cellspacing="1" cellpadding="0" bgcolor=#FFFFFF>
+    <tr>
+      <td width=12 valign=top><img src="/imgs/fp_li2.gif" width=8 height=15></td>
+      <td>
+        <h1>������� ������������. ������:</h1>
+        <br>
+
+    <li><a href="/news.asp?id=69&curr=1"><h2>��������� �� ������ - ������� �������� ������������</h2></a>
+
+    <li><a href="/news.asp?id=68&curr=1"><h2>������ ��������!</h2></a>
+
+    <li><a href="/news.asp?id=67&curr=1"><h2>��� ������ ����������, ���� ����� ����������� �������� �������� �����?</h2></a>
+
+    <li><a href="/news.asp?id=66&curr=1"><h2>5 �������� ����� ������� �������� � ������</h2></a>
+
+    <li><a href="/news.asp?id=65&curr=1"><h2>���� ������� � ����������: ���� �������� � ���?</h2></a>
+
+    <li><a title="������� ������������" href="news.asp"><h2><b>������ ������� ������������...</b></h2></a>
+    <br>
+      </td>
+    </tr>
+    </table>
+  </td>
+  <td width=5>&nbsp;</td>
+  <td valign=top width=300>
+    <h1><img src="/imgs/fp_li2.gif" width=8 height=15> ����������� <font color=red>��� ��������</font>:</h1>
+    <br>
+
+
+<table cellspacing=0 cellpadding=0 border=0 width=100%>
+<tr>
+  <td width=1 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td>
+  <td valign=top width=100%  bgcolor=white>
+    <table cellspacing=1 cellpadding=3 border=0 width=100% style='margin-top:5px;'>
+    <tr>
+      <td width=1 valign=middle><img src='imgs/knop1.gif'></td>
+      <td class=text bgcolor=white valign=middle>
+          <a href="/arendaview_komm.asp?anketa_id=148110" class=menubig><b>������ ������</b></a>
+      </td>
+    </tr>
+    </table>
+    <table width=100% cellspacing=0 cellpadding=3 border=0>
+    <tr>
+      <td width=128 valign=top align=right nowrap>
+        <a href="/arendaview_komm.asp?anketa_id=148110"><img style="margin-right:11px; margin-left:5px;" width=9 height=100 src="/imgs/bez.gif" border=0><img class=img1 width=100 height=100 src="/imgs/Photos5/s_k_67491.jpg" border=0 alt="������ ������"></a>
+      </td>
+      <td valign=top nowrap style='padding-left:6px;'>
+        <a href='/arendaview_komm.asp?anketa_id=148110' style="color:#000000; text-decoration:none; font-size:11px;"><p class='viprow0'><b>���������� �.</b></p><p class='viprow'>7 �� �� ����</p><p class='viprow'>2100 - 2500 ��.�</b></p><p class='viprow'><b style='font-size:11px;'>130 $/��.�./���</b></p></a>
+      </td>
+    </tr>
+    </table>
+    &nbsp;
+  </td>
+</tr>
+<tr><td colspan=2 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td></tr>
+<tr><td colspan=2><img src='imgs/shadow1.gif'></td></tr>
+</table>
+    <br>
+
+
+<table cellspacing=0 cellpadding=0 border=0 width=300>
+<tr>
+  <td width=1 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td>
+  <td valign=top width=100%  bgcolor=white>
+    <table cellspacing=1 cellpadding=3 border=0 width=100% style='margin-top:5px;'>
+    <tr>
+      <td valign=top width=1 valign=middle><img src='imgs/knop1.gif'></td>
+      <td class=text bgcolor=white valign=middle>
+          <a href="/arendaview_kommp.asp?anketa_id=167792" class=menubig><b>������� �����</b></a>
+      </td>
+    </tr>
+    </table>
+    <table width=100% cellspacing=0 cellpadding=3 border=0>
+    <tr>
+      <td width=128 valign=top align=right nowrap>
+        <a href="/arendaview_kommp.asp?anketa_id=167792"><img style="margin-right:11px; margin-left:5px;" width=9 height=100 src="/imgs/bez.gif" border=0><img class=img1 width=100 height=100 src="/imgs/Photos5/s_kp_96026.jpg" border=0 alt="������� �����"></a>
+      </td>
+      <td valign=top nowrap style='padding-left:6px;'>
+        <a href='/arendaview_kommp.asp?anketa_id=167792' style="color:#000000; text-decoration:none; font-size:11px;"><p class='viprow0'><b>�. ���������� �������</b></p><p class='viprow'>918 ��.�</b></p><p class='viprow'><b style='font-size:11px;'>7&nbsp;344&nbsp;000 $</b></p></a>
+      </td>
+    </tr>
+    </table>
+    &nbsp;
+  </td>
+</tr>
+<tr><td colspan=2 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td></tr>
+<tr><td colspan=2><img src='imgs/shadow1.gif'></td></tr>
+</table>
+    <br>
+
+<table cellspacing=0 cellpadding=0 border=0 width=100%>
+<tr>
+  <td width=1 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td>
+  <td valign=top width=100%  bgcolor=white>
+    <table cellspacing=1 cellpadding=3 border=0 width=100% style='margin-top:5px;'>
+    <tr>
+      <td valign=top width=1 valign=middle><img src='imgs/knop1.gif'></td>
+      <td class=text bgcolor=white valign=middle>
+          <a href="/arendaview_all.asp?anketa_id=160328" class=menubig><b>������ 2-����. ��������</b></a>
+      </td>
+    </tr>
+    </table>
+    <table width=100% cellspacing=0 cellpadding=3 border=0>
+    <tr>
+      <td width=128 valign=top align=right nowrap>
+            <a href="/arendaview_all.asp?anketa_id=160328"><img style="margin-right:11px; margin-left:5px;" width=9 height=100 src="/imgs/bez.gif" border=0><img class=img1 width=100 height=100 src="/imgs/Photos1/s_ae_45253.jpg" border=0 alt="������ 2-����. ��������"></a>
+      </td>
+      <td valign=top nowrap style='padding-left:6px;'>
+        <a href='/arendaview_all.asp?anketa_id=160328' style="color:#000000; text-decoration:none; font-size:11px;"><p class='viprow0'><b>�. ��������</b></p><p class='viprow'>10 ����� ������ �� �����</p><p class='viprow'>��. ��������, ��� 25</p><p class='viprow'>����� ������� 60 ��.�</b></p><p class='viprow'><b style='font-size:11px;'>100 000 $/���</b></p></a>
+      </td>
+    </tr>
+    </table>
+    &nbsp;
+  </td>
+</tr>
+<tr><td colspan=2 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td></tr>
+<tr><td colspan=2><img src='imgs/shadow1.gif'></td></tr>
+</table>
+<br>
+
+
+<table cellspacing=0 cellpadding=0 border=0 width=100%>
+<tr>
+  <td width=1 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td>
+  <td valign=top width=100%  bgcolor=white>
+    <table cellspacing=1 cellpadding=3 border=0 width=100% style='margin-top:5px;'>
+    <tr>
+      <td valign=top width=1 valign=middle><img src='imgs/knop1.gif'></td>
+      <td class=text bgcolor=white valign=middle>
+          <a href="/arendaview_cottage.asp?anketa_id=1761" class=menubig><b>������ ��������</b></a>
+      </td>
+    </tr>
+    </table>
+    <table width=100% cellspacing=0 cellpadding=3 border=0>
+    <tr>
+      <td width=128 valign=top align=right nowrap>
+        <a href="/arendaview_cottage.asp?anketa_id=1761"><img style="margin-right:11px; margin-left:5px;" width=9 height=100 src="/imgs/bez.gif" border=0><img class=img1 width=100 height=100 src="/imgs/Photos61/vipcot1761.jpg" border=0 alt="������ ��������"></a>
+      </td>
+      <td valign=top nowrap style='padding-left:6px;'>
+        <a href='/arendaview_cottage.asp?anketa_id=1761' style="color:#000000; text-decoration:none; font-size:11px;"><p class='viprow0'><b>������������ �.</b></p><p class='viprow'>15 �� �� ����</p><p class='viprow'>520 ��.�</b></p><p class='viprow'><b style='font-size:11px;'>465 000 $/���</b></p></a>
+      </td>
+    </tr>
+    </table>
+    &nbsp;
+  </td>
+</tr>
+<tr><td colspan=2 bgcolor=#CFCFCF><img src='imgs/blank.gif' width=1 height=1></td></tr>
+<tr><td colspan=2><img src='imgs/shadow1.gif'></td></tr>
+</table>
+<br>
+
+    <div class=ns><a title="������ ������������" href="kommvip.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ��� ����������� �� ������ ������������ ������������ ��� ��������</h2></a></div>
+    <div class=ns><a title="������ ������������ " href="kommvipp.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ��� ����������� �� ������� ������������ ������������ ��� ��������</h2></a></div>
+    <div class=ns><a title="������ �������" href="arendavip.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ��� ����������� �� ������ ������� ��� ��������</h2></a></div>
+    <div class=ns><a title="������ ������� " href="arendacotvip.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ��� ����������� �� ������ ���������, ���, ����� ��� ��������</h2></a></div>
+    <br>
+    <h1><img src="/imgs/fp_li2.gif" width=8 height=15> �������� ������:</h1>
+    <p style="font-family:Times New Roman; font-size:12px; margin-top:10px; margin-bottom:0px;">
+    <b>����������</b> ������������, �������� ������� ��� ����� � ������, �� ������� ������ ������� ��� ����� ��������� �� �������� ��������. �� ������ �������� ������ ��� ��������� � ���� �� ��������.
+<br><i>������������ �� �������� ������ � ������� ������������ ���������</i>.
+</p>
+    <br>
+    <div class=ns><a target=_blank title="����� �������� " href="form_1.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ��������</h2></a></div>
+    <div class=ns><a target=_blank title="����� ������� " href="form_1.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������</h2></a></div>
+    <div class=ns><a target=_blank title="����� ������� ��������" href="form_1.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������� ��������</h2></a></div>
+    <div class=ns><a target=_blank title="����� �������� ���������" href="form_1day.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������� ���������</h2></a></div>
+    <div class=ns><a target=_blank title="����� ��������, ����, ����" href="form_5s.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������, ���, ����</h2></a></div>
+    <div class=ns><a target=_blank title="����� �����" href="form_1off.asp?kommtypeid=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ����</h2></a></div>
+    <div class=ns><a target=_blank title="����� ������ � ������������" href="form_1off.asp?kommtypeid=2&kommtypeid=4"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �����, ������������</h2></a></div>
+    <div class=ns nowrap><a target=_blank title="����� ��������" href="form_1off.asp?kommtypeid=3&kommtypeid=5&kommtypeid=6&kommtypeid=7"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������, ��������, ����</h2></a></div>
+    <div class=ns><a target=_blank title="������� ����" href="form_6s.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������� �������, ����, ���</h2></a></div>
+    <div class=ns><a target=_blank title="������� �����" href="form_1off.asp?kommtypeid=1&own_type=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������� ����</h2></a></div>
+    <div class=ns><a target=_blank title="������� ������" href="form_1off.asp?kommtypeid=2&kommtypeid=4&own_type=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������� �����, ������������</h2></a></div>
+    <div class=ns><a target=_blank title="������� ���������" href="form_1off.asp?kommtypeid=1&kommtypeid=2&kommtypeid=3&kommtypeid=4&kommtypeid=5&kommtypeid=6&kommtypeid=7&own_type=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������� ������� ���������</h2></a></div>
+    <br>
+    <p style="font-family:Times New Roman; font-size:12px; margin-top:10px; margin-bottom:0px;">
+    <b>��������.</b> ���� �� ������ ����� � ������ ��������, �������, ����, �����, �������... ���� ���� ��� ���������� ������� ������������, �������� ������ � �� ������� ��� ����� ��� ������ ��������� �������, ������� � � ����������� �����. �� ������ ������������ � ������������� �� ������ � ������� ������������ �� ����� �����. ���� ����������� ���������. ��� ������������ ���������
 ��� �������������� ��������� ������ �������������.
+<br><i>��������! �� �� ����� ����������, �� ��������� �������������� �����, �������� ��������� � ������� ���������, ������ ������������ �� ����� ������.</i>
+    </p>
+    <br>
+    <div class=ns><a target=_blank title="����� �������� " href="form_3.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ��������</h2></a></div>
+    <div class=ns><a target=_blank title="����� ������� " href="form_3.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������</h2></a></div>
+    <div class=ns><a target=_blank title="����� ������� �������� " href="form_3.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ������� ��������</h2></a></div>
+    <div class=ns><a target=_blank title="����� �������� ���������" href="form_3day.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������� ���������</h2></a></div>
+    <div class=ns><a target=_blank title="����� ����" href="form_5.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������, ���, ����</h2></a></div>
+    <div class=ns><a target=_blank title="����� ���� " href="form_3off.asp?kommtypeid=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� ����</h2></a></div>
+    <div class=ns><a target=_blank title="����� ����� " href="form_3off.asp?kommtypeid=2&kommtypeid=4"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �����, ������������</h2></a></div>
+    <div class=ns><a target=_blank title="����� ������� " href="form_3off.asp?kommtypeid=3&kommtypeid=5&kommtypeid=6&kommtypeid=7"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �������, ��������, ����</h2></a></div>
+    <div class=ns><a target=_blank title="������ �������, ���� " href="form_6.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������ �������, ����, ���</h2></a></div>
+    <div class=ns><a target=_blank title="������ ���� " href="form_3off.asp?kommtypeid=1&own_type=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������ ����</h2></a></div>
+    <div class=ns><a target=_blank title="������ ����� " href="form_3off.asp?kommtypeid=2&kommtypeid=4&own_type=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������ �����, ������������</h2></a></div>
+    <div class=ns><a target=_blank title="������ ��������� " href="form_3off.asp?kommtypeid=1&kommtypeid=2&kommtypeid=3&kommtypeid=4&kommtypeid=5&kommtypeid=6&kommtypeid=7&own_type=1"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������ ������� ���������</h2></a></div>
+    <br>
+    <h1><img src="/imgs/fp_li2.gif" width=8 height=15> ���������� ����� ���������� �� ������ ������������:</h1>
+    <br>
+    <div class=ns><a title="������ �������" href="freetables.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������ ������� � ������</h2></a></div>
+    <div class=ns><a title="������ ���������" href="freetables_komm.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������ ������� ���������</h2></a></div>
+    <div class=ns><a title="������ ��������� ���" href="freetables_cott.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ������ ���������, ���, �����</h2></a></div>
+    <br>
+    <h1><img src="/imgs/fp_li2.gif" width=8 height=15> ��������:</h1>
+    <br>
+    <div class=ns><a href="vakansii.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �� ������ ������������ ������������</h2></a></div>
+    <div class=ns><a href="vakansii.asp"><h2><img src="/imgs/fp_li.gif" width=4 height=9 border=0> ����� �� ������ ������� � ������</h2></a></div>
+    <br>
+  </td>
+</tr>
+</table>
+<table width="100%" border="0" cellspacing="5" cellpadding="0" bgcolor=#FFFFFF>
+<tr>
+  <td bgcolor="#FFFFFF" colspan=2 valign="top" style="padding-top: 5px; padding-right: 5px; padding-bottom: 5px; padding-left: 7px">
+    <br>
+<div align=center>
+<a style="font-size:10px;" href="/default.asp">�������</a> ::
+<a style="font-size:10px;" href="/arenda_results.asp">������ �����</a> ::  
+<a style="font-size:10px;" href="/prodaga.asp">�������/������� �����</a> ::  
+<a style="font-size:10px;" href="/komm.asp">������������ ������������</a> ::  
+<a style="font-size:10px;" href="/nedvvrossii.asp">������������ � ������</a> ::  
+<a style="font-size:10px;" href="/docs.asp">���������� ����������</a> ::  
+<a style="font-size:10px;" href="/zemuchastki.asp">��������� �������</a> ::  
+<a style="font-size:10px;" href="/vakansii.asp">��������</a> ::  
+<a style="font-size:10px;" href="/questions.asp">������� ��������</a> ::
+<a style="font-size:10px;" href="/info.asp">���������� ����������</a> ::  
+<a style="font-size:10px;" href="/freetables.asp">����� ���������� �� ������������</a> ::  
+<a style="font-size:10px;" href="/links.asp">������� ������</a> ::  
+<a style="font-size:10px;" href="/kontakty.asp">��������</a>
+</div> 
+
+  </td>
+</tr>
+</table>
+</td>
+              </tr>
+            </table>
+          </td>
+        </tr>
+      </table>
+    </td>
+  </tr>
+    <tr>
+    <td height="20" style="padding-left:13px; padding-right:13px;">
+<table width="100%" border="0" cellspacing="0" cellpadding="0">
+  <tr>
+    <td class=copy>
+    &copy; 2001 � 2009 <a title="�������� ������������" href="/">��������� ������������</a> "���������-������������", "������� ����" -  ������ �������, ������ ������, ������ ���������.<br>
+    ���.: +7 495 737-7019&nbsp;&nbsp;&nbsp;����: +7 495 231-7755&nbsp;&nbsp;&nbsp;E-mail: <a href="mailto:info1@makler.su" style="color:black">info1@makler.su</a><br>
+</td>
+  </tr>
+</table>
+    </td>
+  </tr>
+</table><script type="text/javascript">
+var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");
+document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E"));
+</script>
+<script type="text/javascript">
+try {
+var pageTracker = _gat._getTracker("UA-8971199-1");
+pageTracker._trackPageview();
+} catch(err) {}</script></body>
+</html>
+
+

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate-whitespace.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate-whitespace.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate-whitespace.html
new file mode 100644
index 0000000..bd38b89
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate-whitespace.html
@@ -0,0 +1,27 @@
+<?xml version="1.0" encoding="utf-8"?>
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
+        "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
+<head>
+        <meta http-equiv="content-type" content="text/html; charset=utf-8" />
+        <title>Title</title>
+</head>
+<body>
+
+<p>The following unordered list must contain whitespace between both items:
+<ul>
+ <li>item_a</li><li>item_b</li>
+</ul>
+Whitespace should not be added around elements like anchors, em or string etc. This
+breaks CJK: 有什<strong>么需</strong>要我帮你的?
+</p>
+
+<p>
+Here's another paragraph of text.
+This is the end of the text.
+</p>
+
+<p><a href="Footer.html">footer</a></p>
+
+</body>
+</html>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate.html
new file mode 100644
index 0000000..854ebcd
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/boilerplate.html
@@ -0,0 +1,41 @@
+<?xml version="1.0" encoding="utf-8"?>
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
+        "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
+<head>
+	<meta http-equiv="content-type" content="text/html; charset=utf-8" />
+	<title>Title</title>
+</head>
+<body>
+
+<table>
+	<tr>
+		<td>
+			<table>
+				<tr>
+					<td ><a href="Main.php">boilerplate</a></td>
+					<td ><a href="Main.php">text</a></td>
+				</tr>
+			</table>
+		</td>
+	</tr>
+</table>
+
+<p>This is the real meat of the page, 
+and represents the text we want. 
+It has lots of juicy content.
+
+We assume that it won't get filtered out.
+And that all of the lines will be in the
+output.
+</p>
+
+<p>
+Here's another paragraph of text.
+This is the end of the text.
+</p>
+
+<p><a href="Footer.html">footer</a></p>
+
+</body>
+</html>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/rsstest.rss
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/rsstest.rss b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/rsstest.rss
new file mode 100644
index 0000000..758f6a1
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/rsstest.rss
@@ -0,0 +1,36 @@
+<?xml version="1.0" encoding="ISO-8859-1" ?>
+<!--
+	Licensed to the Apache Software Foundation (ASF) under one or more
+	contributor license agreements.  See the NOTICE file distributed with
+	this work for additional information regarding copyright ownership.
+	The ASF licenses this file to You under the Apache License, Version 2.0
+	(the "License"); you may not use this file except in compliance with
+	the License.  You may obtain a copy of the License at
+	
+	http://www.apache.org/licenses/LICENSE-2.0
+	
+	Unless required by applicable law or agreed to in writing, software
+	distributed under the License is distributed on an "AS IS" BASIS,
+	WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+	See the License for the specific language governing permissions and
+	limitations under the License.
+-->
+<rss version="0.91">
+    <channel>
+      <title>TestChannel</title>
+      <link>http://test.channel.com/</link> 
+      <description>Sample RSS File for Junit test</description> 
+      <language>en-us</language>
+      
+      <item>
+        <title>Home Page of Chris Mattmann</title>
+        <link>http://www-scf.usc.edu/~mattmann/</link>
+        <description>Chris Mattmann's home page</description>
+      </item>
+      <item>
+        <title>Awesome Open Source Search Engine</title> 
+        <link>http://www.nutch.org/</link> 
+        <description>Yup, that's what it is</description> 
+      </item>
+   </channel>
+</rss>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testATOM.atom
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testATOM.atom b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testATOM.atom
new file mode 100644
index 0000000..dc0cd8d
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testATOM.atom
@@ -0,0 +1,27 @@
+<?xml version="1.0" encoding="utf-8"?>
+ 
+<feed xmlns="http://www.w3.org/2005/Atom">
+ 
+	<title>Test Atom Feed</title>
+	<subtitle>Sample Atom File for Junit test</subtitle>
+	<link href="http://example.org/feed/" rel="self" />
+	<link href="http://example.org/" />
+	<id>urn:uuid:60a76c80-d399-11d9-b91C-0003939e0af6</id>
+	<updated>2003-12-13T18:30:02Z</updated>
+ 
+ 
+	<entry>
+		<title>Atom-Powered Robots Run Amok</title>
+		<link href="http://example.org/2003/12/13/atom03" />
+		<link rel="alternate" type="text/html" href="http://example.org/2003/12/13/atom03.html"/>
+		<link rel="edit" href="http://example.org/2003/12/13/atom03/edit"/>
+		<id>urn:uuid:1225c695-cfb8-4ebb-aaaa-80da344efa6a</id>
+		<updated>2003-12-13T18:30:02Z</updated>
+		<summary>Some text.</summary>
+                <author>
+                      <name>John Doe</name>
+                      <email>johndoe@example.com</email>
+                </author>
+	</entry>
+ 
+</feed>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTML.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTML.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTML.html
new file mode 100644
index 0000000..5bbd4d8
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTML.html
@@ -0,0 +1,28 @@
+<!--
+ Licensed to the Apache Software Foundation (ASF) under one or more
+ contributor license agreements.  See the NOTICE file distributed with
+ this work for additional information regarding copyright ownership.
+ The ASF licenses this file to You under the Apache License, Version 2.0
+ (the "License"); you may not use this file except in compliance with
+ the License.  You may obtain a copy of the License at
+
+     http://www.apache.org/licenses/LICENSE-2.0
+
+ Unless required by applicable law or agreed to in writing, software
+ distributed under the License is distributed on an "AS IS" BASIS,
+ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ See the License for the specific language governing permissions and
+ limitations under the License.
+-->
+<html>
+	<head>
+        <title>Title : Test Indexation Html</title>
+        <meta name="Author" content="Tika Developers">
+        <meta name="ICBM" content="51.2312, -5.1987">
+        <meta http-equiv="refresh" content="5">
+    </head>
+	<body>
+		<h1><a name="test-anchor"></a>Test Indexation Html</h1>
+		<p><a href="http://www.apache.org/">Indexation</a> du fichier</p>
+	</body>
+</html>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_1.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_1.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_1.html
new file mode 100644
index 0000000..f28dbbe
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_1.html
@@ -0,0 +1,77 @@
+<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
+
+<head>
+<meta http-equiv=Content-Type content="text/html; charset=iso-8859-6">
+<meta name=Generator content="Microsoft Word 12 (filtered medium)">
+<style>
+<!--
+ /* Font Definitions */
+ @font-face
+	{font-family:"Cambria Math";
+	panose-1:0 0 0 0 0 0 0 0 0 0;}
+@font-face
+	{font-family:Calibri;
+	panose-1:2 15 5 2 2 2 4 3 2 4;}
+@font-face
+	{font-family:"Arabic Transparent";
+	panose-1:2 1 0 0 0 0 0 0 0 0;}
+ /* Style Definitions */
+ p.MsoNormal, li.MsoNormal, div.MsoNormal
+	{margin-top:0in;
+	margin-right:0in;
+	margin-bottom:10.0pt;
+	margin-left:0in;
+	line-height:115%;
+	font-size:11.0pt;
+	font-family:"Calibri","sans-serif";}
+a:link, span.MsoHyperlink
+	{mso-style-priority:99;
+	color:blue;
+	text-decoration:underline;}
+a:visited, span.MsoHyperlinkFollowed
+	{mso-style-priority:99;
+	color:purple;
+	text-decoration:underline;}
+span.EmailStyle17
+	{mso-style-type:personal-compose;
+	font-family:"Calibri","sans-serif";
+	color:windowtext;}
+.MsoChpDefault
+	{mso-style-type:export-only;}
+@page Section1
+	{size:8.5in 11.0in;
+	margin:1.0in 1.0in 1.0in 1.0in;}
+div.Section1
+	{page:Section1;}
+-->
+</style>
+<!--[if gte mso 9]><xml>
+ <o:shapedefaults v:ext="edit" spidmax="1026" />
+</xml><![endif]--><!--[if gte mso 9]><xml>
+ <o:shapelayout v:ext="edit">
+  <o:idmap v:ext="edit" data="1" />
+ </o:shapelayout></xml><![endif]-->
+</head>
+
+<body lang=EN-US link=blue vlink=purple>
+
+<div class=Section1>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+dir=LTR style='font-size:12.0pt;color:red'><o:p>&nbsp;</o:p></span></p>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+lang=AR-SA style='font-size:12.0pt;font-family:"Arabic Transparent"'>�����
+������� �������� ����� �� &quot;���� ���� ������ ��� ������� ������� ����
+�������&quot;� ���� &quot;������ �� ��������� ��� �������� ������� ������ ��
+������ ������ ������ ������ �� ���&quot;.<o:p></o:p></span></p>
+
+<p class=MsoNormal><o:p>&nbsp;</o:p></p>
+
+</div>
+
+</body>
+
+</html>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_2.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_2.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_2.html
new file mode 100644
index 0000000..f28dbbe
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_2.html
@@ -0,0 +1,77 @@
+<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
+
+<head>
+<meta http-equiv=Content-Type content="text/html; charset=iso-8859-6">
+<meta name=Generator content="Microsoft Word 12 (filtered medium)">
+<style>
+<!--
+ /* Font Definitions */
+ @font-face
+	{font-family:"Cambria Math";
+	panose-1:0 0 0 0 0 0 0 0 0 0;}
+@font-face
+	{font-family:Calibri;
+	panose-1:2 15 5 2 2 2 4 3 2 4;}
+@font-face
+	{font-family:"Arabic Transparent";
+	panose-1:2 1 0 0 0 0 0 0 0 0;}
+ /* Style Definitions */
+ p.MsoNormal, li.MsoNormal, div.MsoNormal
+	{margin-top:0in;
+	margin-right:0in;
+	margin-bottom:10.0pt;
+	margin-left:0in;
+	line-height:115%;
+	font-size:11.0pt;
+	font-family:"Calibri","sans-serif";}
+a:link, span.MsoHyperlink
+	{mso-style-priority:99;
+	color:blue;
+	text-decoration:underline;}
+a:visited, span.MsoHyperlinkFollowed
+	{mso-style-priority:99;
+	color:purple;
+	text-decoration:underline;}
+span.EmailStyle17
+	{mso-style-type:personal-compose;
+	font-family:"Calibri","sans-serif";
+	color:windowtext;}
+.MsoChpDefault
+	{mso-style-type:export-only;}
+@page Section1
+	{size:8.5in 11.0in;
+	margin:1.0in 1.0in 1.0in 1.0in;}
+div.Section1
+	{page:Section1;}
+-->
+</style>
+<!--[if gte mso 9]><xml>
+ <o:shapedefaults v:ext="edit" spidmax="1026" />
+</xml><![endif]--><!--[if gte mso 9]><xml>
+ <o:shapelayout v:ext="edit">
+  <o:idmap v:ext="edit" data="1" />
+ </o:shapelayout></xml><![endif]-->
+</head>
+
+<body lang=EN-US link=blue vlink=purple>
+
+<div class=Section1>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+dir=LTR style='font-size:12.0pt;color:red'><o:p>&nbsp;</o:p></span></p>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+lang=AR-SA style='font-size:12.0pt;font-family:"Arabic Transparent"'>�����
+������� �������� ����� �� &quot;���� ���� ������ ��� ������� ������� ����
+�������&quot;� ���� &quot;������ �� ��������� ��� �������� ������� ������ ��
+������ ������ ������ ������ �� ���&quot;.<o:p></o:p></span></p>
+
+<p class=MsoNormal><o:p>&nbsp;</o:p></p>
+
+</div>
+
+</body>
+
+</html>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_3.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_3.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_3.html
new file mode 100644
index 0000000..f5c5927
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_3.html
@@ -0,0 +1,77 @@
+<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
+
+<head>
+<meta content=text/html; charset = iso-8859-6 http-equiv=Content-Type>
+<meta name=Generator content="Microsoft Word 12 (filtered medium)">
+<style>
+<!--
+ /* Font Definitions */
+ @font-face
+	{font-family:"Cambria Math";
+	panose-1:0 0 0 0 0 0 0 0 0 0;}
+@font-face
+	{font-family:Calibri;
+	panose-1:2 15 5 2 2 2 4 3 2 4;}
+@font-face
+	{font-family:"Arabic Transparent";
+	panose-1:2 1 0 0 0 0 0 0 0 0;}
+ /* Style Definitions */
+ p.MsoNormal, li.MsoNormal, div.MsoNormal
+	{margin-top:0in;
+	margin-right:0in;
+	margin-bottom:10.0pt;
+	margin-left:0in;
+	line-height:115%;
+	font-size:11.0pt;
+	font-family:"Calibri","sans-serif";}
+a:link, span.MsoHyperlink
+	{mso-style-priority:99;
+	color:blue;
+	text-decoration:underline;}
+a:visited, span.MsoHyperlinkFollowed
+	{mso-style-priority:99;
+	color:purple;
+	text-decoration:underline;}
+span.EmailStyle17
+	{mso-style-type:personal-compose;
+	font-family:"Calibri","sans-serif";
+	color:windowtext;}
+.MsoChpDefault
+	{mso-style-type:export-only;}
+@page Section1
+	{size:8.5in 11.0in;
+	margin:1.0in 1.0in 1.0in 1.0in;}
+div.Section1
+	{page:Section1;}
+-->
+</style>
+<!--[if gte mso 9]><xml>
+ <o:shapedefaults v:ext="edit" spidmax="1026" />
+</xml><![endif]--><!--[if gte mso 9]><xml>
+ <o:shapelayout v:ext="edit">
+  <o:idmap v:ext="edit" data="1" />
+ </o:shapelayout></xml><![endif]-->
+</head>
+
+<body lang=EN-US link=blue vlink=purple>
+
+<div class=Section1>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+dir=LTR style='font-size:12.0pt;color:red'><o:p>&nbsp;</o:p></span></p>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+lang=AR-SA style='font-size:12.0pt;font-family:"Arabic Transparent"'>�����
+������� �������� ����� �� &quot;���� ���� ������ ��� ������� ������� ����
+�������&quot;� ���� &quot;������ �� ��������� ��� �������� ������� ������ ��
+������ ������ ������ ������ �� ���&quot;.<o:p></o:p></span></p>
+
+<p class=MsoNormal><o:p>&nbsp;</o:p></p>
+
+</div>
+
+</body>
+
+</html>

http://git-wip-us.apache.org/repos/asf/tika/blob/38916f89/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_4.html
----------------------------------------------------------------------
diff --git a/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_4.html b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_4.html
new file mode 100644
index 0000000..f5c5927
--- /dev/null
+++ b/tika-parser-modules/tika-parser-web-module/src/test/resources/test-documents/testHTMLNoisyMetaEncoding_4.html
@@ -0,0 +1,77 @@
+<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
+
+<head>
+<meta content=text/html; charset = iso-8859-6 http-equiv=Content-Type>
+<meta name=Generator content="Microsoft Word 12 (filtered medium)">
+<style>
+<!--
+ /* Font Definitions */
+ @font-face
+	{font-family:"Cambria Math";
+	panose-1:0 0 0 0 0 0 0 0 0 0;}
+@font-face
+	{font-family:Calibri;
+	panose-1:2 15 5 2 2 2 4 3 2 4;}
+@font-face
+	{font-family:"Arabic Transparent";
+	panose-1:2 1 0 0 0 0 0 0 0 0;}
+ /* Style Definitions */
+ p.MsoNormal, li.MsoNormal, div.MsoNormal
+	{margin-top:0in;
+	margin-right:0in;
+	margin-bottom:10.0pt;
+	margin-left:0in;
+	line-height:115%;
+	font-size:11.0pt;
+	font-family:"Calibri","sans-serif";}
+a:link, span.MsoHyperlink
+	{mso-style-priority:99;
+	color:blue;
+	text-decoration:underline;}
+a:visited, span.MsoHyperlinkFollowed
+	{mso-style-priority:99;
+	color:purple;
+	text-decoration:underline;}
+span.EmailStyle17
+	{mso-style-type:personal-compose;
+	font-family:"Calibri","sans-serif";
+	color:windowtext;}
+.MsoChpDefault
+	{mso-style-type:export-only;}
+@page Section1
+	{size:8.5in 11.0in;
+	margin:1.0in 1.0in 1.0in 1.0in;}
+div.Section1
+	{page:Section1;}
+-->
+</style>
+<!--[if gte mso 9]><xml>
+ <o:shapedefaults v:ext="edit" spidmax="1026" />
+</xml><![endif]--><!--[if gte mso 9]><xml>
+ <o:shapelayout v:ext="edit">
+  <o:idmap v:ext="edit" data="1" />
+ </o:shapelayout></xml><![endif]-->
+</head>
+
+<body lang=EN-US link=blue vlink=purple>
+
+<div class=Section1>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+dir=LTR style='font-size:12.0pt;color:red'><o:p>&nbsp;</o:p></span></p>
+
+<p class=MsoNormal dir=RTL style='mso-margin-top-alt:auto;mso-margin-bottom-alt:
+auto;text-align:right;line-height:normal;direction:rtl;unicode-bidi:embed'><span
+lang=AR-SA style='font-size:12.0pt;font-family:"Arabic Transparent"'>�����
+������� �������� ����� �� &quot;���� ���� ������ ��� ������� ������� ����
+�������&quot;� ���� &quot;������ �� ��������� ��� �������� ������� ������ ��
+������ ������ ������ ������ �� ���&quot;.<o:p></o:p></span></p>
+
+<p class=MsoNormal><o:p>&nbsp;</o:p></p>
+
+</div>
+
+</body>
+
+</html>