|
|
@@ -138,26 +138,27 @@ Zend_Search_Lucene_Analysis_Analyzer::setDefault(
|
|
|
</sect2>
|
|
|
|
|
|
<sect2 id="zend.search.lucene.extending.filters">
|
|
|
- <title>Tokens Filtering</title>
|
|
|
+ <title>Filtragem de Tokens</title>
|
|
|
|
|
|
<para>
|
|
|
- The <classname>Zend_Search_Lucene_Analysis_Analyzer_Common</classname> analyzer also
|
|
|
- offers a token filtering mechanism.
|
|
|
+ O analisador <classname>Zend_Search_Lucene_Analysis_Analyzer_Common</classname> também
|
|
|
+ oferece um mecanismo de filtragem de token.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
- The <classname>Zend_Search_Lucene_Analysis_TokenFilter</classname> class provides an
|
|
|
- abstract interface for such filters. Your own filters should extend this class either
|
|
|
- directly or indirectly.
|
|
|
+ A classe <classname>Zend_Search_Lucene_Analysis_TokenFilter</classname> fornece uma
|
|
|
+ interface abstrata para estes filtros. Seus próprios filtros devem estender esta classe,
|
|
|
+ diretamente ou indiretamente.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
- Any custom filter must implement the <methodname>normalize()</methodname> method which
|
|
|
- may transform input token or signal that the current token should be skipped.
|
|
|
+ Qualquer filtro personalizado deve implementar o método
|
|
|
+ <methodname>normalize()</methodname> que pode transformar o token de entrada ou
|
|
|
+ sinalizar que o token corrente deve ser ignorado.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
- There are three filters already defined in the analysis subpackage:
|
|
|
+ Aí estão três filtros já definidos no subpacote de análise:
|
|
|
|
|
|
<itemizedlist>
|
|
|
<listitem>
|
|
|
@@ -181,14 +182,14 @@ Zend_Search_Lucene_Analysis_Analyzer::setDefault(
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
- The <code>LowerCase</code> filter is already used for
|
|
|
+ O filtro <code>LowerCase</code> já é utilizado pelo analisador
|
|
|
<classname>Zend_Search_Lucene_Analysis_Analyzer_Common_Text_CaseInsensitive</classname>
|
|
|
- analyzer by default.
|
|
|
+ por padrão.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
- The <code>ShortWords</code> and <code>StopWords</code> filters may be used with
|
|
|
- pre-defined or custom analyzers like this:
|
|
|
+ Os filtros <code>ShortWords</code> e <code>StopWords</code> podem ser utilizados com
|
|
|
+ analisadores pré-definidos ou personalizados desta forma:
|
|
|
</para>
|
|
|
|
|
|
<programlisting language="php"><![CDATA[
|
|
|
@@ -214,8 +215,9 @@ Zend_Search_Lucene_Analysis_Analyzer::setDefault($analyzer);
|
|
|
]]></programlisting>
|
|
|
|
|
|
<para>
|
|
|
- The <classname>Zend_Search_Lucene_Analysis_TokenFilter_StopWords</classname> constructor
|
|
|
- takes an array of stop-words as an input. But stop-words may be also loaded from a file:
|
|
|
+ O construtor <classname>Zend_Search_Lucene_Analysis_TokenFilter_StopWords</classname>
|
|
|
+ recebe uma matriz de stop-words como uma entrada. Mas as stop-words podem também ser
|
|
|
+ carregadas a partir de um arquivo:
|
|
|
</para>
|
|
|
|
|
|
<programlisting language="php"><![CDATA[
|
|
|
@@ -230,14 +232,14 @@ Zend_Search_Lucene_Analysis_Analyzer::setDefault($analyzer);
|
|
|
]]></programlisting>
|
|
|
|
|
|
<para>
|
|
|
- This file should be a common text file with one word in each line. The '#' character
|
|
|
- marks a line as a comment.
|
|
|
+ Este arquivo deve ser um arquivo de texto comum com uma palavra em cada linha. O
|
|
|
+ caractere '#' marca uma linha como um comentário.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
- The <classname>Zend_Search_Lucene_Analysis_TokenFilter_ShortWords</classname>
|
|
|
- constructor has one optional argument. This is the word length limit, set by default to
|
|
|
- 2.
|
|
|
+ O construtor <classname>Zend_Search_Lucene_Analysis_TokenFilter_ShortWords</classname> é
|
|
|
+ um argumento opcional. Este é o limite do comprimento de palavra, definido por padrão
|
|
|
+ para 2.
|
|
|
</para>
|
|
|
</sect2>
|
|
|
|