16 years ago · 431e2937a0
--- a/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Charset.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Charset.xml
@@ -43,7 +43,7 @@
 
				 
			
 
				         <para>
			
 
				             De qualquer modo, o analisador de texto padrão (que também é usado no analisador de
			
 
				-            consulta) utiliza ctype_alpha() para a sinalização de texto e consultas.
			
 
				+            consultas) utiliza ctype_alpha() para a separação de texto e consultas em tokens.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -99,8 +99,8 @@ Zend_Search_Lucene_Analysis_Analyzer::setDefault(
 
				 
			
 
				             <para>
			
 
				                 Isso pode exigir que você reconstrua o índice para ter os dados e as consultas de
			
 
				-                pesquisa no mesmo formato, caso contrário o motor de busca pode retornar conjuntos
			
 
				-                de resultados errados.
			
 
				+                pesquisas separados em tokens do mesmo formato, caso contrário o motor de busca pode
			
 
				+                retornar conjuntos de resultados errados.
			
 
				             </para>
			
 
				         </warning>
			
 
				 
			
--- a/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Extending.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Extending.xml
@@ -9,7 +9,7 @@
 
				 
			
 
				         <para>
			
 
				             A classe <classname>Zend_Search_Lucene_Analysis_Analyzer</classname> é usada pelo
			
 
				-            indexador para "tokenizar" campos de documentos de texto.
			
 
				+            indexador para separar em tokens os campos de texto do documento.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -19,13 +19,13 @@
 
				         </para>
			
 
				 
			
 
				         <para>
			
 
				-            Você pode estipular o seu próprio analisador de textos ou selecioná-lo dentre uma lista
			
 
				+            Você pode atribuir o seu próprio analisador de textos ou selecioná-lo dentre uma lista
			
 
				             de analisadores pré-definidos:
			
 
				             <classname>Zend_Search_Lucene_Analysis_Analyzer_Common_Text</classname> e
			
 
				             <classname>Zend_Search_Lucene_Analysis_Analyzer_Common_Text_CaseInsensitive</classname>
			
 
				-            (padrão). Ambos interpretam os "tokens" como sequencias de letras.
			
 
				+            (padrão). Ambos interpretam os tokens como sequências de letras.
			
 
				             <classname>Zend_Search_Lucene_Analysis_Analyzer_Common_Text_CaseInsensitive</classname>
			
 
				-            converte todos os "tokens" para caixa baixa.
			
 
				+            converte todos os tokens para minúsculas.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -44,14 +44,14 @@ $index->addDocument($doc);
 
				             projetada para ser um antepassado de todos os analisadores definidos pelo usuário. O
			
 
				             usuário só precisa definir os métodos <methodname>reset()</methodname> e
			
 
				             <methodname>nextToken()</methodname>, que receberá a string do membro $_input e
			
 
				-            retornará os "tokens" um por um (um valor <constant>NULL</constant> indica o fim do
			
 
				+            retornará os tokens um por um (um valor <constant>NULL</constant> indica o fim do
			
 
				             fluxo).
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
 
				             O método <methodname>nextToken()</methodname> deve chamar o método
			
 
				-            <methodname>normalize()</methodname> em cada "token". Isso te permite usar filtros de
			
 
				-            "token" junto com o seu analisador.
			
 
				+            <methodname>normalize()</methodname> em cada token. Isso te permite usar filtros de
			
 
				+            token junto com o seu analisador.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -63,8 +63,8 @@ $index->addDocument($doc);
 
				 
			
 
				                 <programlisting language="php"><![CDATA[
			
 
				 /**
			
 
				- * Here is a custom text analyser, which treats words with digits as
			
 
				- * one term
			
 
				+ * Aqui está um analisador de texto personalizado, que trata as palavras com
			
 
				+ * dígitos como um termo
			
 
				  */
			
 
				 
			
 
				 class My_Analyzer extends Zend_Search_Lucene_Analysis_Analyzer_Common
			
@@ -72,7 +72,7 @@ class My_Analyzer extends Zend_Search_Lucene_Analysis_Analyzer_Common
 
				     private $_position;
			
 
				 
			
 
				     /**
			
 
				-     * Reset token stream
			
 
				+     * Reinicia o fluxo do token
			
 
				      */
			
 
				     public function reset()
			
 
				     {
			
@@ -80,9 +80,9 @@ class My_Analyzer extends Zend_Search_Lucene_Analysis_Analyzer_Common
 
				     }
			
 
				 
			
 
				     /**
			
 
				-     * Tokenization stream API
			
 
				-     * Get next token
			
 
				-     * Returns null at the end of stream
			
 
				+     * API do fluxo de separação de tokens
			
 
				+     * Obtém o próximo token
			
 
				+     * Retorna null no final do fluxo
			
 
				      *
			
 
				      * @return Zend_Search_Lucene_Analysis_Token|null
			
 
				      */
			
@@ -93,7 +93,7 @@ class My_Analyzer extends Zend_Search_Lucene_Analysis_Analyzer_Common
 
				         }
			
 
				 
			
 
				         while ($this->_position < strlen($this->_input)) {
			
 
				-            // skip white space
			
 
				+            // ignora os espaços em branco
			
 
				             while ($this->_position < strlen($this->_input) &&
			
 
				                    !ctype_alnum( $this->_input[$this->_position] )) {
			
 
				                 $this->_position++;
			
@@ -101,13 +101,13 @@ class My_Analyzer extends Zend_Search_Lucene_Analysis_Analyzer_Common
 
				 
			
 
				             $termStartPosition = $this->_position;
			
 
				 
			
 
				-            // read token
			
 
				+            // lê o token
			
 
				             while ($this->_position < strlen($this->_input) &&
			
 
				                    ctype_alnum( $this->_input[$this->_position] )) {
			
 
				                 $this->_position++;
			
 
				             }
			
 
				 
			
 
				-            // Empty token, end of stream.
			
 
				+            // Token vazio, fim do fluxo.
			
 
				             if ($this->_position == $termStartPosition) {
			
 
				                 return null;
			
 
				             }
			
@@ -123,7 +123,7 @@ class My_Analyzer extends Zend_Search_Lucene_Analysis_Analyzer_Common
 
				             if ($token !== null) {
			
 
				                 return $token;
			
 
				             }
			
 
				-            // Continue if token is skipped
			
 
				+            // Continua se o token for ignorado
			
 
				         }
			
 
				 
			
 
				         return null;
			
--- a/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Overview.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Overview.xml
@@ -95,25 +95,26 @@
 
				         <programlisting language="php"><![CDATA[
			
 
				 $doc = new Zend_Search_Lucene_Document();
			
 
				 
			
 
				-// O campo não é marcado, mas é indexado e armazenado dentro do índice.
			
 
				+// O campo não é separado em tokens, mas é indexado e armazenado dentro do
			
 
				+// índice.
			
 
				 // Campos armazenados podem ser recuperados a partir do índice.
			
 
				 $doc->addField(Zend_Search_Lucene_Field::Keyword('doctype',
			
 
				                                                  'autogenerated'));
			
 
				 
			
 
				-// O campo não é marcado nem indexado, mas é armazenado no índice.
			
 
				+// O campo não é separado em tokens nem indexado, mas é armazenado no índice.
			
 
				 $doc->addField(Zend_Search_Lucene_Field::UnIndexed('created',
			
 
				                                                    time()));
			
 
				 
			
 
				-// O campo avaliado como string binária não é marcado nem indexado,
			
 
				+// O campo avaliado como string binária não é separado em tokens nem indexado,
			
 
				 // mas é armazenado no índice.
			
 
				 $doc->addField(Zend_Search_Lucene_Field::Binary('icon',
			
 
				                                                 $iconData));
			
 
				 
			
 
				-// O campo é marcado e indexado, e é armazenado no índice.
			
 
				+// O campo é separado em tokens e indexado, e é armazenado no índice.
			
 
				 $doc->addField(Zend_Search_Lucene_Field::Text('annotation',
			
 
				                                               'Document annotation text'));
			
 
				 
			
 
				-// O campo é marcado e indexado, mas não é armazenado no índice.
			
 
				+// O campo é separado em tokens e indexado, mas não é armazenado no índice.
			
 
				 $doc->addField(Zend_Search_Lucene_Field::UnStored('contents',
			
 
				                                                   'My document content'));
			
 
				 ]]></programlisting>
			
@@ -186,8 +187,8 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
 
				                 <para>
			
 
				                     Campos do tipo <code>Keyword</code> são armazenados e indexados, o que
			
 
				                     significa que eles podem ser pesquisados, bem como apresentados nos resultados
			
 
				-                    de busca. Eles não podem ser divididos em palavras separadas por marcação.
			
 
				-                    Campos de dados numerados geralmente os traduzem bem no
			
 
				+                    de busca. Eles não podem ser divididos em palavras separadas através da
			
 
				+                    separação por tokens. Campos de dados numerados geralmente os traduzem bem no
			
 
				                     <classname>Zend_Search_Lucene</classname>.
			
 
				                 </para>
			
 
				             </listitem>
			
@@ -203,8 +204,8 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
 
				 
			
 
				             <listitem>
			
 
				                 <para>
			
 
				-                    Campos do tipo <code>Binary</code> não são avaliados nem indexados, mas são
			
 
				-                    armazenados para serem retornados em resultados de pesquisas. Eles podem ser
			
 
				+                    Campos do tipo <code>Binary</code> não são separados em tokens nem indexados, mas
			
 
				+                    são armazenados para serem retornados em resultados de pesquisas. Eles podem ser
			
 
				                     usados para armazenar qualquer tipo de dado que possa ser codificados em uma
			
 
				                     string binária, por exemplo, um ícone.
			
 
				                 </para>
			
@@ -212,16 +213,17 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
 
				 
			
 
				             <listitem>
			
 
				                 <para>
			
 
				-                    Campos do tipo <code>Text</code> são armazenados, indexados e avaliados. Campos
			
 
				-                    texto são apropriados para conter informações que devam ser pesquisadas, bem
			
 
				-                    como retornadas por uma pesquisa, tais como descrições e títulos.
			
 
				+                    Campos do tipo <code>Text</code> são armazenados, indexados e separados em
			
 
				+                    tokens. Campos text são apropriados para conter informações que devam ser
			
 
				+                    pesquisadas, bem como retornadas por uma pesquisa, tais como descrições e
			
 
				+                    títulos.
			
 
				                 </para>
			
 
				             </listitem>
			
 
				 
			
 
				             <listitem>
			
 
				                 <para>
			
 
				-                    Campos do tipo <code>UnStored</code> são avaliados e indexados, mas não são
			
 
				-                    armazenados no índice. Grandes quantidades de texto são melhor indexadas
			
 
				+                    Campos do tipo <code>UnStored</code> são separados em tokens e indexados, mas
			
 
				+                    não são armazenados no índice. Grandes quantidades de texto são melhor indexadas
			
 
				                     utilizando este tipo de campo. Dados armazenados criam um extenso índice no
			
 
				                     disco, então se você necessitar pesquisar sem exibir estes dados, utilize um
			
 
				                     campo UnStored. Campos UnStored são úteis quando utilizamos um índice
			
@@ -240,7 +242,7 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
 
				                                 <entry>Tipo de Campo</entry>
			
 
				                                 <entry>Armazenado</entry>
			
 
				                                 <entry>Indexado</entry>
			
 
				-                                <entry>Marcado</entry>
			
 
				+                                <entry>Separado em Tokens</entry>
			
 
				                                 <entry>Binário</entry>
			
 
				                             </row>
			
 
				                         </thead>
			
@@ -324,8 +326,8 @@ $index->addDocument($doc);
 
				         </para>
			
 
				 
			
 
				         <para>
			
 
				-            O campo 'title' é na verdade o valor /html/head/title. É armazenado no índice, marcado
			
 
				-            e disponibilizado para pesquisa.
			
 
				+            O campo 'title' é na verdade o valor /html/head/title. É armazenado no índice, separado
			
 
				+            em tokens e disponibilizado para pesquisa.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -339,7 +341,7 @@ $index->addDocument($doc);
 
				             <classname>Zend_Search_Lucene_Document_Html</classname> também possuem um segundo
			
 
				             argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
			
 
				             é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
			
 
				-            corpo é marcado e indexado, mas não armazenado.
			
 
				+            corpo é separado em tokens e indexado, mas não armazenado.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -352,8 +354,8 @@ $index->addDocument($doc);
 
				         <para>
			
 
				             Outras meta tags do cabeçalho no documento produzem campos de documentos adicionais. O
			
 
				             campo 'name' é tirado do atributo 'name', e o atributo o 'content' preenche o campo
			
 
				-            'value'. Ambos são marcados, indexados e armazenados, então os documentos podem ser
			
 
				-            procurados pelas suas meta tags (por exemplo, por palavras-chave).
			
 
				+            'value'. Ambos são separados em tokens, indexados e armazenados, então os documentos
			
 
				+            podem ser procurados pelas suas meta tags (por exemplo, por palavras-chave).
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -478,7 +480,7 @@ $index->addDocument($doc);
 
				             <classname>Zend_Search_Lucene_Document_Docx</classname> também possui um segundo
			
 
				             argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
			
 
				             é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
			
 
				-            corpo é marcado e indexado, mas não armazenado.
			
 
				+            corpo é separado em tokens e indexado, mas não armazenado.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -579,7 +581,7 @@ $index->addDocument($doc);
 
				             <classname>Zend_Search_Lucene_Document_Pptx</classname> também possui um segundo
			
 
				             argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
			
 
				             é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
			
 
				-            corpo é marcado e indexado, mas não armazenado.
			
 
				+            corpo é separado em tokens e indexado, mas não armazenado.
			
 
				         </para>
			
 
				 
			
 
				         <para>
			
@@ -678,7 +680,7 @@ $index->addDocument($doc);
 
				             <classname>Zend_Search_Lucene_Document_Xlsx</classname> também possui um segundo
			
 
				             argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
			
 
				             é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
			
 
				-            corpo é marcado e indexado, mas não armazenado.
			
 
				+            corpo é separado em tokens e indexado, mas não armazenado.
			
 
				         </para>
			
 
				 
			
 
				         <para>