|
|
@@ -95,25 +95,26 @@
|
|
|
<programlisting language="php"><![CDATA[
|
|
|
$doc = new Zend_Search_Lucene_Document();
|
|
|
|
|
|
-// O campo não é marcado, mas é indexado e armazenado dentro do índice.
|
|
|
+// O campo não é separado em tokens, mas é indexado e armazenado dentro do
|
|
|
+// índice.
|
|
|
// Campos armazenados podem ser recuperados a partir do índice.
|
|
|
$doc->addField(Zend_Search_Lucene_Field::Keyword('doctype',
|
|
|
'autogenerated'));
|
|
|
|
|
|
-// O campo não é marcado nem indexado, mas é armazenado no índice.
|
|
|
+// O campo não é separado em tokens nem indexado, mas é armazenado no índice.
|
|
|
$doc->addField(Zend_Search_Lucene_Field::UnIndexed('created',
|
|
|
time()));
|
|
|
|
|
|
-// O campo avaliado como string binária não é marcado nem indexado,
|
|
|
+// O campo avaliado como string binária não é separado em tokens nem indexado,
|
|
|
// mas é armazenado no índice.
|
|
|
$doc->addField(Zend_Search_Lucene_Field::Binary('icon',
|
|
|
$iconData));
|
|
|
|
|
|
-// O campo é marcado e indexado, e é armazenado no índice.
|
|
|
+// O campo é separado em tokens e indexado, e é armazenado no índice.
|
|
|
$doc->addField(Zend_Search_Lucene_Field::Text('annotation',
|
|
|
'Document annotation text'));
|
|
|
|
|
|
-// O campo é marcado e indexado, mas não é armazenado no índice.
|
|
|
+// O campo é separado em tokens e indexado, mas não é armazenado no índice.
|
|
|
$doc->addField(Zend_Search_Lucene_Field::UnStored('contents',
|
|
|
'My document content'));
|
|
|
]]></programlisting>
|
|
|
@@ -186,8 +187,8 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
|
|
|
<para>
|
|
|
Campos do tipo <code>Keyword</code> são armazenados e indexados, o que
|
|
|
significa que eles podem ser pesquisados, bem como apresentados nos resultados
|
|
|
- de busca. Eles não podem ser divididos em palavras separadas por marcação.
|
|
|
- Campos de dados numerados geralmente os traduzem bem no
|
|
|
+ de busca. Eles não podem ser divididos em palavras separadas através da
|
|
|
+ separação por tokens. Campos de dados numerados geralmente os traduzem bem no
|
|
|
<classname>Zend_Search_Lucene</classname>.
|
|
|
</para>
|
|
|
</listitem>
|
|
|
@@ -203,8 +204,8 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
|
|
|
|
|
|
<listitem>
|
|
|
<para>
|
|
|
- Campos do tipo <code>Binary</code> não são avaliados nem indexados, mas são
|
|
|
- armazenados para serem retornados em resultados de pesquisas. Eles podem ser
|
|
|
+ Campos do tipo <code>Binary</code> não são separados em tokens nem indexados, mas
|
|
|
+ são armazenados para serem retornados em resultados de pesquisas. Eles podem ser
|
|
|
usados para armazenar qualquer tipo de dado que possa ser codificados em uma
|
|
|
string binária, por exemplo, um ícone.
|
|
|
</para>
|
|
|
@@ -212,16 +213,17 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
|
|
|
|
|
|
<listitem>
|
|
|
<para>
|
|
|
- Campos do tipo <code>Text</code> são armazenados, indexados e avaliados. Campos
|
|
|
- texto são apropriados para conter informações que devam ser pesquisadas, bem
|
|
|
- como retornadas por uma pesquisa, tais como descrições e títulos.
|
|
|
+ Campos do tipo <code>Text</code> são armazenados, indexados e separados em
|
|
|
+ tokens. Campos text são apropriados para conter informações que devam ser
|
|
|
+ pesquisadas, bem como retornadas por uma pesquisa, tais como descrições e
|
|
|
+ títulos.
|
|
|
</para>
|
|
|
</listitem>
|
|
|
|
|
|
<listitem>
|
|
|
<para>
|
|
|
- Campos do tipo <code>UnStored</code> são avaliados e indexados, mas não são
|
|
|
- armazenados no índice. Grandes quantidades de texto são melhor indexadas
|
|
|
+ Campos do tipo <code>UnStored</code> são separados em tokens e indexados, mas
|
|
|
+ não são armazenados no índice. Grandes quantidades de texto são melhor indexadas
|
|
|
utilizando este tipo de campo. Dados armazenados criam um extenso índice no
|
|
|
disco, então se você necessitar pesquisar sem exibir estes dados, utilize um
|
|
|
campo UnStored. Campos UnStored são úteis quando utilizamos um índice
|
|
|
@@ -240,7 +242,7 @@ $doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
|
|
|
<entry>Tipo de Campo</entry>
|
|
|
<entry>Armazenado</entry>
|
|
|
<entry>Indexado</entry>
|
|
|
- <entry>Marcado</entry>
|
|
|
+ <entry>Separado em Tokens</entry>
|
|
|
<entry>Binário</entry>
|
|
|
</row>
|
|
|
</thead>
|
|
|
@@ -324,8 +326,8 @@ $index->addDocument($doc);
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
- O campo 'title' é na verdade o valor /html/head/title. É armazenado no índice, marcado
|
|
|
- e disponibilizado para pesquisa.
|
|
|
+ O campo 'title' é na verdade o valor /html/head/title. É armazenado no índice, separado
|
|
|
+ em tokens e disponibilizado para pesquisa.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
@@ -339,7 +341,7 @@ $index->addDocument($doc);
|
|
|
<classname>Zend_Search_Lucene_Document_Html</classname> também possuem um segundo
|
|
|
argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
|
|
|
é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
|
|
|
- corpo é marcado e indexado, mas não armazenado.
|
|
|
+ corpo é separado em tokens e indexado, mas não armazenado.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
@@ -352,8 +354,8 @@ $index->addDocument($doc);
|
|
|
<para>
|
|
|
Outras meta tags do cabeçalho no documento produzem campos de documentos adicionais. O
|
|
|
campo 'name' é tirado do atributo 'name', e o atributo o 'content' preenche o campo
|
|
|
- 'value'. Ambos são marcados, indexados e armazenados, então os documentos podem ser
|
|
|
- procurados pelas suas meta tags (por exemplo, por palavras-chave).
|
|
|
+ 'value'. Ambos são separados em tokens, indexados e armazenados, então os documentos
|
|
|
+ podem ser procurados pelas suas meta tags (por exemplo, por palavras-chave).
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
@@ -478,7 +480,7 @@ $index->addDocument($doc);
|
|
|
<classname>Zend_Search_Lucene_Document_Docx</classname> também possui um segundo
|
|
|
argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
|
|
|
é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
|
|
|
- corpo é marcado e indexado, mas não armazenado.
|
|
|
+ corpo é separado em tokens e indexado, mas não armazenado.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
@@ -579,7 +581,7 @@ $index->addDocument($doc);
|
|
|
<classname>Zend_Search_Lucene_Document_Pptx</classname> também possui um segundo
|
|
|
argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
|
|
|
é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
|
|
|
- corpo é marcado e indexado, mas não armazenado.
|
|
|
+ corpo é separado em tokens e indexado, mas não armazenado.
|
|
|
</para>
|
|
|
|
|
|
<para>
|
|
|
@@ -678,7 +680,7 @@ $index->addDocument($doc);
|
|
|
<classname>Zend_Search_Lucene_Document_Xlsx</classname> também possui um segundo
|
|
|
argumento opcional. Se for definido como <constant>TRUE</constant>, o conteúdo do corpo
|
|
|
é também armazenado no índice e pode ser recuperado a partir do índice. Por padrão, o
|
|
|
- corpo é marcado e indexado, mas não armazenado.
|
|
|
+ corpo é separado em tokens e indexado, mas não armazenado.
|
|
|
</para>
|
|
|
|
|
|
<para>
|