16 years ago · b20d5eda77
--- a/documentation/manual/pt-br/module_specs/Zend_Barcode-Introduction.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Barcode-Introduction.xml
@@ -0,0 +1,14 @@
 
				+<?xml version="1.0" encoding="UTF-8"?>
			
 
				+<!-- EN-Revision: 19731 -->
			
 
				+<!-- Reviewed: no -->
			
 
				+<sect1 id="zend.barcode.introduction">
			
 
				+    <title>Introdução</title>
			
 
				+
			
 
				+    <para>
			
 
				+        <classname>Zend_Barcode</classname> fornece uma maneira genérica para gerar códigos de
			
 
				+        barras. O componente <classname>Zend_Barcode</classname> é dividido em dois sub-componentes:
			
 
				+        objetos de código de barras e renderizadores. Os objetos permitem que você crie os códigos
			
 
				+        de barras independentemente do renderizador. O renderizador permite desenhar códigos de
			
 
				+        barras com base no suporte necessário.
			
 
				+    </para>
			
 
				+</sect1>
			
--- a/documentation/manual/pt-br/module_specs/Zend_Config_Ini.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Config_Ini.xml
@@ -6,14 +6,14 @@
 
				 
			
 
				     <para>
			
 
				         <classname>Zend_Config_Ini</classname> permite aos desenvolvedores armazenar os dados de
			
 
				-        configuração em um formato <acronym>INI</acronym> conhecido e lê-los no aplicativo usando
			
 
				-        sintaxe de propriedade do objeto aninhado. O formato <acronym>INI</acronym> é especializado
			
 
				-        em proporcionar tanto a capacidade de ter uma hierarquia de chaves de dados de configuração
			
 
				-        quanto de herança entre as seções de dados de configuração. Hierarquias de dados de
			
 
				-        configuração são suportadas através da separação das chaves com o ponto ou caractere de
			
 
				-        período ("<emphasis>.</emphasis>"). Uma seção pode estender ou herdar de outra seção,
			
 
				-        seguindo o nome da seção, com um caractere dois pontos ("<emphasis>:</emphasis>") e o nome
			
 
				-        da seção a partir do qual os dados devem ser herdados.
			
 
				+        configuração em um formato <acronym>INI</acronym> conhecido e lê-los no aplicativo através
			
 
				+        de uma sintaxe de propriedade de objeto aninhado. O formato <acronym>INI</acronym> é
			
 
				+        especializado em proporcionar tanto a capacidade de ter uma hierarquia de chaves de dados
			
 
				+        de configuração quanto de herança entre as seções de dados de configuração. Hierarquias de
			
 
				+        dados de configuração são suportadas através da separação das chaves com o ponto ou
			
 
				+        caractere de período ("<emphasis>.</emphasis>"). Uma seção pode estender ou herdar de outra
			
 
				+        seção, seguindo o nome da seção, com um caractere dois pontos ("<emphasis>:</emphasis>") e
			
 
				+        o nome da seção a partir do qual os dados devem ser herdados.
			
 
				     </para>
			
 
				 
			
 
				     <note>
			
--- a/documentation/manual/pt-br/module_specs/Zend_Config_Writer.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Config_Writer.xml
@@ -0,0 +1,149 @@
 
				+<?xml version="1.0" encoding="UTF-8"?>
			
 
				+<!-- EN-Revision: 19691 -->
			
 
				+<!-- Reviewed: no -->
			
 
				+<sect1 id="zend.config.writer.introduction">
			
 
				+    <title>Zend_Config_Writer</title>
			
 
				+
			
 
				+    <para>
			
 
				+        <classname>Zend_Config_Writer</classname> lhe dá a capacidade de escrever arquivos de
			
 
				+        configuração a partir de objetos <classname>Zend_Config</classname>. Ele funciona com
			
 
				+        adaptadores separados do sistema e muito fáceis de usar. Por padrão, o
			
 
				+        <classname>Zend_Config_Writer</classname> vêm embarcado com três adaptadores, que são todos
			
 
				+        baseados em arquivos. Você instanciará um escritor com opções específicas, que podem ser
			
 
				+        <emphasis>filename</emphasis> e <emphasis>config</emphasis>. Em seguida, você irá chamar o
			
 
				+        método <methodname>write()</methodname> do escritor e o arquivo de configuração será criado.
			
 
				+        Você também pode fornecer <varname>$filename</varname> e <varname>$config</varname>
			
 
				+        diretamente ao método <methodname>write()</methodname>. Atualmente os escritores que se
			
 
				+        seguem são fornecidos com <classname>Zend_Config_Writer</classname>:
			
 
				+    </para>
			
 
				+
			
 
				+    <itemizedlist>
			
 
				+        <listitem>
			
 
				+            <para>
			
 
				+                <classname>Zend_Config_Writer_Array</classname>
			
 
				+            </para>
			
 
				+        </listitem>
			
 
				+        <listitem>
			
 
				+            <para>
			
 
				+                <classname>Zend_Config_Writer_Ini</classname>
			
 
				+            </para>
			
 
				+        </listitem>
			
 
				+        <listitem>
			
 
				+            <para>
			
 
				+                <classname>Zend_Config_Writer_Xml</classname>
			
 
				+            </para>
			
 
				+        </listitem>
			
 
				+    </itemizedlist>
			
 
				+
			
 
				+    <para>
			
 
				+        O escritor <acronym>INI</acronym> possui dois modos de renderização no que diz respeito às
			
 
				+        seções. Por padrão, a configuração de maior nível é sempre escrita em nomes de seção.
			
 
				+        Chamando <command>$writer->setRenderWithoutSections();</command> todas as opções estarão
			
 
				+        escritas em um namespace global do arquivo <acronym>INI</acronym> e nenhuma seção será
			
 
				+        aplicada.
			
 
				+    </para>
			
 
				+
			
 
				+    <para>
			
 
				+        O <classname>Zend_Config_Writer_Ini</classname> tem como adicional, a opção de parâmetro
			
 
				+        <emphasis>nestSeparator</emphasis>, que define o caractere com que os nós são separados.
			
 
				+        O padrão é um ponto simples, como é o padrão também para
			
 
				+        <classname>Zend_Config_Ini</classname>.
			
 
				+    </para>
			
 
				+
			
 
				+    <para>
			
 
				+        Ao modificar ou criar um objeto <classname>Zend_Config</classname>, há algumas coisas que se
			
 
				+        deve conhecer. Para criar ou modificar um valor, basta definir o parâmetro do objeto
			
 
				+        <classname>Zend_Config</classname> através do assessor de parâmetro
			
 
				+        (<emphasis>-&gt;</emphasis>). Para criar uma seção na raiz ou para criar um ramo, você
			
 
				+        apenas irá criar uma nova matriz ("<command>$config-&gt;branch = array();</command>"). Para
			
 
				+        definir qual seção estende outra, você chamará o método <methodname>setExtend()</methodname>
			
 
				+        na raiz do objeto <classname>Zend_Config</classname>.
			
 
				+    </para>
			
 
				+
			
 
				+    <example id="zend.config.writer.example.using">
			
 
				+        <title>Usando o Zend_Config_Writer</title>
			
 
				+        <para>
			
 
				+            Este exemplo ilustra a utilização básica de
			
 
				+            <classname>Zend_Config_Writer_Xml</classname>
			
 
				+            para criar um novo arquivo de configuração:
			
 
				+        </para>
			
 
				+        <programlisting language="php"><![CDATA[
			
 
				+// Cria o objeto de configuração
			
 
				+$config = new Zend_Config(array(), true);
			
 
				+$config->production = array();
			
 
				+$config->staging    = array();
			
 
				+
			
 
				+$config->setExtend('staging', 'production');
			
 
				+
			
 
				+$config->production->db = array();
			
 
				+$config->production->db->hostname = 'localhost';
			
 
				+$config->production->db->username = 'production';
			
 
				+
			
 
				+$config->staging->db = array();
			
 
				+$config->staging->db->username = 'staging';
			
 
				+
			
 
				+// Escreve o arquivo de configuração em uma das seguintes formas:
			
 
				+// a)
			
 
				+$writer = new Zend_Config_Writer_Xml(array('config'   => $config,
			
 
				+                                           'filename' => 'config.xml'));
			
 
				+$writer->write();
			
 
				+
			
 
				+// b)
			
 
				+$writer = new Zend_Config_Writer_Xml();
			
 
				+$writer->setConfig($config)
			
 
				+       ->setFilename('config.xml')
			
 
				+       ->write();
			
 
				+
			
 
				+// c)
			
 
				+$writer = new Zend_Config_Writer_Xml();
			
 
				+$writer->write('config.xml', $config);
			
 
				+]]></programlisting>
			
 
				+        <para>
			
 
				+            Isso criará um arquivo de configuração <acronym>XML</acronym> com as seções de produção
			
 
				+            e de testes, onde testes estende produção.
			
 
				+        </para>
			
 
				+    </example>
			
 
				+
			
 
				+    <example id="zend.config.writer.modifying">
			
 
				+        <title>Modificando uma Configuração Existente</title>
			
 
				+        <para>
			
 
				+            Este exemplo demonstra como editar um arquivo de configuração existente.
			
 
				+        </para>
			
 
				+        <programlisting language="php"><![CDATA[
			
 
				+// Carrega todas as seções de um arquivo de configuração
			
 
				+// existente, enquanto pula o que é estendido.
			
 
				+$config = new Zend_Config_Ini('config.ini',
			
 
				+                              null,
			
 
				+                              array('skipExtends'        => true,
			
 
				+                                    'allowModifications' => true));
			
 
				+
			
 
				+// Modifica um valor
			
 
				+$config->production->hostname = 'foobar';
			
 
				+
			
 
				+// Escreve o arquivo de configuração
			
 
				+$writer = new Zend_Config_Writer_Ini(array('config'   => $config,
			
 
				+                                           'filename' => 'config.ini'));
			
 
				+$writer->write();
			
 
				+]]></programlisting>
			
 
				+    </example>
			
 
				+
			
 
				+    <note>
			
 
				+        <title>Carregando um Arquivo de Configuração</title>
			
 
				+        <para>
			
 
				+            Ao carregar um arquivo de configuração existente para modificações, é muito importante
			
 
				+            que se carregue todas as seções e que se pule tudo o que é estendido, para que valores
			
 
				+            não sejam fundidos. Isto é feito passando o <emphasis>skipExtends</emphasis> como opção
			
 
				+            para o construtor.
			
 
				+        </para>
			
 
				+    </note>
			
 
				+
			
 
				+    <para>
			
 
				+        Para todos os escritores baseados em arquivo (<acronym>INI</acronym>, <acronym>XML</acronym>
			
 
				+        e Matriz <acronym>PHP</acronym>) internamente o <methodname>render()</methodname> é usado
			
 
				+        para construir a string de configuração. Este método também pode ser usado externamente caso
			
 
				+        precise acessar a string de representação dos dados de configuração.
			
 
				+    </para>
			
 
				+</sect1>
			
 
				+<!--
			
 
				+vim:se ts=4 sw=4 et:
			
 
				+-->
			
--- a/documentation/manual/pt-br/module_specs/Zend_Config_Xml.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Config_Xml.xml
@@ -0,0 +1,219 @@
 
				+<?xml version="1.0" encoding="UTF-8"?>
			
 
				+<!-- EN-Revision: 16945 -->
			
 
				+<!-- Reviewed: no -->
			
 
				+<sect1 id="zend.config.adapters.xml">
			
 
				+    <title>Zend_Config_Xml</title>
			
 
				+    <para>
			
 
				+        <classname>Zend_Config_Xml</classname> permite aos desenvolvedores armazenarem os dados de
			
 
				+        configuração em um formato <acronym>XML</acronym> simples e lê-los através de uma sintaxe
			
 
				+        de propriedade de objeto aninhado. O nome do elemento raiz do arquivo ou string
			
 
				+        <acronym>XML</acronym> é irrelevante e pode ser escolhido. O primeiro nível dos elementos
			
 
				+        <acronym>XML</acronym> corresponde às seções de dados de configuração. O formato
			
 
				+        <acronym>XML</acronym> suporta organização hierárquica para o aninhamento dos elementos
			
 
				+        <acronym>XML</acronym> abaixo dos elementos de seção-nível. O conteúdo de uma folha de
			
 
				+        elemento <acronym>XML</acronym> (leaf) corresponde ao valor de um dado de configuração.
			
 
				+        Herança de seção é suportada por um atributo <acronym>XML</acronym> especial chamado
			
 
				+        <emphasis>extends</emphasis>, e o valor deste atributo corresponde à seção a que a
			
 
				+        informação deve ser herdada.
			
 
				+    </para>
			
 
				+    <note>
			
 
				+        <title>Tipo de Retorno</title>
			
 
				+        <para>
			
 
				+            Os dados de configuração lidos em <classname>Zend_Config_Xml</classname> são sempre
			
 
				+            retornados como strings. A conversão de dados de strings para outros tipos é deixado
			
 
				+            para os desenvolvedores de acordo com suas necessidades específicas.
			
 
				+        </para>
			
 
				+    </note>
			
 
				+    <example id="zend.config.adapters.xml.example.using">
			
 
				+        <title>Usando o Zend_Config_Xml</title>
			
 
				+        <para>
			
 
				+            Este exemplo ilustra uma utilização básica de <classname>Zend_Config_Xml</classname>
			
 
				+            para carregar dados de configuração de um arquivo <acronym>XML</acronym>. Neste
			
 
				+            exemplo, existem dados de configuração, tanto para um sistema de produção como para um
			
 
				+            sistema de testes. Pois os dados de configuração de um sistema de testes são muito
			
 
				+            semelhantes aos de produção, a seção de testes herda da seção de produção. Neste caso,
			
 
				+            a decisão é arbitrária e poderia ter sido escrita de modo inverso, com a seção de
			
 
				+            produção herdando da seção de testes, embora isso possa não ser o caso em situações
			
 
				+            mais complexas. Suponha-se, então, que os dados de configuração a seguir estão
			
 
				+            contidos em <filename>/path/to/config.xml</filename>:
			
 
				+        </para>
			
 
				+        <programlisting language="xml"><![CDATA[
			
 
				+<?xml version="1.0"?>
			
 
				+<configdata>
			
 
				+    <production>
			
 
				+        <webhost>www.example.com</webhost>
			
 
				+        <database>
			
 
				+            <adapter>pdo_mysql</adapter>
			
 
				+            <params>
			
 
				+                <host>db.example.com</host>
			
 
				+                <username>dbuser</username>
			
 
				+                <password>secret</password>
			
 
				+                <dbname>dbname</dbname>
			
 
				+            </params>
			
 
				+        </database>
			
 
				+    </production>
			
 
				+    <staging extends="production">
			
 
				+        <database>
			
 
				+            <params>
			
 
				+                <host>dev.example.com</host>
			
 
				+                <username>devuser</username>
			
 
				+                <password>devsecret</password>
			
 
				+            </params>
			
 
				+        </database>
			
 
				+    </staging>
			
 
				+</configdata>
			
 
				+]]></programlisting>
			
 
				+        <para>
			
 
				+            Em seguida, suponha que o desenvolvedor do aplicativo necessite dos dados de
			
 
				+            configuração de testes do arquivo <acronym>XML</acronym>. É o simples caso de carregar
			
 
				+            esses dados especificando o arquivo <acronym>XML</acronym> e a seção de testes:
			
 
				+        </para>
			
 
				+        <programlisting language="php"><![CDATA[
			
 
				+$config = new Zend_Config_Xml('/path/to/config.xml', 'staging');
			
 
				+
			
 
				+echo $config->database->params->host;   // prints "dev.example.com"
			
 
				+echo $config->database->params->dbname; // prints "dbname"
			
 
				+]]></programlisting>
			
 
				+    </example>
			
 
				+    <example id="zend.config.adapters.xml.example.attributes">
			
 
				+        <title>Usando os Atributos de Tag no Zend_Config_Xml</title>
			
 
				+        <para>
			
 
				+            <classname>Zend_Config_Xml</classname> também suporta outras duas maneiras para definir
			
 
				+            os nós na configuração. Ambas fazem uso de atributos. A partir do momento que os
			
 
				+            atributos <emphasis>extends</emphasis> e <emphasis>value</emphasis> são palavras-chaves
			
 
				+            reservadas (o último através segunda maneira de uso dos atributos), eles não poderão
			
 
				+            ser utilizados. A primeira maneira usar os atributos é adicionar um nó pai, assim eles
			
 
				+            serão interpretados como um filho deste nó:
			
 
				+        </para>
			
 
				+        <programlisting language="xml"><![CDATA[
			
 
				+<?xml version="1.0"?>
			
 
				+<configdata>
			
 
				+    <production webhost="www.example.com">
			
 
				+        <database adapter="pdo_mysql">
			
 
				+            <params host="db.example.com" username="dbuser" password="secret"
			
 
				+                    dbname="dbname"/>
			
 
				+        </database>
			
 
				+    </production>
			
 
				+    <staging extends="production">
			
 
				+        <database>
			
 
				+            <params host="dev.example.com" username="devuser"
			
 
				+                    password="devsecret"/>
			
 
				+        </database>
			
 
				+    </staging>
			
 
				+</configdata>
			
 
				+]]></programlisting>
			
 
				+        <para>
			
 
				+            A outra maneira não encurta realmente a configuração, mas a torna mais fácil para
			
 
				+            manter, pois você não tem que escrever o nome da tag duas vezes. Você simplesmente cria
			
 
				+            uma tag vazia com o valor no atributo <emphasis>value</emphasis>:
			
 
				+        </para>
			
 
				+        <programlisting language="xml"><![CDATA[
			
 
				+<?xml version="1.0"?>
			
 
				+<configdata>
			
 
				+    <production>
			
 
				+        <webhost>www.example.com</webhost>
			
 
				+        <database>
			
 
				+            <adapter value="pdo_mysql"/>
			
 
				+            <params>
			
 
				+                <host value="db.example.com"/>
			
 
				+                <username value="dbuser"/>
			
 
				+                <password value="secret"/>
			
 
				+                <dbname value="dbname"/>
			
 
				+            </params>
			
 
				+        </database>
			
 
				+    </production>
			
 
				+    <staging extends="production">
			
 
				+        <database>
			
 
				+            <params>
			
 
				+                <host value="dev.example.com"/>
			
 
				+                <username value="devuser"/>
			
 
				+                <password value="devsecret"/>
			
 
				+            </params>
			
 
				+        </database>
			
 
				+    </staging>
			
 
				+</configdata>
			
 
				+]]></programlisting>
			
 
				+    </example>
			
 
				+<note>
			
 
				+        <title>Strings XML</title>
			
 
				+        <para>
			
 
				+            <classname>Zend_Config_Xml</classname> é capaz de carregar uma string
			
 
				+            <acronym>XML</acronym> diretamente, por exemplo, uma que foi recuperada de um banco de
			
 
				+            dados. A string é passada como primeiro parâmetro para o construtor e deve começar com
			
 
				+            os caracteres <emphasis>'&lt;?xml'</emphasis>:
			
 
				+        </para>
			
 
				+        <programlisting language="xml"><![CDATA[
			
 
				+$string = <<<EOT
			
 
				+<?xml version="1.0"?>
			
 
				+<config>
			
 
				+    <production>
			
 
				+        <db>
			
 
				+            <adapter value="pdo_mysql"/>
			
 
				+            <params>
			
 
				+                <host value="db.example.com"/>
			
 
				+            </params>
			
 
				+        </db>
			
 
				+    </production>
			
 
				+    <staging extends="production">
			
 
				+        <db>
			
 
				+            <params>
			
 
				+                <host value="dev.example.com"/>
			
 
				+            </params>
			
 
				+        </db>
			
 
				+    </staging>
			
 
				+</config>
			
 
				+EOT;
			
 
				+
			
 
				+$config = new Zend_Config_Xml($string, 'staging');
			
 
				+]]></programlisting>
			
 
				+    </note>
			
 
				+<note>
			
 
				+        <title>Namespace XML do Zend_Config</title>
			
 
				+        <para>
			
 
				+            <classname>Zend_Config</classname> vem com sua próprio namespace <acronym>XML</acronym>,
			
 
				+            que adiciona funcionalidade adicional ao processo de análise. Para aproveitá-la, você
			
 
				+            tem que definir um namespace com o namespace <acronym>URI</acronym>
			
 
				+            <filename>http://framework.zend.com/xml/zend-config-xml/1.0/</filename> em seu nó raiz
			
 
				+            de configuração.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Com o namespace abilitado, você pode usar constantes do <acronym>PHP</acronym> dentro de
			
 
				+            arquivos de configuração. Além disso, o atributo <emphasis>extends</emphasis> foi
			
 
				+            transferido para um novo namespace e está depreciado no namespace
			
 
				+            <constant>NULL</constant>. Ele será completamente removido no Zend Framework 2.0.
			
 
				+        </para>
			
 
				+        <programlisting language="xml"><![CDATA[
			
 
				+$string = <<<EOT
			
 
				+<?xml version="1.0"?>
			
 
				+<config xmlns:zf="http://framework.zend.com/xml/zend-config-xml/1.0/">
			
 
				+    <production>
			
 
				+        <includePath>
			
 
				+            <zf:const zf:name="APPLICATION_PATH"/>/library</includePath>
			
 
				+        <db>
			
 
				+            <adapter value="pdo_mysql"/>
			
 
				+            <params>
			
 
				+                <host value="db.example.com"/>
			
 
				+            </params>
			
 
				+        </db>
			
 
				+    </production>
			
 
				+    <staging zf:extends="production">
			
 
				+        <db>
			
 
				+            <params>
			
 
				+                <host value="dev.example.com"/>
			
 
				+            </params>
			
 
				+        </db>
			
 
				+    </staging>
			
 
				+</config>
			
 
				+EOT;
			
 
				+
			
 
				+define('APPLICATION_PATH', dirname(__FILE__));
			
 
				+$config = new Zend_Config_Xml($string, 'staging');
			
 
				+
			
 
				+echo $config->includePath; // Prints "/var/www/something/library"
			
 
				+]]></programlisting>
			
 
				+    </note>
			
 
				+</sect1>
			
 
				+<!--
			
 
				+vim:se ts=4 sw=4 et:
			
 
				+-->
			
--- a/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Overview.xml
+++ b/documentation/manual/pt-br/module_specs/Zend_Search_Lucene-Overview.xml
@@ -1,226 +1,666 @@
 
				+<?xml version="1.0" encoding="UTF-8"?>
			
 
				+<!-- EN-Revision: 17409 -->
			
 
				+<!-- Reviewed: no -->
			
 
				 <sect1 id="zend.search.lucene.overview">
			
 
				-  <title>Visão Geral</title>
			
 
				-
			
 
				-  <sect2 id="zend.search.lucene.introduction">
			
 
				-    <title>Introdução</title>
			
 
				-
			
 
				-    <para>Zend_Search_Lucene é um mecanismo para pesquisa de texto, de
			
 
				-    propósito geral, escrito totalmente em PHP 5. Por armazenar os
			
 
				-    índices no sistema de arquivos e não fazer uso de servidor de banco de
			
 
				-    dados, ele pode efetuar pesquisas em qualquer website rodando php.
			
 
				-    O Zend_Search_Lucene possui os seguintes recursos: <itemizedlist>
			
 
				-        <listitem>
			
 
				-          <para>Pesquisa agrupada por pontuação (ranked) - os resultados mais
			
 
				-          prováveis são retornados primeiro</para>
			
 
				-        </listitem>
			
 
				-
			
 
				-        <listitem>
			
 
				-          <para>Consultas poderosas de diversos tipos: frase, curingas,
			
 
				-          aproximação, faixas e muito mais<footnote>
			
 
				-              <para>Por enquanto, apenas as consultas por termo e termos
			
 
				-              múltiplos são suportadas.</para>
			
 
				-            </footnote></para>
			
 
				-        </listitem>
			
 
				-
			
 
				-        <listitem>
			
 
				-          <para>Busca por campo específico (ex: título, autor,
			
 
				-          descrição)</para>
			
 
				-        </listitem>
			
 
				-      </itemizedlist> Zend_Search_Lucene derivou do projeto Apache Lucene.
			
 
				-    Para mais informações, visite <ulink
			
 
				-    url="http://lucene.apache.org/java/docs/"></ulink>.</para>
			
 
				-  </sect2>
			
 
				-
			
 
				-  <sect2 id="zend.search.lucene.index-creation.documents-and-fields">
			
 
				-    <title>Objetos Documento e Campo</title>
			
 
				-
			
 
				-    <para>Zend_Search_Lucene trabalha sobre os documentos subdividindo-os em
			
 
				-    pequenas operações (atômicas) de indexação. Um documento é dividido em
			
 
				-    campos identificados cujo conteúdo é pesquisado.</para>
			
 
				-
			
 
				-    <para>Um documento é representado por um objeto da classe
			
 
				-    Zend_Search_Lucene_Document, que por sua vez contém objetos da classe
			
 
				-    Zend_Search_Lucene_Field que representam os campos.</para>
			
 
				-
			
 
				-    <para>O que é importante ressaltar é que qualquer tipo de informação pode
			
 
				-    ser adicionada a um índice. Informações específicas de aplicações ou
			
 
				-    metadados podem ser armazenados em campos de um documento, e
			
 
				-    posteriormente recuperados juntamente com o documento durante uma
			
 
				-    pesquisa.</para>
			
 
				-
			
 
				-    <para>Controlar o indexador é responsabilidade de sua aplicação. Este
			
 
				-    recurso garante que os dados possam ser indexados a partir de qualquer
			
 
				-    fonte que seja acessível à sua aplicação. Por exemplo, um sistema de
			
 
				-    arquivos, um banco de dados, um formulário HTML, etc.</para>
			
 
				-
			
 
				-    <para><code>A classe Zend_Search_Lucene_Field</code> provê alguns métodos
			
 
				-    estáticos para criação de campos com diferentes características:</para>
			
 
				-
			
 
				-    <programlisting role="php">&lt;?php
			
 
				+    <title>Resumo</title>
			
 
				+
			
 
				+    <sect2 id="zend.search.lucene.introduction">
			
 
				+        <title>Introdução</title>
			
 
				+
			
 
				+        <para>
			
 
				+            <classname>Zend_Search_Lucene</classname> é um mecanismo para pesquisa de texto, de
			
 
				+            propósito geral, escrito totalmente em <acronym>PHP</acronym> 5. Por armazenar os
			
 
				+            índices no sistema de arquivos e não fazer uso de servidor de banco de dados, ele pode
			
 
				+            efetuar pesquisas em qualquer website rodando <acronym>PHP</acronym>. O
			
 
				+            <classname>Zend_Search_Lucene</classname> possui os seguintes recursos:
			
 
				+            <itemizedlist>
			
 
				+                <listitem>
			
 
				+                    <para>
			
 
				+                        Pesquisa agrupada por pontuação (ranked) - os resultados mais prováveis são
			
 
				+                        retornados primeiro
			
 
				+                    </para>
			
 
				+                </listitem>
			
 
				+                <listitem>
			
 
				+                    <para>
			
 
				+                        Consultas poderosas de diversos tipos: frase, curingas, booleanas,
			
 
				+                        aproximação, faixas e muitas outras.
			
 
				+                    </para>
			
 
				+                </listitem>
			
 
				+                <listitem>
			
 
				+                    <para>
			
 
				+                        Busca por campo específico (ex: título, autor, descrição)
			
 
				+                    </para>
			
 
				+                </listitem>
			
 
				+            </itemizedlist>
			
 
				+
			
 
				+            <classname>Zend_Search_Lucene</classname> derivou do projeto Apache Lucene. Atualmente
			
 
				+            (iniciando do ZF 1.6), as versões suportadas formato de índice Lucene são 1.4 - 2.3.
			
 
				+            Para mais informações, visite <ulink url="http://lucene.apache.org/java/docs/"/>.
			
 
				+        </para>
			
 
				+        <note>
			
 
				+            <title/>
			
 
				+            <para>
			
 
				+                Implementações anteriores de <classname>Zend_Search_Lucene</classname> suportam os
			
 
				+                formatos de índice Lucene 1.4 (1.9) - 2.1.
			
 
				+            </para>
			
 
				+            <para>
			
 
				+                A partir do Zend Framework 1.5, qualquer índice criado usando formato de índice
			
 
				+                menor que 2.1 é atualizado automaticamente para o formato Lucene 2.1 após a
			
 
				+                atualização <classname>Zend_Search_Lucene</classname> e não será compatível com as
			
 
				+                implementações do <classname>Zend_Search_Lucene</classname> incluídas no Zend
			
 
				+                Framework 1.0.x.
			
 
				+            </para>
			
 
				+        </note>
			
 
				+    </sect2>
			
 
				+
			
 
				+    <sect2 id="zend.search.lucene.index-creation.documents-and-fields">
			
 
				+        <title>Objetos Documento e Campo</title>
			
 
				+            <para>
			
 
				+                <classname>Zend_Search_Lucene</classname> trabalha sobre os documentos
			
 
				+                subdividindo-os em pequenos objetos (atômicos) de indexação. Um documento é
			
 
				+                dividido em campos identificados cujo conteúdo é pesquisado.
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                Um documento é representado pela classe
			
 
				+                <classname>Zend_Search_Lucene_Document</classname>, e os objetos dessa classe
			
 
				+                contêm instâncias de <classname>Zend_Search_Lucene_Field</classname> que
			
 
				+                representam os campos no documento.
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                O que é importante ressaltar é que qualquer informação pode ser adicionada a um
			
 
				+                índice. Informações específicas de aplicações ou metadados podem ser armazenados em
			
 
				+                campos de um documento, e posteriormente recuperados juntamente com o documento
			
 
				+                durante uma pesquisa.
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                Controlar o indexador é responsabilidade de sua aplicação. Este recurso garante que
			
 
				+                os dados possam ser indexados a partir de qualquer fonte que seja acessível à sua
			
 
				+                aplicação. Por exemplo, um sistema de arquivos, um banco de dados, um formulário
			
 
				+                HTML, etc.
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                A classe <classname>Zend_Search_Lucene_Field</classname> provê alguns métodos
			
 
				+                estáticos para criação de campos com diferentes características:
			
 
				+            </para>
			
 
				+
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				 $doc = new Zend_Search_Lucene_Document();
			
 
				 
			
 
				-// Field is not tokenized, but is indexed and stored within the index.
			
 
				-// Stored fields can be retrived from the index.
			
 
				-$doc-&gt;addField(Zend_Search_Lucene_Field::Keyword('doctype',
			
 
				+// O campo não é marcado, mas é indexado e armazenado dentro do índice.
			
 
				+// Campos armazenados podem ser recuperados a partir do índice.
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Keyword('doctype',
			
 
				                                                  'autogenerated'));
			
 
				 
			
 
				-// Field is not tokenized nor indexed, but is stored in the index.
			
 
				-$doc-&gt;addField(Zend_Search_Lucene_Field::UnIndexed('created',
			
 
				+// O campo não é marcado nem indexado, mas é armazenado no índice.
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnIndexed('created',
			
 
				                                                    time()));
			
 
				 
			
 
				-// Binary String valued Field that is not tokenized nor indexed,
			
 
				-// but is stored in the index.
			
 
				-$doc-&gt;addField(Zend_Search_Lucene_Field::Binary('icon',
			
 
				+// O campo avaliado como string binária não é marcado nem indexado,
			
 
				+// mas é armazenado no índice.
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Binary('icon',
			
 
				                                                 $iconData));
			
 
				 
			
 
				-// Field is tokenized and indexed, and is stored in the index.
			
 
				-$doc-&gt;addField(Zend_Search_Lucene_Field::Text('annotation',
			
 
				+// O campo é marcado e indexado, e é armazenado no índice.
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Text('annotation',
			
 
				                                               'Document annotation text'));
			
 
				 
			
 
				-// Field is tokenized and indexed, but that is not stored in the index.
			
 
				-$doc-&gt;addField(Zend_Search_Lucene_Field::UnStored('contents',
			
 
				+// O campo é marcado e indexado, mas não é armazenado no índice.
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnStored('contents',
			
 
				                                                   'My document content'));
			
 
				+]]></programlisting>
			
 
				 
			
 
				-?&gt;</programlisting>
			
 
				+            <para>
			
 
				+                Cada um desses métodos (excluindo o método
			
 
				+                <methodname>Zend_Search_Lucene_Field::Binary()</methodname>) têm um parâmetro
			
 
				+                <varname>$encoding</varname> opcional para especificar a entrada dos dados de
			
 
				+                codificação.
			
 
				+            </para>
			
 
				 
			
 
				-    <para>Você pode dar nome aos campos de acordo com a sua preferência. Um
			
 
				-    campo chamado "contents" pode ser usado para a pesquisa "default". É uma
			
 
				-    boa prática colocar os dados principais do documento em um campo com este
			
 
				-    nome.</para>
			
 
				-  </sect2>
			
 
				+            <para>
			
 
				+                A codificação pode divergir entre documentos diferentes, bem como para campos
			
 
				+                diferentes dentro de um mesmo documento:
			
 
				 
			
 
				-  <sect2 id="zend.search.lucene.index-creation.understanding-field-types">
			
 
				-    <title>Entendendo os tipos de campos</title>
			
 
				-
			
 
				-    <itemizedlist>
			
 
				-      <listitem>
			
 
				-        <para>Campos do tipo <code>Keyword</code> são armazenados e indexados
			
 
				-        ***fields are stored and indexed***, meaning they can be searched as
			
 
				-        well as displayed them back in search results. They are not split up
			
 
				-        into seperate words by tokenization. Enumerated database fields
			
 
				-        usually translate well to Keyword fields in Zend_Search_Lucene.</para>
			
 
				-      </listitem>
			
 
				-
			
 
				-      <listitem>
			
 
				-        <para>Campos do tipo <code>UnIndexed</code> não são pesquisáveis, mas
			
 
				-        são retornados junto com os resultados das pesquisas. Database
			
 
				-        timestamps, chaves primárias, caminhos do sistema de arquivos, e
			
 
				-        outros identificadores externos são bons candidatos para campos
			
 
				-        UnIndexed.</para>
			
 
				-      </listitem>
			
 
				-
			
 
				-      <listitem>
			
 
				-        <para>Campos do tipo <code>Binary</code> não são avaliados nem
			
 
				-        indexados, mas são armazenados para serem retornados em resultados de
			
 
				-        pesquisas. Eles podem ser usados para armazenar qulaquer tipo de dado
			
 
				-        que possa ser codificados em uma string binária, por exemplo, um
			
 
				-        ícone.</para>
			
 
				-      </listitem>
			
 
				-
			
 
				-      <listitem>
			
 
				-        <para>Campos do tipo <code>Text</code> são armazenados, indexados e
			
 
				-        avaliados. Campos texto são apropriados para conter informações que
			
 
				-        devam ser pesquisadas, bem como retornadas por uma pesquisa, tais como
			
 
				-        descrições e títulos.</para>
			
 
				-      </listitem>
			
 
				-
			
 
				-      <listitem>
			
 
				-        <para>Campos do tipo <code>UnStored</code> são avaliados e indexados,
			
 
				-        mas não são armazenados no índice. Grandes quantidades de texto são
			
 
				-        melhor indexadas utilizando este tipo de campo. Dados armazenados
			
 
				-        criam um extenso índice no disco, então se você necessitar pesquisar
			
 
				-        sem exibir estes dados, utilize um campo UnStored. Campos UnStored são
			
 
				-        úteis quando utilizamos um índice Zend_Search_Lucene em combinação com
			
 
				-        um banco de dados relacional. Você pode indexar campos contendo dados
			
 
				-        volumosos usando campos UnStored para pesquisa, e recuperá-los a
			
 
				-        partir de um banco de dados relacional usando campos separados como
			
 
				-        identificadores.</para>
			
 
				-
			
 
				-        <table>
			
 
				-          <title>Campos Zend_Search_Lucene_Field </title>
			
 
				-
			
 
				-          <tgroup cols="5">
			
 
				-            <thead>
			
 
				-              <row>
			
 
				-                <entry>Tipo de Campo</entry>
			
 
				-
			
 
				-                <entry>Armazenado</entry>
			
 
				-
			
 
				-                <entry>Indexado</entry>
			
 
				-
			
 
				-                <entry>Tokenizado</entry>
			
 
				-
			
 
				-                <entry>Binário</entry>
			
 
				-              </row>
			
 
				-            </thead>
			
 
				-
			
 
				-            <tbody>
			
 
				-              <row>
			
 
				-                <entry>Keyword</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-              </row>
			
 
				-
			
 
				-              <row>
			
 
				-                <entry>UnIndexed</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-              </row>
			
 
				-
			
 
				-              <row>
			
 
				-                <entry>Binary</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-              </row>
			
 
				-
			
 
				-              <row>
			
 
				-                <entry>Text</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-              </row>
			
 
				-
			
 
				-              <row>
			
 
				-                <entry>UnStored</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Sim</entry>
			
 
				-
			
 
				-                <entry>Não</entry>
			
 
				-              </row>
			
 
				-            </tbody>
			
 
				-          </tgroup>
			
 
				-        </table>
			
 
				-      </listitem>
			
 
				-    </itemizedlist>
			
 
				-  </sect2>
			
 
				+                <programlisting language="php"><![CDATA[
			
 
				+$doc = new Zend_Search_Lucene_Document();
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Text('title',
			
 
				+                                              $title,
			
 
				+                                              'iso-8859-1'));
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnStored('contents',
			
 
				+                                                  $contents,
			
 
				+                                                  'utf-8'));
			
 
				+]]></programlisting>
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                Se o parâmetro de codificação é omitido, então a localidade atual é usada em tempo
			
 
				+                de processamento. Por exemplo:
			
 
				+                <programlisting language="php"><![CDATA[
			
 
				+setlocale(LC_ALL, 'de_DE.iso-8859-1');
			
 
				+...
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnStored('contents', $contents));
			
 
				+]]></programlisting>
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                Os campos são sempre armazenados e devolvidos ao índice na codificação UTF-8.
			
 
				+                Qualquer conversão necessária para UTF-8 acontece automaticamente.
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                Analisadores de texto (<link linkend="zend.search.lucene.extending.analysis">veja
			
 
				+                abaixo</link>) também podem converter texto para algumas outras codificações. Na
			
 
				+                verdade, o analisador de padrão converte o texto para a codificação
			
 
				+                'ASCII//TRANSLIT'. Porém, tenha cuidado, esta tradução pode depender da localidade
			
 
				+                atual.
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                Nomes de campos são definidos a seu critério no método
			
 
				+                <methodname>addField()</methodname>.
			
 
				+            </para>
			
 
				+
			
 
				+            <para>
			
 
				+                Java Lucene usa o campo 'contents' como um campo padrão de busca.
			
 
				+                <classname>Zend_Search_Lucene</classname> busca por padrão através de todos os
			
 
				+                domínios, mas este comportamento é configurável. Consulte o capítulo
			
 
				+                <link linkend="zend.search.lucene.query-language.fields">"Campo de pesquisa
			
 
				+                padrão"</link> para mais detalhes.
			
 
				+            </para>
			
 
				+    </sect2>
			
 
				+
			
 
				+    <sect2 id="zend.search.lucene.index-creation.understanding-field-types">
			
 
				+        <title>Entendendo os Tipos de Campos</title>
			
 
				+        <itemizedlist>
			
 
				+            <listitem>
			
 
				+                <para>
			
 
				+                    Campos do tipo <code>Keyword</code> são armazenados e indexados, o que
			
 
				+                    significa que eles podem ser pesquisados, bem como apresentados nos resultados
			
 
				+                    de busca. Eles não podem ser divididos em palavras separadas por marcação.
			
 
				+                    Campos de dados numerados geralmente os traduzem bem no
			
 
				+                    <classname>Zend_Search_Lucene</classname>.
			
 
				+                </para>
			
 
				+            </listitem>
			
 
				+            <listitem>
			
 
				+                <para>
			
 
				+                    Campos do tipo <code>UnIndexed</code> não são pesquisáveis, mas são retornados
			
 
				+                    junto com os resultados das pesquisas. Timestamps de banco de dados, chaves
			
 
				+                    primárias, caminhos do sistema de arquivos, e outros identificadores externos
			
 
				+                    são bons candidatos para estes campos.
			
 
				+                </para>
			
 
				+            </listitem>
			
 
				+            <listitem>
			
 
				+                <para>
			
 
				+                    Campos do tipo <code>Binary</code> não são avaliados nem indexados, mas são
			
 
				+                    armazenados para serem retornados em resultados de pesquisas. Eles podem ser
			
 
				+                    usados para armazenar qulaquer tipo de dado que possa ser codificados em uma
			
 
				+                    string binária, por exemplo, um ícone.
			
 
				+                </para>
			
 
				+            </listitem>
			
 
				+            <listitem>
			
 
				+                <para>
			
 
				+                    Campos do tipo <code>Text</code> são armazenados, indexados e avaliados. Campos
			
 
				+                    texto são apropriados para conter informações que devam ser pesquisadas, bem
			
 
				+                    como retornadas por uma pesquisa, tais como descrições e títulos.
			
 
				+                </para>
			
 
				+            </listitem>
			
 
				+            <listitem>
			
 
				+                <para>
			
 
				+                    Campos do tipo <code>UnStored</code> são avaliados e indexados, mas não são
			
 
				+                    armazenados no índice. Grandes quantidades de texto são melhor indexadas
			
 
				+                    utilizando este tipo de campo. Dados armazenados criam um extenso índice no
			
 
				+                    disco, então se você necessitar pesquisar sem exibir estes dados, utilize um
			
 
				+                    campo UnStored. Campos UnStored são úteis quando utilizamos um índice
			
 
				+                    <classname>Zend_Search_Lucene</classname> em combinação com um banco de dados
			
 
				+                    relacional. Você pode indexar campos contendo dados volumosos usando campos
			
 
				+                    UnStored para pesquisa, e recuperá-los a partir de um banco de dados relacional
			
 
				+                    usando campos separados como identificadores.
			
 
				+               </para>
			
 
				+
			
 
				+                <table id="zend.search.lucene.index-creation.understanding-field-types.table">
			
 
				+                    <title>Tipos de Zend_Search_Lucene_Field</title>
			
 
				+                    <tgroup cols="5">
			
 
				+                        <thead>
			
 
				+                            <row>
			
 
				+                                <entry>Tipo de Campo</entry>
			
 
				+                                <entry>Armazenado</entry>
			
 
				+                                <entry>Indexado</entry>
			
 
				+                                <entry>Marcado</entry>
			
 
				+                                <entry>Binário</entry>
			
 
				+                            </row>
			
 
				+                        </thead>
			
 
				+                        <tbody>
			
 
				+                            <row>
			
 
				+                                <entry>Keyword</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                            </row>
			
 
				+                            <row>
			
 
				+                                <entry>UnIndexed</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                            </row>
			
 
				+                            <row>
			
 
				+                                <entry>Binary</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                            </row>
			
 
				+                            <row>
			
 
				+                                <entry>Text</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                            </row>
			
 
				+                            <row>
			
 
				+                                <entry>UnStored</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Sim</entry>
			
 
				+                                <entry>Não</entry>
			
 
				+                            </row>
			
 
				+                        </tbody>
			
 
				+                    </tgroup>
			
 
				+                </table>
			
 
				+           </listitem>
			
 
				+       </itemizedlist>
			
 
				+    </sect2>
			
 
				+
			
 
				+    <sect2 id="zend.search.lucene.index-creation.html-documents">
			
 
				+        <title>Documentos HTML</title>
			
 
				+        <para>
			
 
				+            <classname>Zend_Search_Lucene</classname> oferece um recurso para análise de HTML.
			
 
				+            Os documentos podem ser criados diretamente a partir de um arquivo ou string HTML:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Html::loadHTMLFile($filename);
			
 
				+$index->addDocument($doc);
			
 
				+...
			
 
				+$doc = Zend_Search_Lucene_Document_Html::loadHTML($htmlString);
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Html</classname> utiliza os métodos
			
 
				+            <methodname>DOMDocument::loadHTML()</methodname> e
			
 
				+            <methodname>DOMDocument::loadHTMLFile()</methodname> para analisar o código HTML, por
			
 
				+            isso não precisa de HTML bem formatado ou de <acronym>XHTML</acronym>. Por outro lado,
			
 
				+            é dependente da codificação especificada pela tag de cabeçalho "meta http-equiv".
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Html</classname> reconhece o título do
			
 
				+            documento, o corpo e as meta tags do cabeçalho.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'title' é na verdade o valor /html/head/title. É armazenado no índice, marcado
			
 
				+            e disponibilizado para pesquisa.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'body' é o próprio conteúdo corpo do arquivo ou string HTML. Não inclui os
			
 
				+            scripts, comentários ou atributos.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Os métodos <methodname>loadHTML()</methodname> e
			
 
				+            <methodname>loadHTMLFile()</methodname> da classe
			
 
				+            <classname>Zend_Search_Lucene_Document_Html</classname> também possuem um segundo
			
 
				+            argumento opcional. Se for definido como true, o conteúdo do corpo é também armazenado
			
 
				+            no índice e pode ser recuperado a partir do índice. Por padrão, o corpo é marcado e
			
 
				+            indexado, mas não armazenado.
			
 
				+        </para>
			
 
				+        <para>
			
 
				+            O terceiro parâmetro dos métodos <methodname>loadHTML()</methodname> e
			
 
				+            <methodname>loadHTMLFile()</methodname> especifica opcionalmente a codificação do
			
 
				+            código no documento HTML. É utilizado quando a codificação não é especificada usando a
			
 
				+            meta tag Content-type HTTP-EQUIV.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Outras meta tags do cabeçalho no documento produzem campos de documentos adicionais. O
			
 
				+            campo 'name' é tirado do atributo 'name', e o atributo o 'content' preenche o campo
			
 
				+            'value'. Ambos são marcados, indexados e armazenados, então os documentos podem ser
			
 
				+            procurados pelas suas meta tags (por exemplo, por palavras-chave).
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Qualquer outro campo pode ser acrescentado pelo programador em documentos analisados:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Html::loadHTML($htmlString);
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnIndexed('created',
			
 
				+                                                   time()));
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnIndexed('updated',
			
 
				+                                                   time()));
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Text('annotation',
			
 
				+                                              'Document annotation text'));
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Links nos documentos não estão incluídos no documento gerado,
			
 
				+            mas podem ser recuperados através dos métodos
			
 
				+            <methodname>Zend_Search_Lucene_Document_Html::getLinks()</methodname> e
			
 
				+            <methodname>Zend_Search_Lucene_Document_Html::getHeaderLinks()</methodname>:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Html::loadHTML($htmlString);
			
 
				+$linksArray = $doc->getLinks();
			
 
				+$headerLinksArray = $doc->getHeaderLinks();
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A partir do Zend Framework 1.6 é possível excluir os links com o atributo
			
 
				+            <code>rel</code> definido como <code>'nofollow'</code>. Utilize
			
 
				+            <methodname>Zend_Search_Lucene_Document_Html::setExcludeNoFollowLinks($true)</methodname>
			
 
				+            para ativar esta opção.
			
 
				+        </para>
			
 
				+        <para>
			
 
				+            O método
			
 
				+            <methodname>Zend_Search_Lucene_Document_Html::getExcludeNoFollowLinks()</methodname>
			
 
				+            retorna o estado atual do marco "Exclude nofollow links".
			
 
				+        </para>
			
 
				+    </sect2>
			
 
				+
			
 
				+    <sect2 id="zend.search.lucene.index-creation.docx-documents">
			
 
				+        <title>Documentos do Word 2007</title>
			
 
				+        <para>
			
 
				+            <classname>Zend_Search_Lucene</classname> oferece um recurso de análise para Word 2007.
			
 
				+            Os documentos podem ser criados diretamente de um arquivo do Word 2007:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Docx::loadDocxFile($filename);
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Docx</classname> utiliza a classe
			
 
				+            <code>ZipArchive</code> e os métodos <code>simplexml</code> para analisar o documento
			
 
				+            de origem. Se a classe <code>ZipArchive</code> (do módulo php_zip) não estiver
			
 
				+            disponível, o <classname>Zend_Search_Lucene_Document_Docx</classname> também não estará
			
 
				+            disponível para ser usado com o Zend Framework.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Docx</classname> reconhece os metadados
			
 
				+            e o texto do documento. Metadados consiste, dependendo do conteúdo do documento, de
			
 
				+            nome do arquivo (filename), título (title), assunto (subject), autor (creator),
			
 
				+            palavras-chave (keywords), descrição (description), última modificação por
			
 
				+            (lastModifiedBy), revisão (revision), data da modificação (modified) e data da criação
			
 
				+            (created).
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'filename' é o nome do arquivo do Word 2007.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'title' é o título do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'subject' é o assunto do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'creator' é o autor do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'keywords' contém as palavras-chaves do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'description' é a descrição do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'lastModifiedBy' é o nome de quem fez a última modificação no documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'revision' é o número da revisão do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'modified' contém a data e hora da última modificação do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'created' contém a data e hora da criação do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'body' é o próprio conteúdo do documento do Word 2007. Ele inclui apenas texto
			
 
				+            normal, comentários e revisões não estão incluídos.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O método <methodname>loadDocxFile()</methodname> da classe
			
 
				+            <classname>Zend_Search_Lucene_Document_Docx</classname> também possui um segundo
			
 
				+            argumento opcional. Se for definido como true, o conteúdo do corpo é também armazenado
			
 
				+            no índice e pode ser recuperado a partir do índice. Por padrão, o corpo é marcado e
			
 
				+            indexado, mas não armazenado.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Qualquer outro campo pode ser acrescentado pelo programador em documentos analisados:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Docx::loadDocxFile($filename);
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnIndexed(
			
 
				+    'indexTime',
			
 
				+    time())
			
 
				+);
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Text(
			
 
				+    'annotation',
			
 
				+    'Document annotation text')
			
 
				+);
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+
			
 
				+    </sect2>
			
 
				+
			
 
				+    <sect2 id="zend.search.lucene.index-creation.pptx-documents">
			
 
				+        <title>Documentos do Powerpoint 2007</title>
			
 
				+        <para>
			
 
				+            <classname>Zend_Search_Lucene</classname> oferece um recurso de análise para Powerpoint
			
 
				+            2007. Os documentos podem ser criados diretamente de um arquivo do Powerpoint 2007:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Pptx::loadPptxFile($filename);
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Pptx</classname> utiliza a classe
			
 
				+            <code>ZipArchive</code> e os métodos <code>simplexml</code> para analisar o documento
			
 
				+            de origem. Se a classe <code>ZipArchive</code> (do módulo php_zip) não estiver
			
 
				+            disponível, o <classname>Zend_Search_Lucene_Document_Pptx</classname> também não estará
			
 
				+            disponível para ser usado com o Zend Framework.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Pptx</classname> reconhece os metadados
			
 
				+            e o texto do documento. Metadados consiste, dependendo do conteúdo do documento, de
			
 
				+            nome do arquivo (filename), título (title), assunto (subject), autor (creator),
			
 
				+            palavras-chave (keywords), descrição (description), última modificação por
			
 
				+            (lastModifiedBy), revisão (revision), data da modificação (modified) e data da criação
			
 
				+            (created).
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'filename' é o nome do arquivo do Powerpoint 2007.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'title' é o título do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'subject' é o assunto do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'creator' é o autor do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'keywords' contém as palavras-chaves do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'description' é a descrição do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'lastModifiedBy' é o nome de quem fez a última modificação no documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'revision' é o número da revisão do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'modified' contém a data e hora da última modificação do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'created' contém a data e hora da criação do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'body' é o conteúdo de todos os slides e notas de slide no documento do
			
 
				+            Powerpoint 2007.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O método <methodname>loadPptxFile()</methodname> da classe
			
 
				+            <classname>Zend_Search_Lucene_Document_Pptx</classname> também possui um segundo
			
 
				+            argumento opcional. Se for definido como true, o conteúdo do corpo é também armazenado
			
 
				+            no índice e pode ser recuperado a partir do índice. Por padrão, o corpo é marcado e
			
 
				+            indexado, mas não armazenado.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Qualquer outro campo pode ser acrescentado pelo programador em documentos analisados:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Pptx::loadPptxFile($filename);
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnIndexed(
			
 
				+    'indexTime',
			
 
				+    time()));
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Text(
			
 
				+    'annotation',
			
 
				+    'Document annotation text'));
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+    </sect2>
			
 
				+
			
 
				+    <sect2 id="zend.search.lucene.index-creation.xlsx-documents">
			
 
				+        <title>Documentos do Excel 2007</title>
			
 
				+        <para>
			
 
				+            <classname>Zend_Search_Lucene</classname> oferece um recurso de análise para Excel 2007.
			
 
				+            Os documentos podem ser criados diretamente de um arquivo do Excel 2007:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Xlsx::loadXlsxFile($filename);
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Xlsx</classname> utiliza a classe
			
 
				+            <code>ZipArchive</code> e os métodos <code>simplexml</code> para analisar o documento
			
 
				+            de origem. Se a classe <code>ZipArchive</code> (do módulo php_zip) não estiver
			
 
				+            disponível, o <classname>Zend_Search_Lucene_Document_Xlsx</classname> também não estará
			
 
				+            disponível para ser usado com o Zend Framework.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            A classe <classname>Zend_Search_Lucene_Document_Xlsx</classname> reconhece os metadados
			
 
				+            e o texto do documento. Metadados consiste, dependendo do conteúdo do documento, de
			
 
				+            nome do arquivo (filename), título (title), assunto (subject), autor (creator),
			
 
				+            palavras-chave (keywords), descrição (description), última modificação por
			
 
				+            (lastModifiedBy), revisão (revision), data da modificação (modified) e data da criação
			
 
				+            (created).
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'filename' é o nome do arquivo do Excel 2007.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'title' é o título do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'subject' é o assunto do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'creator' é o autor do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'keywords' contém as palavras-chaves do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'description' é a descrição do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'lastModifiedBy' é o nome de quem fez a última modificação no documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'revision' é o número da revisão do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'modified' contém a data e hora da última modificação do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'created' contém a data e hora da criação do documento.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O campo 'body' é o conteúdo de todas as células em todas as planilhas do documento do
			
 
				+            Excel 2007.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            O método <methodname>loadXlsxFile()</methodname> da classe
			
 
				+            <classname>Zend_Search_Lucene_Document_Xlsx</classname> também possui um segundo
			
 
				+            argumento opcional. Se for definido como true, o conteúdo do corpo é também armazenado
			
 
				+            no índice e pode ser recuperado a partir do índice. Por padrão, o corpo é marcado e
			
 
				+            indexado, mas não armazenado.
			
 
				+        </para>
			
 
				+
			
 
				+        <para>
			
 
				+            Qualquer outro campo pode ser acrescentado pelo programador em documentos analisados:
			
 
				+            <programlisting language="php"><![CDATA[
			
 
				+$doc = Zend_Search_Lucene_Document_Xlsx::loadXlsxFile($filename);
			
 
				+$doc->addField(Zend_Search_Lucene_Field::UnIndexed(
			
 
				+    'indexTime',
			
 
				+    time()));
			
 
				+$doc->addField(Zend_Search_Lucene_Field::Text(
			
 
				+    'annotation',
			
 
				+    'Document annotation text'));
			
 
				+$index->addDocument($doc);
			
 
				+]]></programlisting>
			
 
				+        </para>
			
 
				+    </sect2>
			
 
				 </sect1>
			
 
				-<!--
			
 
				-vim:se ts=4 sw=4 et:
			
 
				--->