| 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596 |
- <?xml version="1.0" encoding="UTF-8"?>
- <!-- EN-Revision: 24249 -->
- <!-- Reviewed: no -->
- <sect1 id="zend.search.lucene.java-lucene">
- <title>Zusammenarbeit Mit Java Lucene</title>
- <sect2 id="zend.search.lucene.index-creation.file-formats">
- <title>Dateiformate</title>
- <para>
- <classname>Zend_Search_Lucene</classname> Indexdateiformate sind binär kompatibel mit
- der Java Lucene Version 1.4 und größer.
- </para>
- <para>
- Eine detaillierte Beschreibung dieses Formats ist hier erhältlich:
- <ulink url="http://lucene.apache.org/java/2_3_0/fileformats.html"/>.
- <footnote>
- <para>
- Die aktuell unterstützte Version des Lucene Index Dateiformats ist 2.3
- (beginnend mit Zend Framework 1.6).
- </para>
- </footnote>.
- </para>
- </sect2>
- <sect2 id="zend.search.lucene.index-creation.index-directory">
- <title>Indexverzeichnis</title>
- <para>
- Nach der Indexerstellung wird das Indexverzeichnis verschiedene Dateien enthalten:
- </para>
- <itemizedlist>
- <listitem>
- <para>
- Die <filename>segments</filename> Datei ist eine Liste der Indexsegmente.
- </para>
- </listitem>
- <listitem>
- <para>
- Die <filename>*.cfs</filename> Dateien enthalten die Indexsegmente. Beachte!
- Ein optimierter Index enthält immer nur ein Segment.
- </para>
- </listitem>
- <listitem>
- <para>
- Die <filename>deletable</filename> Datei ist eine Liste von Dateien, die vom
- Index nicht mehr verwendet werden, aber noch nicht gelöscht werden konnten.
- </para>
- </listitem>
- </itemizedlist>
- </sect2>
- <sect2 id="zend.search.lucene.java-lucene.source-code">
- <title>Java Quellcode</title>
- <para>
- Das unten gelistete Java Programm stellt ein Beispiel für die Indizierung einer Datei
- mit Java Lucene dar:
- </para>
- <programlisting language="java"><![CDATA[
- /**
- * Indexerstellung:
- */
- import org.apache.lucene.index.IndexWriter;
- import org.apache.lucene.document.*;
- import java.io.*
- ...
- IndexWriter indexWriter = new IndexWriter("/data/my_index",
- new SimpleAnalyzer(), true);
- ...
- String filename = "/path/to/file-to-index.txt"
- File f = new File(filename);
- Document doc = new Document();
- doc.add(Field.Text("path", filename));
- doc.add(Field.Keyword("modified",DateField.timeToString(f.lastModified())));
- doc.add(Field.Text("author", "unknown"));
- FileInputStream is = new FileInputStream(f);
- Reader reader = new BufferedReader(new InputStreamReader(is));
- doc.add(Field.Text("contents", reader));
- indexWriter.addDocument(doc);
- ]]></programlisting>
- </sect2>
- </sect1>
|