Zend_Search_Lucene-Queries.xml 28 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696697698699700701702703704705706707708709710711712713714715716717718719720721722723724725726727728729730731732733734735736737738739740741742743744745746747748749750751752753754755756757758759760761762763764765766767768769770771772773774775776777778779780781782783784785786787788789790791792793794795
  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <!-- EN-Revision: 20872 -->
  3. <!-- Reviewed: no -->
  4. <sect1 id="zend.search.lucene.query-api">
  5. <title>Abfrage Erzeugungs API</title>
  6. <para>
  7. Zusätzlich zum automatischen Analysieren vom Abfragen ist es auch möglich diese durch eine
  8. <acronym>API</acronym> zu erzeugen.
  9. </para>
  10. <para>
  11. Benutzerabfragen können mit Abfragen die durch die API erstellte wurden kombiniert werden.
  12. Einfach den Abfrageparser verwenden um eine Abfrage von einem String zu erstellen:
  13. <programlisting language="php"><![CDATA[
  14. $query = Zend_Search_Lucene_Search_QueryParser::parse($queryString);
  15. ]]></programlisting>
  16. </para>
  17. <sect2 id="zend.search.lucene.queries.exceptions">
  18. <title>Abfrageparser Ausnahmen</title>
  19. <para>
  20. Der Abfrageparser kann zwei Typen von Ausnahmen erstellen.
  21. <itemizedlist>
  22. <listitem>
  23. <para>
  24. <classname>Zend_Search_Lucene_Exception</classname> wird geworfen wenn
  25. irgendwas im Abfrageparser selbst falsch läuft.
  26. </para>
  27. </listitem>
  28. <listitem>
  29. <para>
  30. <classname>Zend_Search_Lucene_Search_QueryParserException</classname> wird
  31. geworfen wenn ein Fehler im Syntax der Abfrage ist.
  32. </para>
  33. </listitem>
  34. </itemizedlist>
  35. Es ist eine gute Idee die
  36. <classname>Zend_Search_Lucene_Search_QueryParserException</classname>s abzufangen und
  37. richtig abzuarbeiten:
  38. <programlisting language="php"><![CDATA[
  39. try {
  40. $query = Zend_Search_Lucene_Search_QueryParser::parse($queryString);
  41. } catch (Zend_Search_Lucene_Search_QueryParserException $e) {
  42. echo "Abfrage Syntax Fehler: " . $e->getMessage() . "\n";
  43. }
  44. ]]></programlisting>
  45. </para>
  46. <para>
  47. Die selbe Technik sollte für die find() Methode des
  48. <classname>Zend_Search_Lucene</classname> Objektes verwendet werden.
  49. </para>
  50. <para>
  51. Beginnend mit 1.5 werden Abfrageparser Exceptions standardmäßig unterdrückt. Wenn eine
  52. Abfrage nicht konform mit der Abfragesprache ist, dann wird Sie mithilfe des aktuellen
  53. Standardanalysators gestückelt und alle Begriffsstücke werden für die Suche verwendet.
  54. Die
  55. <methodname>Zend_Search_Lucene_Search_QueryParser::dontSuppressQueryParsingExceptions()</methodname>
  56. Methode kann verwendet werden um Exceptions einzuschalten. Die
  57. <methodname>Zend_Search_Lucene_Search_QueryParser::suppressQueryParsingExceptions()</methodname>
  58. und
  59. <methodname>Zend_Search_Lucene_Search_QueryParser::queryParsingExceptionsSuppressed()</methodname>
  60. Methoden sind auch dazu gedacht das Verhalten der Exceptionsbehandlung zu verwalten.
  61. </para>
  62. </sect2>
  63. <sect2 id="zend.search.lucene.queries.term-query">
  64. <title>Begriffsabfrage</title>
  65. <para>
  66. Begriffsabfragen können für das Suchen mit einem einzelnen Begriff verwendet werden.
  67. </para>
  68. <para>
  69. Abfragestring:
  70. </para>
  71. <programlisting language="querystring"><![CDATA[
  72. word1
  73. ]]></programlisting>
  74. <para>oder</para>
  75. <para>
  76. Aufbau der Abfrage mit der <acronym>API</acronym>:
  77. </para>
  78. <programlisting language="php"><![CDATA[
  79. $term = new Zend_Search_Lucene_Index_Term('word1', 'field1');
  80. $query = new Zend_Search_Lucene_Search_Query_Term($term);
  81. $hits = $index->find($query);
  82. ]]></programlisting>
  83. <para>
  84. Das Term Feld ist optional. <classname>Zend_Search_Lucene</classname> durchsucht alle
  85. indizierten Felder in jedem Dokument wenn das Feld nicht spezifiziert wurde:
  86. <programlisting language="php"><![CDATA[
  87. // Sucht nach 'word1' in allen indizierten Feldern
  88. $term = new Zend_Search_Lucene_Index_Term('wort1');
  89. $query = new Zend_Search_Lucene_Search_Query_Term($term);
  90. $hits = $index->find($query);
  91. ]]></programlisting>
  92. </para>
  93. </sect2>
  94. <sect2 id="zend.search.lucene.queries.multiterm-query">
  95. <title>Mehrfache Begriffsabfrage</title>
  96. <para>
  97. Mehrfache Begriffsabfragen sind für Suchen mit einem Satz von Begriffen gedacht.
  98. </para>
  99. <para>
  100. Jeder Begriff dieses Satzes kann als <emphasis>required</emphasis> (notwendig),
  101. <emphasis>prohibited</emphasis> (verboten) oder <emphasis>neither</emphasis> (weder
  102. noch) definiert werden.
  103. <itemizedlist>
  104. <listitem>
  105. <para>
  106. <emphasis>required</emphasis> bedeutet, dass Dokumente, die diesen
  107. Begriff nicht enthalten, nicht der Abfrage entsprechen;
  108. </para>
  109. </listitem>
  110. <listitem>
  111. <para>
  112. <emphasis>prohibited</emphasis> bedeutet, dass Dokumente, die diesen
  113. Begriff enthalten, nicht der Abfrage entsprechen;
  114. </para>
  115. </listitem>
  116. <listitem>
  117. <para>
  118. <emphasis>neither</emphasis>, in welchem Fall Dokumenten den Begriff weder
  119. nicht enthalten dürfen, noch den Begriff enthalten müssen. Nichtsdestrotrotz
  120. muß ein Dokument mindestens einem Begriff entsprechen, um der Abfrage
  121. zu entsprechen.
  122. </para>
  123. </listitem>
  124. </itemizedlist>
  125. </para>
  126. <para>
  127. Wenn einer Abfrage mit notwendigen Begriffen optionale Betriffe hinzugefügt werden,
  128. werden beide Abfragen das gleiche Set an Ergebnissen haben, aber der optionale Begriff
  129. kann die Bewertung der passenden Dokumente beeinflussen.
  130. </para>
  131. <para>
  132. Beide Suchmethoden können für Mehrfache Begriffsabfragen verwendet werden.
  133. </para>
  134. <para>
  135. Abfragestring:
  136. </para>
  137. <programlisting language="querystring"><![CDATA[
  138. +word1 author:word2 -word3
  139. ]]></programlisting>
  140. <itemizedlist>
  141. <listitem><para>'+' wird für notwendige Begriffe verwendet.</para></listitem>
  142. <listitem><para>'-' wird für verbotene Begriffe verwendet.</para></listitem>
  143. <listitem>
  144. <para>
  145. Der 'field:' Präfix wird für die Angabe des Dokumentenfelds für die Suche
  146. verwendet. Wenn er weggelassen wird, werden alle Felder durchsucht.
  147. </para>
  148. </listitem>
  149. </itemizedlist>
  150. <para>oder</para>
  151. <para>
  152. Aufbau der Abfrage mit der <acronym>API</acronym>:
  153. </para>
  154. <programlisting language="php"><![CDATA[
  155. $query = new Zend_Search_Lucene_Search_Query_MultiTerm();
  156. $query->addTerm(new Zend_Search_Lucene_Index_Term('word1'), true);
  157. $query->addTerm(new Zend_Search_Lucene_Index_Term('word2', 'author'),
  158. null);
  159. $query->addTerm(new Zend_Search_Lucene_Index_Term('word3'), false);
  160. $hits = $index->find($query);
  161. ]]></programlisting>
  162. <para>
  163. Es ist auch möglich Begriffslisten in einem MultiTerm Anfrage Konstruktor zu
  164. spezifizieren:
  165. <programlisting language="php"><![CDATA[
  166. $terms = array(new Zend_Search_Lucene_Index_Term('word1'),
  167. new Zend_Search_Lucene_Index_Term('word2', 'author'),
  168. new Zend_Search_Lucene_Index_Term('word3'));
  169. $signs = array(true, null, false);
  170. $query = new Zend_Search_Lucene_Search_Query_MultiTerm($terms, $signs);
  171. $hits = $index->find($query);
  172. ]]></programlisting>
  173. </para>
  174. <para>
  175. Das <varname>$signs</varname> Array enthält Informationen über den Begriffstyp:
  176. <itemizedlist>
  177. <listitem>
  178. <para>
  179. <constant>TRUE</constant> wird für notwendige Begriffe verwendet.
  180. </para>
  181. </listitem>
  182. <listitem>
  183. <para>
  184. <constant>FALSE</constant> wird für verbotene Begriffe verwendet.
  185. </para>
  186. </listitem>
  187. <listitem>
  188. <para>
  189. <constant>NULL</constant> wird für weder notwendige noch verbotene Begriffe
  190. verwendet.
  191. </para>
  192. </listitem>
  193. </itemizedlist>
  194. </para>
  195. </sect2>
  196. <sect2 id="zend.search.lucene.queries.boolean-query">
  197. <title>Boolsche Abfragen</title>
  198. <para>
  199. Boolsche Abfragen erlauben die Erstellung von Abfragen die andere Abfragen und boolsche
  200. Operatoren verwenden.
  201. </para>
  202. <para>
  203. Jede Subabfrage in einem Set kann als <emphasis>required</emphasis>,
  204. <emphasis>prohibited</emphasis>, oder <emphasis>optional</emphasis> definiert werden.
  205. <itemizedlist>
  206. <listitem>
  207. <para>
  208. <emphasis>required</emphasis> bedeutet das Dokumente die dieser Unterabfrage
  209. nicht entsprechen auch der Gesamtabfrage nicht entsprechen;
  210. </para>
  211. </listitem>
  212. <listitem>
  213. <para>
  214. <emphasis>prohibited</emphasis> bedeutet das Dokumente die dieser
  215. Unterabfrage entsprechen auch der Gesamtabfrage nicht entsprechen;
  216. </para>
  217. </listitem>
  218. <listitem>
  219. <para>
  220. <emphasis>optional</emphasis>, in dem Fall das entsprechende Dokumente in
  221. der Unterabfrage weder verboten noch benötigt werden. Ein Dokument muß
  222. trotzdem zumindest in 1 Unterabfrage entsprechen damit es der in der
  223. Gesamtabfrage entspricht.
  224. </para>
  225. </listitem>
  226. </itemizedlist>
  227. </para>
  228. <para>
  229. Wenn optionale Unterabfragen einer Abfrage mit benötigen Unterabfragen hinzugefügt
  230. werden, werden beide Abfragen das gleiche Ergebnisset haben, aber die optionale
  231. Unterabfrage kann die Wertung der passenden Dokumente beeinflussen.
  232. </para>
  233. <para>
  234. Beide Suchmethoden können für boolsche Abfragen verwendet werden.
  235. </para>
  236. <para>
  237. Abfrage String:
  238. </para>
  239. <programlisting language="querystring"><![CDATA[
  240. +(word1 word2 word3) (author:word4 author:word5) -(word6)
  241. ]]></programlisting>
  242. <itemizedlist>
  243. <listitem>
  244. <para>
  245. '+' wird verwendet um eine benötigte Unterabfrage zu definieren.
  246. </para>
  247. </listitem>
  248. <listitem>
  249. <para>
  250. '-' wird verwendet um eine verbotene Unterabfrage zu definieren.
  251. </para>
  252. </listitem>
  253. <listitem>
  254. <para>
  255. 'field:' Der Prefix wird verwendet um ein Feld des Dokuments für eine Suche zu
  256. markieren. Wenn es nicht angegeben wird, werden alle Felder durchsucht.
  257. </para>
  258. </listitem>
  259. </itemizedlist>
  260. <para>oder</para>
  261. <para>
  262. Aufbau der Abfrage durch die <acronym>API</acronym>:
  263. </para>
  264. <programlisting language="php"><![CDATA[
  265. $query = new Zend_Search_Lucene_Search_Query_Boolean();
  266. $subquery1 = new Zend_Search_Lucene_Search_Query_MultiTerm();
  267. $subquery1->addTerm(new Zend_Search_Lucene_Index_Term('word1'));
  268. $subquery1->addTerm(new Zend_Search_Lucene_Index_Term('word2'));
  269. $subquery1->addTerm(new Zend_Search_Lucene_Index_Term('word3'));
  270. $subquery2 = new Zend_Search_Lucene_Search_Query_MultiTerm();
  271. $subquery2->addTerm(new Zend_Search_Lucene_Index_Term('word4', 'author'));
  272. $subquery2->addTerm(new Zend_Search_Lucene_Index_Term('word5', 'author'));
  273. $term6 = new Zend_Search_Lucene_Index_Term('word6');
  274. $subquery3 = new Zend_Search_Lucene_Search_Query_Term($term6);
  275. $query->addSubquery($subquery1, true /* benötigt (required) */);
  276. $query->addSubquery($subquery2, null /* optional */);
  277. $query->addSubquery($subquery3, false /* verboten (prohibited) */);
  278. $hits = $index->find($query);
  279. ]]></programlisting>
  280. <para>
  281. Es ist auch möglich Listen von Unterabfragen im Konstruktor der Boolschen Abfrage zu
  282. definieren:
  283. <programlisting language="php"><![CDATA[
  284. ...
  285. $subqueries = array($subquery1, $subquery2, $subquery3);
  286. $signs = array(true, null, false);
  287. $query = new Zend_Search_Lucene_Search_Query_Boolean($subqueries, $signs);
  288. $hits = $index->find($query);
  289. ]]></programlisting>
  290. </para>
  291. <para>
  292. Das <varname>$signs</varname> Array enthält Informationen über den Typ der Unterabfrage:
  293. <itemizedlist>
  294. <listitem>
  295. <para>
  296. <constant>TRUE</constant> wird verwendet um eine benötigte Unterabfrage zu
  297. definieren.
  298. </para>
  299. </listitem>
  300. <listitem>
  301. <para>
  302. <constant>FALSE</constant> wird verwendet um eine verbotene Unterabfrage zu
  303. definieren.
  304. </para>
  305. </listitem>
  306. <listitem>
  307. <para>
  308. <constant>NULL</constant> wird verwendet um eine Unterabfrage zu definieren
  309. die weder benötigt noch verboten ist.
  310. </para>
  311. </listitem>
  312. </itemizedlist>
  313. </para>
  314. <para>
  315. Jede Abfrage die boolsche Operatoren verwendet kann, kann auch auch umgeschrieben werden
  316. damit Sie die Vorzeichen-Schreibweise verwendet und mit Hilfe der API erstellt wird. Zum
  317. Beispiel:
  318. <programlisting language="querystring"><![CDATA[
  319. word1 AND (word2 AND word3 AND NOT word4) OR word5
  320. ]]></programlisting>
  321. ist identisch mit
  322. <programlisting language="querystring"><![CDATA[
  323. (+(word1) +(+word2 +word3 -word4)) (word5)
  324. ]]></programlisting>
  325. </para>
  326. </sect2>
  327. <sect2 id="zend.search.lucene.queries.wildcard">
  328. <title>Wildcard Abfragen</title>
  329. <para>
  330. Wildcard Abfragen können dazu verwendet werden um nach Dokumenten zu suchen die Strings
  331. enthalten welche den spezifizierten Patterns entsprechen.
  332. </para>
  333. <para>
  334. Das '?' Symbol wird als Wildcard für ein einzelnes Zeichen verwendet.
  335. </para>
  336. <para>
  337. Das '*' Symbol wird als Woldcard für mehrere Zeichen verwendet.
  338. </para>
  339. <para>
  340. Abfragestring:
  341. <programlisting language="querystring"><![CDATA[
  342. field1:test*
  343. ]]></programlisting>
  344. </para>
  345. <para>oder</para>
  346. <para>
  347. Abfrageerstellung durch die API:
  348. <programlisting language="php"><![CDATA[
  349. $pattern = new Zend_Search_Lucene_Index_Term('test*', 'field1');
  350. $query = new Zend_Search_Lucene_Search_Query_Wildcard($pattern);
  351. $hits = $index->find($query);
  352. ]]></programlisting>
  353. </para>
  354. <para>
  355. Die Ausdrucksfelder sind optional. <classname>Zend_Search_Lucene</classname> durchsucht
  356. alle Felder in jedem Dokument wenn kein Feld spezifiziert wurde:
  357. <programlisting language="php"><![CDATA[
  358. $pattern = new Zend_Search_Lucene_Index_Term('test*');
  359. $query = new Zend_Search_Lucene_Search_Query_Wildcard($pattern);
  360. $hits = $index->find($query);
  361. ]]></programlisting>
  362. </para>
  363. </sect2>
  364. <sect2 id="zend.search.lucene.queries.fuzzy">
  365. <title>Fuzzy Abfragen</title>
  366. <para>
  367. Fuzzy Abfragen können verwendet werden um nach Dokumenten zu Suchen die Strings
  368. enthalten welche Ausdrücken entsprechen die den spezifizierten Ausdrücken ähnlich sind.
  369. </para>
  370. <para>
  371. Abfrage String:
  372. <programlisting language="querystring"><![CDATA[
  373. field1:test~
  374. ]]></programlisting>
  375. Diese Abfrage trifft Dokumente welche die Wörter 'test' 'text' 'best' und andere
  376. enthalten.
  377. </para>
  378. <para>oder</para>
  379. <para>
  380. Abfrageerstellung durch die API:
  381. <programlisting language="php"><![CDATA[
  382. $term = new Zend_Search_Lucene_Index_Term('test', 'field1');
  383. $query = new Zend_Search_Lucene_Search_Query_Fuzzy($term);
  384. $hits = $index->find($query);
  385. ]]></programlisting>
  386. </para>
  387. <para>
  388. Optional kann die Ähnlichkeit nach dem "~" Zeichen spezifiziert werden.
  389. </para>
  390. <para>
  391. Abfrage String:
  392. <programlisting language="querystring"><![CDATA[
  393. field1:test~0.4
  394. ]]></programlisting>
  395. </para>
  396. <para>oder</para>
  397. <para>
  398. Abfrageerstellung durch die API:
  399. <programlisting language="php"><![CDATA[
  400. $term = new Zend_Search_Lucene_Index_Term('test', 'field1');
  401. $query = new Zend_Search_Lucene_Search_Query_Fuzzy($term, 0.4);
  402. $hits = $index->find($query);
  403. ]]></programlisting>
  404. </para>
  405. <para>
  406. Das Term Feld ist optional. <classname>Zend_Search_Lucene</classname> durchsucht alle
  407. Felder in jedem Dokument ob ein Feld nicht spezifiziert ist:
  408. <programlisting language="php"><![CDATA[
  409. $term = new Zend_Search_Lucene_Index_Term('test');
  410. $query = new Zend_Search_Lucene_Search_Query_Fuzzy($term);
  411. $hits = $index->find($query);
  412. ]]></programlisting>
  413. </para>
  414. </sect2>
  415. <sect2 id="zend.search.lucene.queries.phrase-query">
  416. <title>Phrasenabfrage</title>
  417. <para>
  418. Phrasenabfragen können für das Suchen einer Phrase innerhalb von Dokumenten verwendet
  419. werden.
  420. </para>
  421. <para>
  422. Phrasenabfragen sind sehr flexibel und erlauben dem Benutzer oder Entwickler nach
  423. exakten Phrasen zu suchen wie auch nach 'ungenauen' Phrasen.
  424. </para>
  425. <para>
  426. Phrasen können auch Lücken oder mehrere Begriffe an der selben Stelle enthalten; diese
  427. können mit Hilfe das Analysators für verschiedene Zwecke generiert werden, z.B. kann ein
  428. Begriff verdoppelt werden, um das Gewicht des Begriffs zu erhöhen oder verschiedene
  429. Synonyme können an einer Stelle platziert werden.
  430. </para>
  431. <programlisting language="php"><![CDATA[
  432. $query1 = new Zend_Search_Lucene_Search_Query_Phrase();
  433. // Füge 'word1' an der relativen Position 0 hinzu.
  434. $query1->addTerm(new Zend_Search_Lucene_Index_Term('word1'));
  435. // Füge 'word2' an der relativen Position 1 hinzu.
  436. $query1->addTerm(new Zend_Search_Lucene_Index_Term('word2'));
  437. // Füge 'word3' an der relativen Position 3 hinzu.
  438. $query1->addTerm(new Zend_Search_Lucene_Index_Term('word3'), 3);
  439. ...
  440. $query2 = new Zend_Search_Lucene_Search_Query_Phrase(
  441. array('word1', 'word2', 'word3'), array(0,1,3));
  442. ...
  443. // Abfrage ohne eine Lücke.
  444. $query3 = new Zend_Search_Lucene_Search_Query_Phrase(
  445. array('word1', 'word2', 'word3'));
  446. ...
  447. $query4 = new Zend_Search_Lucene_Search_Query_Phrase(
  448. array('word1', 'word2'), array(0,1), 'annotation');
  449. ]]></programlisting>
  450. <para>
  451. Eine Phrasenabfrage kann in einem Schritt mit einem Klassenkonstruktor erstellt werden
  452. oder Schritt für Schritt mit der
  453. <methodname>Zend_Search_Lucene_Search_Query_Phrase::addTerm()</methodname> Methode.
  454. </para>
  455. <para>
  456. Der <classname>Zend_Search_Lucene_Search_Query_Phrase</classname> Klassenkonstruktor
  457. nimmt drei optionale Argumente entgegen:
  458. </para>
  459. <programlisting language="php"><![CDATA[
  460. Zend_Search_Lucene_Search_Query_Phrase(
  461. [array $terms[, array $offsets[, string $field]]]
  462. );
  463. ]]></programlisting>
  464. <para>
  465. Der <varname>$terms</varname> Parameter ist ein Array von Strings die ein Set von
  466. Phrasen Strings enthalten. Wenn er ausgelassen wird oder <constant>NULL</constant> ist,
  467. wird eine leere Abfrage erstellt.
  468. </para>
  469. <para>
  470. Der <varname>$offsets</varname> Parameter ist von ganzen Zahlen, welche den Offset von
  471. Begriffen in einer Phrase enthalten. Wenn er ausgelassen wird oder
  472. <constant>TRUE</constant> ist, werden die Positionen der Begriffe als sequentiell, ohne
  473. Zwischenräume, angenommen.
  474. </para>
  475. <para>
  476. Der <varname>$field</varname> Parameter ist ein String, der das zu durchsuchende
  477. Dokumentenfeld angibt. Wenn dies ausgelassen wird oder <constant>TRUE</constant>
  478. entspricht, wird das Standardfeld durchsucht.
  479. </para>
  480. <programlisting language="php"><![CDATA[
  481. $query =
  482. new Zend_Search_Lucene_Search_Query_Phrase(array('zend', 'framework'));
  483. ]]></programlisting>
  484. <para>
  485. Wird nach der Phrase 'zend framework' in allen Feldern suchen.
  486. </para>
  487. <programlisting language="php"><![CDATA[
  488. $query = new Zend_Search_Lucene_Search_Query_Phrase(
  489. array('zend', 'download'), array(0, 2)
  490. );
  491. ]]></programlisting>
  492. <para>
  493. Es wird nach der Phrase 'zend ????? download' gesucht und die Phrasen 'zend platform
  494. download', 'zend studio download', 'zend core download', 'zend framework download' und
  495. so weiter werden gefunden.
  496. </para>
  497. <programlisting language="php"><![CDATA[
  498. $query = new Zend_Search_Lucene_Search_Query_Phrase(
  499. array('zend', 'framework'), null, 'title'
  500. );
  501. ]]></programlisting>
  502. <para>
  503. Wird nach der Phrase 'zend framework' im 'title' Feld suchen.
  504. </para>
  505. <para>
  506. Die <methodname>Zend_Search_Lucene_Search_Query_Phrase::addTerm()</methodname> Methode
  507. nimmt zwei Argumente entgeben. Ein <classname>Zend_Search_Lucene_Index_Term</classname>
  508. Objekt ist erforderlich und die Position optional:
  509. </para>
  510. <programlisting language="php"><![CDATA[
  511. Zend_Search_Lucene_Search_Query_Phrase::addTerm(
  512. Zend_Search_Lucene_Index_Term $term[, integer $position]
  513. );
  514. ]]></programlisting>
  515. <para>
  516. <varname>$term</varname> enthält den nächsten Begriff in der Phrase. Er muss das selbe
  517. Feld ansprechen wie der vorherige Begriff. Andernfalls wird eine Ausnahme geworfen.
  518. </para>
  519. <para>
  520. <varname>$position</varname> gibt die Position des Begriffes an.
  521. </para>
  522. <programlisting language="php"><![CDATA[
  523. $query = new Zend_Search_Lucene_Search_Query_Phrase();
  524. $query->addTerm(new Zend_Search_Lucene_Index_Term('zend'));
  525. $query->addTerm(new Zend_Search_Lucene_Index_Term('framework'));
  526. ]]></programlisting>
  527. <para>
  528. Demnach wird hier nach der Phrase 'zend framework' gesucht.
  529. </para>
  530. <programlisting language="php"><![CDATA[
  531. $query = new Zend_Search_Lucene_Search_Query_Phrase();
  532. $query->addTerm(new Zend_Search_Lucene_Index_Term('zend'), 0);
  533. $query->addTerm(new Zend_Search_Lucene_Index_Term('framework'), 2);
  534. ]]></programlisting>
  535. <para>
  536. Es wird nach der Phrase 'zend ????? download' gesucht und die Phrasen 'zend platform
  537. download', 'zend studio download', 'zend core download', 'zend framework download' und
  538. so weiter werden gefunden.
  539. </para>
  540. <programlisting language="php"><![CDATA[
  541. $query = new Zend_Search_Lucene_Search_Query_Phrase();
  542. $query->addTerm(new Zend_Search_Lucene_Index_Term('zend', 'title'));
  543. $query->addTerm(new Zend_Search_Lucene_Index_Term('framework', 'title'));
  544. ]]></programlisting>
  545. <para>
  546. Es wird nach der Phrase 'zend framework' im 'title' Feld gesucht.
  547. </para>
  548. <para>
  549. Der Ungenauigkeitsfaktor (slop factor) legt die Anzahl der anderen Wörter fest die
  550. zwischen den spezifizierten Phrasenabfragen erlaubt sind. Wenn der Wert 0 ist, ist die
  551. entsprechende Abfrage eine exakte Suche nach der Phrase. Für größere Werte funktioniert
  552. das ähnlich dem WITHIN (innerhalb) oder NEAR (nahe) Operator.
  553. </para>
  554. <para>
  555. Der Ungenauigkeitsfaktor ist tatsächlich eine veränderbare Distanz, wobei die
  556. Veränderung dem Verschieben von Begriffen in der Phrasenabfrage entspricht. Um zum
  557. Beispiel die Reihenfolge von zwei Wörtern zu wechseln, werden zwei Verschiebungen
  558. benötigt (die erste Verschiebung plaziert die Wörter übereinander). Um also die
  559. Neusortierung der Phrasen zu erlauben, muß der Ungenauigkeitsfaktor mindestens zwei
  560. sein.
  561. </para>
  562. <para>
  563. Exaktere Treffer werden höher bewertet als ungenauere Treffer, so dass die
  564. Suchergebnisse nach der Genauigkeit sortiert werden. Die Ungenauigkeit liegt
  565. standardmäßig bei 0, was exakte Treffer erfordert.
  566. </para>
  567. <para>
  568. Der Ungenauigkeitsfaktor kannnach der Erstellung der Abfrage zugeordnet werden:
  569. </para>
  570. <programlisting language="php"><![CDATA[
  571. // Query without a gap.
  572. $query =
  573. new Zend_Search_Lucene_Search_Query_Phrase(array('word1', 'word2'));
  574. // Search for 'word1 word2', 'word1 ... word2'
  575. $query->setSlop(1);
  576. $hits1 = $index->find($query);
  577. // Search for 'word1 word2', 'word1 ... word2',
  578. // 'word1 ... ... word2', 'word2 word1'
  579. $query->setSlop(2);
  580. $hits2 = $index->find($query);
  581. ]]></programlisting>
  582. </sect2>
  583. <sect2 id="zend.search.lucene.queries.range">
  584. <title>Bereichsabfragen</title>
  585. <para>
  586. <link linkend="zend.search.lucene.query-language.range">Bereichsabfragen</link> sind
  587. dazu gedacht Terme innerhalb eines spezifizierten Intervalls zu suchen.
  588. </para>
  589. <para>
  590. Abfragestring:
  591. <programlisting language="querystring"><![CDATA[
  592. mod_date:[20020101 TO 20030101]
  593. title:{Aida TO Carmen}
  594. ]]></programlisting>
  595. </para>
  596. <para>oder</para>
  597. <para>
  598. Abfrageerstellung durch die API:
  599. <programlisting language="php"><![CDATA[
  600. $from = new Zend_Search_Lucene_Index_Term('20020101', 'mod_date');
  601. $to = new Zend_Search_Lucene_Index_Term('20030101', 'mod_date');
  602. $query = new Zend_Search_Lucene_Search_Query_Range(
  603. $from, $to, true // inclusive
  604. );
  605. $hits = $index->find($query);
  606. ]]></programlisting>
  607. </para>
  608. <para>
  609. Begriffsfelder sind optional. <classname>Zend_Search_Lucene</classname> durchsucht alle
  610. Felder wenn das Feld nicht spezifiziert wurde:
  611. <programlisting language="php"><![CDATA[
  612. $from = new Zend_Search_Lucene_Index_Term('Aida');
  613. $to = new Zend_Search_Lucene_Index_Term('Carmen');
  614. $query = new Zend_Search_Lucene_Search_Query_Range(
  615. $from, $to, false // non-inclusive
  616. );
  617. $hits = $index->find($query);
  618. ]]></programlisting>
  619. </para>
  620. <para>
  621. Jede (aber nicht beide) der Begrenzungsausdrücke kann auf <constant>TRUE</constant>
  622. gesetzt werden. <classname>Zend_Search_Lucene</classname> sucht vom Anfang oder bis zum
  623. Ende des Verzeichnisses für die spezifizierten Feld(er) für diesen Fall:
  624. <programlisting language="php"><![CDATA[
  625. // Sucht nach ['20020101' TO ...]
  626. $from = new Zend_Search_Lucene_Index_Term('20020101', 'mod_date');
  627. $query = new Zend_Search_Lucene_Search_Query_Range(
  628. $from, null, true // inclusive
  629. );
  630. $hits = $index->find($query);
  631. ]]></programlisting>
  632. </para>
  633. </sect2>
  634. </sect1>