Zend_Locale-Parsing.xml 26 KB


  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <!-- Reviewed: no -->
  3. <!-- EN-Revision: 15103 -->
  4. <sect1 id="zend.locale.parsing">
  5. <title>正規化および地域化</title>
  6. <para>
  7. <classname>Zend_Locale_Format</classname> は、<classname>Zend_Locale</classname> が内部で使用しているコンポーネントです。
  8. ロケール対応のクラスは、<classname>Zend_Locale_Format</classname>
  9. を用いて数値や日付の正規化および地域化を行います。
  10. 正規化とは、さまざまな形式で表されるデータ (日付など) を取り込んで解析し、
  11. 標準化された構造化表現 (year、month、day の各要素からなる配列など) に変換することです。
  12. </para>
  13. <para>
  14. まったく同じ文字列からなる数値や日付でも、
  15. 異なる習慣や規約を使用している人が見ると異なる意味にとられることがあります。
  16. 数値や日付を、あいまいさをなくして正確に解釈するには、
  17. これらの文字列を正規化し、標準化されたデータ構造に変換する必要があります。
  18. したがって、<classname>Zend_Locale_Format</classname> のすべてのメソッドは、
  19. 入力データを処理するためにロケール情報を必要とします。
  20. <note>
  21. <title>デフォルトの "root" ロケール</title>
  22. <para>
  23. ロケールを省略した場合は、正規化や地域化の際に
  24. 標準の "root" ロケールを使用します。
  25. これは予期せぬ動作を引き起こす可能性があります。
  26. さまざまなロケールの入力を扱ったり、特定のロケールで出力したい場合などに注意が必要です。
  27. </para>
  28. </note>
  29. </para>
  30. <sect2 id="zend.locale.number.normalize">
  31. <title>数値の正規化: getNumber($input, Array $options)</title>
  32. <para>
  33. 標準の
  34. <ulink url="http://en.wikipedia.org/wiki/Decimal">十進形式</ulink>
  35. (例: "3.14") とは異なる
  36. <ulink url="http://en.wikipedia.org/wiki/Numeral">数値形式</ulink>
  37. には、さまざまなものがあります。
  38. 数値を正規化するには <code>getNumber()</code>
  39. 関数を使用します。これは、標準の十進形式を返します。
  40. このマニュアルにおける数値関連の説明はすべて、特にことわりがない限り
  41. <ulink url="http://en.wikipedia.org/wiki/Arabic_numerals">アラビア数字 (0,1,2,3,4,5,6,7,8,9)</ulink>
  42. を想定したものです。オプションの配列で 'locale'
  43. を指定し、桁区切り文字および小数点を定義することができます。
  44. また、配列に 'precision' を指定すると、
  45. あふれた桁を結果から取り除きます。
  46. </para>
  47. <example id="zend.locale.number.normalize.example-1">
  48. <title>数値の正規化</title>
  49. <programlisting role="php"><![CDATA[
  50. $locale = new Zend_Locale('de_AT');
  51. $number = Zend_Locale_Format::getNumber('13.524,678',
  52. array('locale' => $locale,
  53. 'precision' => 3)
  54. );
  55. print $number; // 13524.678 を返します
  56. ]]>
  57. </programlisting>
  58. </example>
  59. <sect3 id="zend.locale.number.normalize.precision">
  60. <title>計算の精度</title>
  61. <para>
  62. <code>getNumber($value, array $options = array())</code> では非常に大きな数値も正規化できるので、
  63. PHP の通常の数値計算のように精度が限られている計算をする前には注意しましょう。
  64. たとえば <code>if
  65. ((string)int_val($number) != $number) {
  66. <ulink url="http://www.php.net/bc">BCMath</ulink>
  67. あるいは
  68. <ulink url="http://www.php.net/gmp">GMP</ulink>
  69. を使用するなど。
  70. </code>
  71. 実際にインストールされている PHP のほとんどは、
  72. BCMath 拡張モジュールをサポートしています。
  73. </para>
  74. <para>
  75. また、結果の十進表現の精度も、<code>getNumber()</code>
  76. のオプション <code>'precision'</code> で指定した長さに丸められます。
  77. 精度を指定しなかった場合は、丸め処理は行われません。
  78. 精度を指定するには、PHP の整数のみを使用します。
  79. </para>
  80. <para>
  81. 十進表現で表した結果を丸めるのではなく指定した桁数で切り詰めたい場合は、
  82. オプション <code>'number_format'</code> を代わりに使用します。
  83. 十進表現の精度を定義するには、必要な桁数ぶんのゼロを指定します。
  84. 結果の丸めは行われません。つまり、もし <code>number_format</code>
  85. で定義した精度がゼロなら、
  86. "1.6" は "1" であり、"2" とはなりません。
  87. 例を参照ください。
  88. </para>
  89. <example id="zend.locale.number.normalize.precision.example-1">
  90. <title>精度を指定した数値の正規化</title>
  91. <programlisting role="php"><![CDATA[
  92. $locale = new Zend_Locale('de_AT');
  93. $number = Zend_Locale_Format::getNumber('13.524,678',
  94. array('precision' => 1,
  95. 'locale' => $locale)
  96. );
  97. print $number; // 13524.7 を返します
  98. $number = Zend_Locale_Format::getNumber('13.524,678',
  99. array('number_format' => '#.00',
  100. 'locale' => $locale)
  101. );
  102. print $number; // 13524.67 を返します
  103. ]]>
  104. </programlisting>
  105. </example>
  106. </sect3>
  107. </sect2>
  108. <sect2 id="zend.locale.number.localize">
  109. <title>数値の地域化</title>
  110. <para>
  111. <code>toNumber($value, array $options = array())</code> は、
  112. <link linkend="zend.locale.appendix">サポートするロケール</link>
  113. にあわせて数値を正規化します。
  114. この関数は、指定した数値を、特定のロケールにあわせて書式化した文字列を返します。
  115. オプション 'number_format' を使用すると、
  116. <code>toNumber()</code> で用いるデフォルト以外の数値書式を設定できます。
  117. </para>
  118. <example id="zend.locale.number.localize.example-1">
  119. <title>数値の地域化</title>
  120. <programlisting role="php"><![CDATA[
  121. $locale = new Zend_Locale('de_AT');
  122. $number = Zend_Locale_Format::toNumber(13547.36,
  123. array('locale' => $locale));
  124. // 13.547,36 を返します
  125. print $number;
  126. ]]>
  127. </programlisting>
  128. </example>
  129. <para>
  130. <note>
  131. <title>長さは無制限</title>
  132. <para>
  133. <code>toNumber()</code> が地域化できる数値の長さには制限がありません。
  134. 整数や浮動小数点数の範囲の制限を受けることはありません。
  135. </para>
  136. </note>
  137. </para>
  138. <para>
  139. <code>getNumber()</code> と同様の方法で、
  140. <code>toNumber()</code> も精度を扱います。
  141. 精度を指定しなかった場合は、地域化した数値を完全な状態で返します。
  142. </para>
  143. <example id="zend.locale.number.localize.example-2">
  144. <title>精度を指定した数値の地域化</title>
  145. <programlisting role="php"><![CDATA[
  146. $locale = new Zend_Locale('de_AT');
  147. $number = Zend_Locale_Format::toNumber(13547.3678,
  148. array('precision' => 2,
  149. 'locale' => $locale));
  150. // 13.547,37 を返します
  151. print $number;
  152. ]]>
  153. </programlisting>
  154. </example>
  155. <para>
  156. オプション 'number_format' を使用すると、
  157. 独自の数値書式を定義することができます。
  158. 書式を指定するには、以下の CLDR 書式を使用します。
  159. ロケールを元に、桁区切りや小数点、その他の数値記号を取得します。
  160. たとえば、ドイツ語では小数点として
  161. ',' を用いますが、英語では小数点に '.' を使用します。
  162. </para>
  163. <table id="zend.locale.number.localize.table-1">
  164. <title>自分で作成する数値書式用の書式トークン
  165. </title>
  166. <tgroup cols="4">
  167. <thead>
  168. <row>
  169. <entry>トークン</entry>
  170. <entry>説明</entry>
  171. <entry>書式の例</entry>
  172. <entry>出力結果</entry>
  173. </row>
  174. </thead>
  175. <tbody>
  176. <row>
  177. <entry>#0</entry>
  178. <entry>桁区切りや小数点のない数値を生成します。</entry>
  179. <entry>#0</entry>
  180. <entry>1234567</entry>
  181. </row>
  182. <row>
  183. <entry>,</entry>
  184. <entry>指定した桁数ごとに区切り文字を生成します。</entry>
  185. <entry>#,##0</entry>
  186. <entry>1,234,567</entry>
  187. </row>
  188. <row>
  189. <entry>#,##,##0</entry>
  190. <entry>最初は標準の 3 桁で区切り、それ以降は 2 桁ごとに区切ります。</entry>
  191. <entry>#,##,##0</entry>
  192. <entry>12,34,567</entry>
  193. </row>
  194. <row>
  195. <entry>.</entry>
  196. <entry>小数点を生成します。</entry>
  197. <entry>#0.#</entry>
  198. <entry>1234567.1234</entry>
  199. </row>
  200. <row>
  201. <entry>0</entry>
  202. <entry>小数点以下を指定した桁数にします。</entry>
  203. <entry>#0.00</entry>
  204. <entry>1234567.12</entry>
  205. </row>
  206. </tbody>
  207. </tgroup>
  208. </table>
  209. <example id="zend.locale.number.localize.example-3">
  210. <title>自分で定義した数値書式の使用</title>
  211. <programlisting role="php"><![CDATA[
  212. $locale = new Zend_Locale('de_AT');
  213. $number = Zend_Locale_Format::toNumber(13547.3678,
  214. array('number_format' => '#,#0.00',
  215. 'locale' => 'de')
  216. );
  217. // 1.35.47,36 を返します
  218. print $number;
  219. $number = Zend_Locale_Format::toNumber(13547.3,
  220. array('number_format' => '#,##0.00',
  221. 'locale' => 'de')
  222. );
  223. // 13.547,30 を返します
  224. print $number;
  225. ]]>
  226. </programlisting>
  227. </example>
  228. </sect2>
  229. <sect2 id="zend.locale.number.test">
  230. <title>数値かどうかの確認</title>
  231. <para>
  232. <code>isNumber($value, array $options = array())</code> は、指定した文字列が数値であるかどうかを
  233. true あるいは false で返します。
  234. </para>
  235. <example id="zend.locale.number.test.example-1">
  236. <title>数値かどうかの確認</title>
  237. <programlisting role="php"><![CDATA[
  238. $locale = new Zend_Locale();
  239. if (Zend_Locale_Format::isNumber('13.445,36', array('locale' => 'de_AT')) {
  240. print "数値です";
  241. } else {
  242. print "数値ではありません";
  243. }
  244. ]]>
  245. </programlisting>
  246. </example>
  247. </sect2>
  248. <sect2 id="zend.locale.float.normalize">
  249. <title>浮動小数点値の正規化</title>
  250. <para>
  251. 浮動小数点値のパースには <code>getFloat($value, array $options = array())</code>
  252. 関数を使用します。これは、浮動小数点値を返します。
  253. </para>
  254. <example id="zend.locale.float.normalize.example-1">
  255. <title>浮動小数点値の正規化</title>
  256. <programlisting role="php"><![CDATA[
  257. $locale = new Zend_Locale('de_AT');
  258. $number = Zend_Locale_Format::getFloat('13.524,678',
  259. array('precision' => 2,
  260. 'locale' => $locale)
  261. );
  262. // 13524.68 を返します
  263. print $number;
  264. ]]>
  265. </programlisting>
  266. </example>
  267. </sect2>
  268. <sect2 id="zend.locale.float.localize">
  269. <title>浮動小数点値の地域化</title>
  270. <para>
  271. <code>toFloat()</code> は、浮動小数点値の地域化を行います。
  272. この関数は、指定した数値を地域化した文字列を返します。
  273. </para>
  274. <example id="zend.locale.float.localize.example-1">
  275. <title>浮動小数点値の地域化</title>
  276. <programlisting role="php"><![CDATA[
  277. $locale = new Zend_Locale('de_AT');
  278. $number = Zend_Locale_Format::toFloat(13547.3655,
  279. array('precision' => 1,
  280. 'locale' => $locale)
  281. );
  282. // 13.547,4 を返します
  283. print $number;
  284. ]]>
  285. </programlisting>
  286. </example>
  287. </sect2>
  288. <sect2 id="zend.locale.float.test">
  289. <title>浮動小数点値かどうかの確認</title>
  290. <para>
  291. <code>isFloat($value, array $options = array())</code> は、
  292. 指定した文字列が浮動小数点値であるかどうかを
  293. true あるいは false で返します。
  294. </para>
  295. <example id="zend.locale.float.test.example-1">
  296. <title>浮動小数点値かどうかの確認</title>
  297. <programlisting role="php"><![CDATA[
  298. $locale = new Zend_Locale('de_AT');
  299. if (Zend_Locale_Format::isFloat('13.445,36', array('locale' => $locale)) {
  300. print "float です";
  301. } else {
  302. print "float ではありません";
  303. }
  304. ]]>
  305. </programlisting>
  306. </example>
  307. </sect2>
  308. <sect2 id="zend.locale.integer.normalize">
  309. <title>整数値の正規化</title>
  310. <para>
  311. 整数値のパースには <code>getInteger()</code>
  312. 関数を使用します。これは、整数値を返します。
  313. </para>
  314. <example id="zend.locale.integer.normalize.example-1">
  315. <title>整数値の正規化</title>
  316. <programlisting role="php"><![CDATA[
  317. $locale = new Zend_Locale('de_AT');
  318. $number = Zend_Locale_Format::getInteger('13.524,678',
  319. array('locale' => $locale));
  320. // 13524 を返します
  321. print $number;
  322. ]]>
  323. </programlisting>
  324. </example>
  325. </sect2>
  326. <sect2 id="zend.locale.integer.localize">
  327. <title>整数値の地域化</title>
  328. <para>
  329. <code>toInteger($value, array $options = array())</code> は、整数値の地域化を行います。
  330. この関数は、指定した数値を地域化した文字列を返します。
  331. </para>
  332. <example id="zend.locale.integer.localize.example-1">
  333. <title>整数値の地域化</title>
  334. <programlisting role="php"><![CDATA[
  335. $locale = new Zend_Locale('de_AT');
  336. $number = Zend_Locale_Format::toInteger(13547.3655,
  337. array('locale' => $locale));
  338. // 13.547 を返します
  339. print $number;
  340. ]]>
  341. </programlisting>
  342. </example>
  343. </sect2>
  344. <sect2 id="zend.locale.integer.test">
  345. <title>整数値かどうかの確認</title>
  346. <para>
  347. <code>isInteger($value, array $options = array())</code> は、
  348. 指定した文字列が整数値であるかどうかを
  349. true あるいは false で返します。
  350. </para>
  351. <example id="zend.locale.integer.test.example-1">
  352. <title>整数値かどうかの確認</title>
  353. <programlisting role="php"><![CDATA[
  354. $locale = new Zend_Locale('de_AT');
  355. if (Zend_Locale_Format::isInteger('13.445', array('locale' => $locale)) {
  356. print "integer です";
  357. } else {
  358. print "integer ではありません";
  359. }
  360. ]]>
  361. </programlisting>
  362. </example>
  363. </sect2>
  364. <sect2 id="zend.locale.numbersystems">
  365. <title>数値系の変換</title>
  366. <para>
  367. <classname>Zend_Locale_Format::convertNumerals()</classname> は、
  368. さまざまな
  369. <ulink url="http://en.wikipedia.org/wiki/Arabic_numerals">数値系</ulink>
  370. の間での数値の変換を行います。その中には、標準のアラビア数字
  371. (0,1,2,3,4,5,6,7,8,9) も含まれます。これは、
  372. <ulink url="http://en.wikipedia.org/wiki/Eastern_Arabic_numerals">東アラビア数字</ulink>
  373. とは異なることに注意しましょう。
  374. 東アラビア数字は、アラビア語で数字を表す際に用いられることがあります。
  375. サポートしていない数値系を使用すると、例外が発生します。
  376. これは、不正確な変換によってエラーが発生するのを防ぐためです。
  377. 指定された数値系で数値として扱われない文字は、
  378. そのまま出力に渡されます。つまり、単位の区切り文字などは変換されないということです。
  379. <classname>Zend_Locale*</classname> コンポーネントは、CLDR が提供するデータに依存しています
  380. (<ulink url="http://unicode.org/cldr/data/diff/supplemental/languages_and_scripts.html?sortby=date">
  381. 言語ごとの文字の一覧</ulink> を参照ください)。
  382. </para>
  383. <para>
  384. CLDR では今後、Europena/Latin 数値のことを "Latin"
  385. と呼ぶようになります。4 文字に略した形式は "Latn" です。
  386. また、CLDR ではこの数値系のことを "scripts" と呼ぶようになります。
  387. </para>
  388. <para>
  389. あるウェブフォームから、東アラビア文字 "١‎٠٠"
  390. が入力されたとしましょう。
  391. 大半のソフトウェアや PHP の関数は、アラビア数字にしか対応していません。
  392. 幸いなことに、この入力をそれと同等のラテン数字 "100"
  393. に変換するのは簡単で、<code>convertNumerals($inputNumeralString,
  394. $sourceNumeralSystem, $destNumeralSystem)</code> を使用するだけです。
  395. これは、数値 <code>$input</code> の script を
  396. <code>$sourceNumeralSystem</code> から <code>$destNumeralSystem</code>
  397. に変換したものを返します。
  398. </para>
  399. <example id="zend.locale.numbersystems.example-1">
  400. <title>東アラビア文字から European/Latin 文字への変換</title>
  401. <programlisting role="php"><![CDATA[
  402. $arabicScript = "١‎٠٠"; // アラビア文字で "100" を表します
  403. $latinScript = Zend_Locale_Format::convertNumerals($arabicScript,
  404. 'Arab',
  405. 'Latn');
  406. print "\n元の内容: " . $arabicScript;
  407. print "\n正規化したもの: " . $latinScript;
  408. ]]>
  409. </programlisting>
  410. </example>
  411. <para>
  412. 同様にして、任意の数値系をその他サポートしている数値系に変換できます。
  413. </para>
  414. <example id="zend.locale.numbersystems.example-2">
  415. <title>ラテン文字から東アラビア文字への変換</title>
  416. <programlisting role="php"><![CDATA[
  417. $latinScript = '123';
  418. $arabicScript = Zend_Locale_Format::convertNumerals($latinScript,
  419. 'Latn',
  420. 'Arab');
  421. print "\n元の内容: ".$latinScript;
  422. print "\n地域化したもの: " . $arabicScript;
  423. ]]>
  424. </programlisting>
  425. </example>
  426. <example id="zend.locale.numbersystems.example-3">
  427. <title>各国語での文字名を使用した、4 文字の CLDR 文字コードの取得</title>
  428. <programlisting role="php"><![CDATA[
  429. function getScriptCode($scriptName, $locale)
  430. {
  431. $scripts2names = Zend_Locale_Data::getList($locale, 'script');
  432. $names2scripts = array_flip($scripts2names);
  433. return $names2scripts[$scriptName];
  434. }
  435. echo getScriptCode('Latin', 'en'); // 出力は "Latn" となります
  436. echo getScriptCode('Tamil', 'en'); // 出力は "Taml" となります
  437. echo getScriptCode('tamoul', 'fr'); // 出力は "Taml" となります
  438. ]]>
  439. </programlisting>
  440. </example>
  441. <sect3 id="zend.locale.appendix.numberscripts.supported">
  442. <title>サポートしている数値系の一覧</title>
  443. <para>
  444. <table id="zend.locale.appendix.numberscripts.supported.table">
  445. <title>サポートしている数値系の一覧</title>
  446. <tgroup cols="2">
  447. <thead>
  448. <row>
  449. <entry>記法名</entry>
  450. <entry>文字</entry>
  451. </row>
  452. </thead>
  453. <tbody>
  454. <row>
  455. <entry>アラビア文字</entry>
  456. <entry>Arab</entry>
  457. </row>
  458. <row>
  459. <entry>バリ文字</entry>
  460. <entry>Bali</entry>
  461. </row>
  462. <row>
  463. <entry>ベンガル文字</entry>
  464. <entry>Beng</entry>
  465. </row>
  466. <row>
  467. <entry>デーバナーガリー文字</entry>
  468. <entry>Deva</entry>
  469. </row>
  470. <row>
  471. <entry>グジャラート文字</entry>
  472. <entry>Gujr</entry>
  473. </row>
  474. <row>
  475. <entry>グルムキー文字</entry>
  476. <entry>Guru</entry>
  477. </row>
  478. <row>
  479. <entry>カンナダ文字</entry>
  480. <entry>Knda</entry>
  481. </row>
  482. <row>
  483. <entry>カンボジア文字</entry>
  484. <entry>Khmr</entry>
  485. </row>
  486. <row>
  487. <entry>ラオ文字</entry>
  488. <entry>Laoo</entry>
  489. </row>
  490. <row>
  491. <entry>リンブ文字</entry>
  492. <entry>Limb</entry>
  493. </row>
  494. <row>
  495. <entry>マラヤーラム文字</entry>
  496. <entry>Mlym</entry>
  497. </row>
  498. <row>
  499. <entry>モンゴル文字</entry>
  500. <entry>Mong</entry>
  501. </row>
  502. <row>
  503. <entry>ミャンマー文字</entry>
  504. <entry>Mymr</entry>
  505. </row>
  506. <row>
  507. <entry>タイレ文字</entry>
  508. <entry>Talu</entry>
  509. </row>
  510. <row>
  511. <entry>N'Ko</entry>
  512. <entry>Nkoo</entry>
  513. </row>
  514. <row>
  515. <entry>オリヤー文字</entry>
  516. <entry>Orya</entry>
  517. </row>
  518. <row>
  519. <entry>タミール文字</entry>
  520. <entry>Taml</entry>
  521. </row>
  522. <row>
  523. <entry>テルグ文字</entry>
  524. <entry>Telu</entry>
  525. </row>
  526. <row>
  527. <entry>タイ文字</entry>
  528. <entry>Tale</entry>
  529. </row>
  530. <row>
  531. <entry>チベット文字</entry>
  532. <entry>Tibt</entry>
  533. </row>
  534. </tbody>
  535. </tgroup>
  536. </table>
  537. </para>
  538. </sect3>
  539. </sect2>
  540. </sect1>
  541. <!--
  542. vim:se ts=4 sw=4 et:
  543. -->