ソースファイルの作成
Zend_Translate で使用できる
さまざまなソース形式についての説明を以下で行います。
大半のフォーマットは、何らかのツールを用いて生成しなければならないことに注意しましょう。
そのツールについては Zend Framework には含まれていません。
ほとんどのフォーマットについてはフリーの生成ツールが存在します。
Array ソースファイルの作成
Array ソースファイルは、単なる配列です。
しかし、専用のツールはないので自分でそれを定義しなければなりません。
とは言え、この配列は非常にシンプルです。
コードが期待通りに動作しているかを確認するのにも最も手っ取り早いでしょう。
翻訳作業を始めるにあたっては、一般的に最適なアダプタであるといえます。
'message1',
'message2' => 'message2',
'message3' => 'message3');
$german = array(
'message1' => 'Nachricht1',
'message2' => 'Nachricht2',
'message3' => 'Nachricht3');
$translate = new Zend_Translate('array', $english, 'en');
$translate->addTranslation($deutsch, 'de');
]]>
リリース 1.5 以降では、配列を外部のファイルに含めることもサポートしています。
ファイル名を指定すると、Zend_Translate
が自動的にそれをインクルードして配列を探します。
詳細は、次の例を参照ください。
'Nachricht1',
'message2' => 'Nachricht2',
'message3' => 'Nachricht3');
// コントローラ
$translate = new Zend_Translate('array', '/path/to/myarray.php', 'de');
]]>
配列を返さないファイルはインクルードできません。
また、このファイル内での出力はすべて無視されます。
Gettext ソースファイルの作成
Gettext ソースファイルは、GNU の gettext ライブラリで作成します。
あなたのコードをパースして gettext ソースファイルを作成してくれるツールが、
フリーで公開されています。このファイルは、拡張子が
*.mo のバイナリファイルとなります。
ファイルを作成するためのフリーソフトウェアのひとつに
poEdit
があります。これは、ファイルの作成だけでなく翻訳作業自体もサポートしています。
addTranslation('/path/to/german.mo', 'de');
]]>
ご覧の通り、アダプタの使用法はまったく同じです。
違っているのはたったの一点だけ。
array が gettext
になっているということです。
その他の部分は、どのアダプタを使用してもまったく同じになります。
gettext アダプタを使用する際には、
gettext の標準的なディレクトリ構造や bindtextdomain、
textdomain にこだわる必要はありません。
単にパスとファイル名をアダプタに渡せばいいのです。
ソースのエンコーディングには常に UTF-8
を使用しなければなりません。そうしないと、
複数のソースエンコーディングを使用することで問題が発生します。
たとえば、あるソースファイルは ISO-8815-11 でエンコードされており、
他のファイルは CP815 でエンコードされているとしましょう。
ソースファイルのエンコーディングはひとつしか指定できないので、
どちらか一方は正しく表示されなくなります。
UTF-8 は可搬性の高いフォーマットで、全言語をサポートしています。
すべての言語で UTF-8 を使用することで、
エンコーディングの非互換性による問題をなくすことができます。
gettext エディタの多くは、
空の翻訳文字列という形式で追加情報を記録します。
そのため、gettext アダプタは空の文字列の翻訳を行いません。
これらの情報は翻訳テーブルからは削除され、かわりに
getAdapterInfo() メソッドで取得できるようになります。
このメソッドは、追加された gettext
ファイルすべてから取得した情報を配列で返します。
ファイル名を配列のキーとして使用します。
getAdapterInfo());
]]>
TMX ソースファイルの作成
TMX ソースファイルは、新しい業界標準です。
XML ファイルを使用しているので、どんなエディタでも読み込め、
かつ人間にも読める形式であるという利点があります。
TMX ファイルはテキストエディタで作成することもできますし、
ツールを用いて作成することもできます。しかし、
現在使用できる TMX ソースファイル作成ツールの多くは
フリーソフトウェアではありません。
TMX ファイルの例
Nachricht1
message1
message2
Nachricht2
]]>
TMX ファイルには、同一ファイルに複数の言語を含めることができます。
含まれている言語はすべて自動的に追加されるので、
addLanguage() をコールする必要はありません。
ソース中の特定の言語のみを翻訳対象としたい場合は、オプション
'defined_language' を TRUE
に設定します。このオプションを指定した場合は、
対象としたい言語を addLanguage()
で明示的に指定します。このオプションのデフォルト設定は、
全言語を対象とするようになっています。
CSV ソースファイルの作成
CSV ソースファイルは、サイズが小さく可読性があります。
顧客が自分で翻訳をしたいということなら、
おそらく CSV アダプタを使用することになるでしょう。
CSV ファイルの例
addTranslation('path/to/other.csv', 'fr');
]]>
CSV アダプタで使用できるオプションは、
'delimiter' と 'limit' そして
'enclosure' の 3 つです。
CSV 文字列の標準の区切り文字は ';' 記号です
訳注: カンマ以外で区切ったら、もはや CSV でも何でもないのですが、
そのあたりはあまり気にしない方向で :-)
。
が、オプション 'delimiter' を使用すると、
別の区切り文字を使用することができます。
CSV ファイルのデフォルトの行長制限は '0' です。
この場合は、CSV ファイルの行末を自動的に検出します。
'limit' オプションに何らかの値を設定すると
CSV ファイルの読み込みが高速になりますが、
その長さを超えた部分は切り捨てられます。
CSV ファイルの値を囲む文字のデフォルトは '"' です。
別の文字を使用する場合は 'enclosure' オプションを設定します。
CSV ファイルの例 その 2
','));
$translate->addTranslation('/path/to/other.csv', 'fr');
]]>
CSV ファイルで非 ASCII 文字 (ウムラウトや UTF-8 文字など) を使用する場合は、
値を囲んでおく必要があります。値を囲むのを省略すると、
翻訳で文字が失われてしまったりする可能性があります。
INI ソースファイルの作成
INI ソースファイルは可読性がありますが、
翻訳以外のデータを含めるとサイズはそれほど小さくなりません。
直接顧客に変更させるようなデータの場合にも
INI アダプタが使えるでしょう。
INI ファイルの例
addTranslation('/path/to/other.ini', 'it');
]]>
INI にはいくつかの制約があります。
INI ファイルの値に非英数字が含まれる場合は、値をダブルクォート (")
で囲まなければなりません。また、ini ファイルのキーとしては使えない予約語があります。
予約語には NULL, yes, no, TRUE
そして FALSE があります。
値に NULL, no および FALSE
を指定するとそれは ""
と同じ扱いとなり、yes と TRUE を指定するとそれは
1 と同じ扱いとなります。
{}|&~![()" といった文字はキーの中では使えず、
また値の中で使用すると特別な意味を持つことになります。
予期せぬ挙動を起こすようなら、このアダプタを使わないようにしましょう。