第 20章多言語対応

目次
20.1. ロケールのサポート
20.1.1. 概要
20.1.2. 利点
20.1.3. 問題点
20.2. 文字セットサポート
20.2.1. サポートされる文字セット
20.2.2. 文字セットの設定
20.2.3. サーバ・クライアント間の自動文字セット変換
20.2.4. 推奨文書

本章では、管理者の立場から見た、利用可能な多言語対応機能について説明します。 PostgreSQLでは、2つの手法を用いた多言語対応をサポートします。

20.1. ロケールのサポート

ロケールのサポートはアルファベット、並び換え、数字の書式など文化的嗜好を配慮したあるアプリケーションを対象にします。 PostgreSQL は、サーバのオペレーティングシステムが提供する、標準 ISO C と POSIX のロケール機能を使用します。 これ以上の情報についてはお使いのシステムのドキュメントを参照下さい。

20.1.1. 概要

ロケールのサポートは、initdb を使用してデータベースクラスタを作成するとき自動的に初期化されます。 initdb はその実行環境のロケール設定にしたがってデータベースクラスタを初期化します。 そのため、システムがデータベースクラスタで使用したいロケールを使用するようにすでに設定してある場合は何も行う必要はありません。 違うロケールを使用したい場合(またはシステムのロケール設定が不明な場合)は、initdb--locale オプションで、希望のロケールを指定することができます。 以下に例を示します。

initdb --locale=sv_SE

この例の設定はロケールをスウェーデン(SE)で使用されているスウェーデン語(sv)に合わせています。 ほかにも en_US(米国英語)や fr_CA(カナダのフランス語)などの設定もできます。 ロケールに複数の文字セットが使用可能であれば、cs_CZ.ISO8859-2 のように記述することができます。 お使いのシステムでどのロケールがどういう名前で使えるかはオペレーティングシステムのベンダがどのようなものを提供しているかと、何がインストールされているかに依存します。

英語の照合規則でスペイン語のメッセージを使用するときなど、時として複数のロケールの規則を併用すると便利です。 これをサポートするために、ロケールには多言語対応規則の特定の箇所だけを管理する一連のサブカテゴリがあります。

LC_COLLATE文字列の並び換え順
LC_CTYPE文字の分類(文字とはどんなもの?大文字小文字を区別しない?)
LC_MESSAGESメッセージの言語
LC_MONETARY通貨書式
LC_NUMERIC数字の書式
LC_TIME日付と時刻の書式

これらのカテゴリの名前は、特定のカテゴリについてのロケールの選択を上書きするための initdb オプションの名前としてそのまま使用できます。 たとえば、ロケールをカナダのフランス語に設定しながら通貨書式については米国の規則を使用するには、initdb --locale=fr_CA --lc-monetary=en_US とします。

システムがロケールをサポートしていないように動作させたい場合は、特別なロケールの C、もしくは POSIX を使用してください。

一部のロケールカテゴリでは、その値をデータベースクラスタの存続時間に対して固定しなければならないものがあります。 つまり、initdb の実行後はこれらの値を変更できなくなります。 LC_COLLATELC_CTYPE がこのカテゴリに入ります。 これらはインデックスの並び替え順に影響をおよぼすため、固定されていなければなりません。 さもないと、テキスト型列上のインデックスは破壊されます。 PostgreSQLinitdb が検知した LC_COLLATELC_CTYPE の値を記録して、この固定が必ず守られるようにします。 サーバは起動された時点で自動的にこれらの 2 つの値を採用します。

その他のロケールカテゴリは、サーバ実行中いつでも、ロケールカテゴリと同じ名前の実行時設定変数を設定することで、希望値に変更することができます。 (詳細は 項16.4 を参照してください。) initdb で選択されたデフォルトは、実際のところ、サーバの起動時にデフォルトとして動作するように postgresql.conf 設定ファイルに書き込まれるだけです。 この代入文を postgresql.conf から削除すると、サーバは実行環境の設定をそのまま使用します。

サーバのロケールの動作はどのクライアントの環境にも依存せず、サーバが参照できる環境変数で決まります。 ですからサーバを稼動させる前に正しいロケール設定を行うように注意してください。 結果としてサーバとクライアントで異なるロケールが設定されているとメッセージはそれらがどこから生じたかによって、異なる言語で表示されます。

注意: 実行環境のロケールをそのまま使用するということは、ほとんどのオペレーションシステムでは次のような意味をもちます。 指定されたロケールカテゴリ (たとえば照合) について、設定するものが見つかるまで、以下の環境変数がこの順番で調べられます。LC_ALLLC_COLLATE (個別のカテゴリに対応する変数)、LANG。 これらのいずれの環境変数も設定されない場合に、ロケールはデフォルトで C に設定されます。

メッセージの言語を設定する目的で、メッセージ多言語化ライブラリの中にはすべてのロケール設定を上書きする環境変数 LANGUAGE を検索するものがあります。 嘘だと思うのであればより詳細な情報を得るためお使いのオペレーティングシステムの文書、特に gettext の文書を参照して下さい。

ユーザの選択した言語にメッセージを翻訳するには NLSを構築時に有効にする必要があります。 このオプションは他のロケールサポートとは独立しています。

20.1.2. 利点

ロケールのサポートは特に以下の機能に影響を与えます。

  • ORDER BY 問い合わせによる並び替え順

  • 一群の to_char 関数

PostgreSQL でロケールサポートを使用する際のたったひとつの重大な欠点は実行速度です。ですから、本当に必要なときのみロケールを使用してください。

20.1.3. 問題点

上記の説明に従って設定を行ったにもかかわらずロケールのサポートが正常に動作しない場合、オペレーティングシステムのロケールサポートが正確に設定されているか確認してください。 指定されたロケールがインストールされているかどうか確認するために、オペレーティングシステムが提供していれば、locale -aコマンドを使用をすることができます。

PostgreSQLが想定しているロケールを実際に使用しているかどうかを確認してください。 LC_COLLATELC_CTYPE の設定はinitdb 時に決定され、initdb を再実行しない限り変更することはできません。 LC_MESSAGESLC_MONETARYなど他のロケール設定はサーバが起動した時の環境変数によって初めに決定されます。 pg_controldataユーティリティプログラムを使用してデータベースのLC_COLLATELC_CTYPEを検査することができます。

ソース配布物のsrc/test/localeディレクトリには、PostgreSQLのロケールサポート用の試験一式があります。

エラーメッセージ内のテキストを解析してサーバ側のエラーを扱っているクライアントアプリケーションでは、サーバのメッセージが異なる言語で記載されると、明らかに問題になります。 こうしたアプリケーションの作者には、エラーコードスキーマで代替させることを推奨します。

メッセージ翻訳のカタログのメンテナンスには PostgreSQL に選択した言語を話させてみたいという数多くのボランティアのたゆみのない努力を必要としています。 もしあなたの言語が現在使えなかったり完全に翻訳されない場合あなたの助力をよろしくお願いします。 もし助力いただけるのであれば第46章を参照するか開発グループのメーリングリストに投稿して下さい。