本マニュアルはPowerGres on Linux HA の日常的な運用について記述したものです。より詳しい説明が 必要なときにはそれぞれのマニュアルを参照してください。マニュアルの参照についてはこちらを参照してくだ さい。
LifeKeeper GUI を起動するとダイアログが表示されます。Server Name、Login、Password にそれ ぞれログインするサーバ名、ユーザ名、パスワードを入力し、OK をクリックするとLifeKeeper GUI にロ グインすることができます。
コマンドラインからLifeKeeper GUI を起動するには以下のようにlkGUIapp コマンドを実行します。
# /opt/LifeKeeper/bin/lkGUIapp &
Web ブラウザからLifeKeeper GUI を起動するには以下のURL にアクセスします。server name には サーバ名を指定します。
http://server name:81/
LifeKeeper GUI にログインすると以下のような画面が表示されます。
LifeKeeper GUI の画面では以下のようにリソース階層やサーバ、リソースの状態を確認することができ ます。
LifeKeeper のマニュアルには「LifeKeeper on Linux 日本語マニュアル」CD-ROM に含まれるPDF ファ イル(「Release Notes」、「Planning and Instllation Guide」、「IP Recovery Kit Administration Guide」) とオンラインマニュアルがあります。
LifeKeeper のコマンドのマニュアルを参照するにはコマンドラインから以下のようにman コマンドを実行 します。name にはマニュアルを参照するコマンド名を指定します。
# man -M /opt/LifeKeeper/man name
例えば、lkstart コマンドのマニュアルを参照するには以下のようにman コマンドを実行します。
# man -M /opt/LifeKeeper/man lkstart
「Online Product Manual」を参照するにはWeb ブラウザから以下のURL にアクセスします。server name にはサーバ名を指定します。
http://server name:81/help/lksstart.htm
また、LifeKeeper GUI のメニューからHelp、Contents を選択することによって「Online Product Manual」を参照することもできます。
PowerGres のマニュアルには「PowerGres on Linux」CD-ROM に含まれるHTMLファイルがあります。
なお、PowerGres のマニュアルにはPostgreSQL と異なることを中心に記述されているので、PostgreSQL に関する詳しい説明はPostgreSQL のドキュメントを参照してください。 PostgreSQL のドキュメント(英語) は/usr/share/doc/powergres-version/html ディレクトリ以下に インストールされています。なお、PostgreSQL のドキュメント(日本語) については以下のURL を参照し てください。
コマンドラインから正常な状態を確認するには以下のようにlcdstatus コマンドを実行します。
# /opt/LifeKeeper/bin/lcdstatus -q
# /opt/LifeKeeper/bin/lkGUIapp &
LifeKeeper のログはパイプと循環ファイルによって実装されているため、テキストエディタから読み込む ことができません。コマンドラインからログを表示するにはroot ユーザで以下のようにlk log コマンドを 実行します。lk log コマンドはログを表示するためのコマンドです。log にはログの種類(log、LCD、LCM、 TTYLCM、remote exec、GUI、SNMP のいずれか) を指定します。
# /opt/LifeKeeper/bin/lk_log log
例えば、log という種類のログを/tmp/lk.log ファイルに出力するには以下のようにlk log コマンドを 実行します。
# /opt/LifeKeeper/bin/lk_log log > /tmp/lk.log
コミュニケーションパスの障害
COMMUNICATION TO srapc2051 BY 192.168.11.1/192.168.11.2 FAILED AT: 木12 月20 20:46:52 JST 2007
ネットワークの障害
LifeKeeper: pingfail: Local recovery failed for IP instance ip-133.137.45.71 /opt/LifeKeeper/bin/recover: recovery failed after event "ip,pingfail" using recovery at resource "ip-133.137.45.71" on failing resource "ip-133.137.45.71" ***ERROR*** recover[655,recover.C] 木12 月20 20:48:34 JST 2007: all attempts at local recovery have failed after event "ip,pingfail" occurred to resource "ip-133.137.45.71"
共有ディスクの障害
***ERROR*** ccissdev[237,ccissdev.C] 木12 月20 21:14:35 JST 2007: cannot open device "/dev/cciss/c0d6": No such device or address
PowerGres の障害
RECOVERY class=powergres event=recover name=powergres-/share/data STARTING AT: 木12 月20 21:20:24 JST 2007 /opt/LifeKeeper/bin/recover: resource "powergres-/share/data" with id "powergres-/share/data" has experienced failure event "powergres,recover" /opt/LifeKeeper/bin/recover: attempting recovery using resource "powergres-/share/data" after failure by event "powergres,recover" on resource "powergres-/share/data"
LifeKeeper では6 種類のログが記録されます。
このログにはLifeKeeper が保護しているアプリケーションやリソースに関する情報が含まれます。ア プリケーションのremove およびrestore スクリプトによって出力される情報、LifeKeeper の停止や 起動、サービスの起動やフェイルオーバーなど、LifeKeeper のほとんどのイベントがこのログに記録 されます。
このログにはLCD についての情報が含まれます。LifeKeeper データベースやその状態の変化に関す る情報がこのログに記録されます。
このログにはLCM についての情報が含まれます。TCP コミュニケーションパスのイベントや状態の 変化がこのログに記録されます。
このログにはTTYLCM についての情報が含まれます。TTY コミュニケーションパスのイベン トや状態の変化がこのログに記録されます。
このログにはすべてのリモートなLifeKeeper のリクエストが記録されます。
このログにはLifeKeeper GUI についての情報が含まれます。
このログにはSNMP トラップについての情報が含まれます。
PowerGres のログは標準ではデータベースクラスタディレクトリ以下のpg_log ディレクトリに格納され ます。
pg log ディレクトリにはログが標準ではpostgresql-%Y-%m-%d.log というファイル名で記 録されます。例えば、ログが2007 年12 月20 日12 時30 分38 秒から記録が開始されたときには postgresql-2007-12-30.log というファイル名になります。なお、ログファイルはテキストエディ タから読み込むことができます。 PowerGres のログについては「PostgreSQL 日本語マニュアル」の「17.7. エラー報告とログ取得」や「22.3. ログファイルの保守」を参照してください。
http://www.postgresql.jp/document/pg825doc/html/runtime-config-logging.html
http://www.postgresql.jp/document/pg825doc/html/runtime-config-logging.html
2007-12-25 14:37:55 JST [16058] LOG: database system was shut down at 2007-12-25 11:14:50 JST 2007-12-25 14:37:55 JST [16058] LOG: checkpoint record is at 0/42C858 2007-12-25 14:37:55 JST [16058] LOG: redo record is at 0/42C858; undo record is at 0/0; shutdown TRUE 2007-12-25 14:37:55 JST [16058] LOG: next transaction ID: 0/598; next OID: 10820 2007-12-25 14:37:55 JST [16058] LOG: next MultiXactId: 1; next MultiXactOffset: 0 2007-12-25 14:37:55 JST [16058] LOG: database system is ready
LifeKeeper ではSNMP トラップによってサービスの起動やフェイルオーバーなどのイベントを送信する ことができます。
# /opt/LifeKeeper/bin/lk_configsnmp ip
defCommunity public
# snmptrapd -P
なお、SNMP トラップによるイベントの送信については「Online Product Manual」の「Overview of LifeKeeper Event Forwarding via SNMP」も参照してください。「Online Product Manual」のタブか らContents を選択し、Configuring LifeKeeper、LifeKeeper Event Forwarding via SNMP、 Overview of LifeKeeper Event Forwarding via SNMP を選択すれば参照することができます。
LifeKeeper イベント | トラップ番号 | オブジェクト ID |
---|---|---|
LifeKeeper Startup Complete | 100 | .1.3.6.1.4.1.7359.1.0.100 |
LifeKeeper Shutdown Initiated | 101 | .1.3.6.1.4.1.7359.1.0.101 |
LifeKeeper Shutdown Complete | 102 | .1.3.6.1.4.1.7359.1.0.102 |
LifeKeeper Manual Switchover Initiated on Server | 110 | .1.3.6.1.4.1.7359.1.0.110 |
LifeKeeper Manual Switchover Complete - recovered list | 111 | .1.3.6.1.4.1.7359.1.0.111 |
LifeKeeper Manual Switchover Complete - failed list | 112 | .1.3.6.1.4.1.7359.1.0.112 |
LifeKeeper Node Failure Detected for Server | 120 | .1.3.6.1.4.1.7359.1.0.120 |
LifeKeeper Node Recovery Complete for Server - recovered list | 121 | .1.3.6.1.4.1.7359.1.0.121 |
LifeKeeper Node Recovery Complete for Server - failed list | 122 | .1.3.6.1.4.1.7359.1.0.122 |
LifeKeeper Resource Recovery Initiated | 130 | .1.3.6.1.4.1.7359.1.0.130 |
LifeKeeper Resource Recovery Failed | 131 | .1.3.6.1.4.1.7359.1.0.131 |
LifeKeeper Resource Recovery Complete | 132 | .1.3.6.1.4.1.7359.1.0.132 |
LifeKeeper Communications Path Up | 140 | .1.3.6.1.4.1.7359.1.0.140 |
LifeKeeper Communications Path Down | 141 | .1.3.6.1.4.1.7359.1.0.141 |
LifeKeeper を起動するにはroot ユーザで以下のようにlkstart コマンドを実行します。なお、LifeKeeper はLifeKeeper GUI を起動するときにはすでに起動していなければなりません。
# /opt/LifeKeeper/bin/lkstart
LifeKeeper を停止するにはroot ユーザで以下のようにlkstop コマンドを実行します。このコマンドを 実行するとLifeKeeper に保護されていたリソースのサービスも停止します。
# /opt/LifeKeeper/bin/lkstop
LifeKeeper に保護されているリソースのサービスを停止しません。
LifeKeeper に保護されているリソースのサービスをバックアップサーバにフェイルオーバーさせます。 なお、-r および-f オプションとともに使用することはできません。
システムを再起動したときにLifeKeeper を起動します。このオプションを指定しなければシステムを 再起動したときにLifeKeeper は停止したままになります。
例えば、LifeKeeper に保護されているリソースのサービスをバックアップサーバにフェイルオーバーさせ、 LifeKeeper を停止するには以下のようにlkstop コマンドを実行します。
# /opt/LifeKeeper/bin/lkstop -n
LifeKeeper GUI を起動するにはそれぞれのサーバでLifeKeeper GUI Server が起動していなければなり ません。
LifeKeeper GUI Server を起動するにはroot ユーザで以下のようにコマンドを実行します。
# /opt/LifeKeeper/bin/lkGUIserver start
LifeKeeper GUI Server を停止するにはroot ユーザで以下のようにコマンドを実行します。
# /opt/LifeKeeper/bin/lkGUIserver stop
PowerGres HA ではLifeKeeper によってPowerGres が保護されているため、pg ctl コマンドでPowerGres を停止したとしてもLifeKeeper によってローカルリカバリーされてしまいます。LifeKeeper に保護さ れているPowerGres を起動・停止するにはLifeKeeper からPowerGres リソースのサービスを起動・停止し なければなりません。
# /opt/LifeKeeper/bin/lkGUIapp &
コマンドラインからPowerGres リソースのサービスを起動・停止するにはroot ユーザで以下のように perform_action コマンドを実行します。perform_action コマンドはアクションスクリプトを実行するコ マンドです。tag にはPowerGres リソースのタグ名を指定します。action にはアクション名、サービスの起 動であればrestore、サービスの停止であればremove を指定します。
# /opt/LifeKeeper/bin/perform_action -t tag -a action
例えば、powergres-/share/data というタグ名のPowerGres リソースのサービスを停止するには以下の ようにperform_action コマンドを実行します。
# /opt/LifeKeeper/bin/perform_action -t \ powergres-/share/data -a remove
プライマリサーバを停止することによってすべてのリソースがバックアップサーバにフェイルオーバー することを確認します。なお、システムの停止によるフェイルオーバーを確認するにはプライマリサーバ のShutdown Strategy をSwitchover Resources に設定しなければなりません。プライマリサーバの Shutdown Strategy をSwitchover Resources に設定するにはLifeKeeper GUI から以下のように行い ます。
# /opt/LifeKeeper/bin/lkGUIapp &
バックアップサーバのPowerGres リソースのサービスを起動することによってスイッチオーバーすること を確認します。バックアップサーバのPowerGres リソースのサービスを起動するにはLifeKeeper GUI から 以下のように行います。PowerGres リソースのサービスの起動・停止についてはこちらも参照してください。
# /opt/LifeKeeper/bin/lkGUIapp &
コマンドラインからバックアップサーバのPowerGres リソースのサービスを起動するにはroot ユーザで 以下のようにlcdremexec コマンドを実行します。lcdremexec コマンドはコミュニケーションパスを通し てコマンドを実行するコマンドです。cmd には実行するコマンドを指定します。destname にはcmd を実行 するサーバを指定します。
# /opt/LifeKeeper/bin/lcdremexec -d destname -- cmd
例えばsrapc2051 というバックアップサーバでpowergres-/share/data というタグ名のPowerGres リ ソースのサービスを起動するには以下のようにlcdremexec コマンドを実行します。
# /opt/LifeKeeper/bin/lcdremexec -d srapc2051 -- perform_action -t powergres-/share/data -a restore
perform_action コマンドについてはこちらも参照してください。
FAQ については以下のURL も合わせて参照してください。
ユーザサイト
http://sios-steeleye.sios.com/
ユーザサイト内 FAQ
http://sios-steeleye.sios.com/modules/smartfaq/
# /opt/LifeKeeper/bin/lkpasswd user
なお、このパスワードはシステムのパスワードとは異なるため、パスワードを変更することによってシステ ムのパスワードは変更されません。
もし、画面が表示されなければアクセスするサーバが誤っているか、アクセスしたサーバでLifeKeeper が 起動していない可能性があります。アクセスするサーバが正しいことと、そのサーバでLifeKeeper が起動し ていることを確認してください。 画面は表示されるがStart ボタンが表示されないときはWeb ブラウザにJava Plug-in がインストールさ れていない可能性があります。Web ブラウザから以下のURL にアクセスし、Java Plug-in をインストール してください。
http://java.sun.com/products/plugin/
Unable to start the PowerGres server: psql failed: Password for user postgres: psql: fe_sendauth: no password supplied
Copyright © 2003-2008 SRA OSS, Inc. Japan