**以前のリビジョンの文書です**

機器管理

死活監視

  • 死活監視およびプロセス監視を継続的に行う。
    • ただし、個人的理由による環境変更が度々行われるため、メールによる通知は行わないものとする。
    • プロセス監視については、単にプロセスが動作していることを確認するものと、挙動が想定どおりであることを確かめるものがある。
  • 監視対象プロセスまたはサービス
    • 全般
      • SSH
      • NTPD
    • Web
      • Apache
    • DB
      • MySQL
    • DNS
      • BIND
      • DHCP
      • DHCPv6
    • LDAP
      • LDAP
    • PPPoE Router
      • mpd
      • UPnP
      • RA
      • DHCPv6 Client
      • DDNS
    • FTP
      • FTP
      • SFTP
    • AD
      • AD
    • Hyper-V
      • Hyper-V
    • VMware ESXi
      • VM

リソース監視

  • リソース監視には、単純にH/Wのリソースを得るものと、各プロセスのリソース消費を得るものがある。

ログ監視

  • 何のログ見てりゃいいかな。

復旧手順

想定される障害に対する復旧手順、または取得すべき情報の回収手順を記載しておきたいよね。

ハードウェア障害

  • HDDが故障した場合
  • Memory(non-ECC)が故障した場合
  • Memory(ECC)が故障した場合

ソフトウェア障害

  • バージョンアップによってサービスが立ち上がらなくなった場合

オペレーション障害

  • 誤ってファイルを消去した場合
    • ZFSによるsnapshotを取得している場合
    • ファイルバックアップが存在する場合

その他

  • 時刻同期の状態監視
    • NTPDによる時刻の同期状況を監視する。これについては、リソース監視と同様に扱う。
home/management/start.1312210675.txt.gz · 最終更新: 2011/08/01 23:57 by yuki
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0