はじめに

以前の1.0 試験範囲こちら

バージョン情報

この試験範囲は、バージョン3.0です。

この試験は、304試験のバージョン2.0を分割してできました。

304試験バージョン2.0から3.0への、試験範囲の変更点の詳細は、 こちらにあります。

バージョン 2.xの試験範囲はこちらにあります。


試験範囲の翻訳

このwikiに、以下の試験範囲の翻訳があります:


試験範囲

課題 361: High Availability Cluster Management

361.1 HAの概念と原理 (総重量: 6)

総重量 6
説明 HAクラスタの特性とデザイン手法を理解している必要があります。

Key Knowledge Areas:

  • HAとSRE(Site Reliability Engineering)の目的を理解している。
  • 一般的なクラスタ構成を理解している。
  • クラスタの再構成の仕組みとリカバリを理解している。
  • 与えられた目的に対して、適切なクラスタ構成を設計できる。
  • HAのアプリケーション的な観点を理解している。
  • HAの操作上の問題点を理解している。

用語とユーティリティ:

  • アクティブ/パッシブ クラスタ
  • アクティブ/アクティブ クラスタ
  • フェイルオーバクラスタ
  • 負荷分散されたクラスタ
  • Shared-Nothingクラスタ
  • ディスク共有型クラスタ
  • クラスタリソース
  • クラスタサービス
  • Quorum
  • フェンス (Node and Resource Level Fencing)
  • スプリットブレイン
  • 冗長性
  • Mean Time Before Failure (MTBF)
  • Mean Time To Repair (MTTR)
  • Service Level Agreement (SLA)
  • Disaster Recovery
  • State Handling
  • レプリケーション
  • Session handling


361.2 負荷分散されたクラスタ (総重量: 8)

総重量 8
説明 LVSをどのようにインストール・設定・管理・トラブルシューティングか知っている。これには、keepalivedとldirectordの設定と利用も含まれる。また、HAProxyをインストール・設定・管理・トラブスシュートできる必要もある。

主な知識分野:

  • LVS / IPVSの概念の理解
  • VRRPの基礎の理解。
  • keepalivedの設定
  • ldirectordの設定
  • バックエンドサーバのネットワークの設定
  • HAProxyの理解
  • HAProxyの設定

用語とユーティリティ:

  • ipvsadm
  • syncd
  • LVS Forwarding (NAT, Direct Routing, Tunneling, Local Node)
  • コネクションスケジューリングアルゴリズム
  • keepalived 設定ファイル
  • ldirectord 設定ファイル
  • genhash
  • HAProxy 設定ファイル
  • ロードバランスアルゴリズム
  • ACLs


361.3フェイルオーバクラスタ (総重量: 8)

総重量 8
説明 Pacemakerクラスタのインストール・設定・管理・トラブルシューティングの経験がある。これには、Corosyncの利用も含まれる。対象は、Pacemakerのバージョン2.xと、Corosyncのバージョン2.xである。

主な知識分野:

  • Pacemaker(CIB, CRMd, PEngine, LRMd, DC, STONITHd)の構造とコンポーネントの理解
  • Pacemakerクラスタ設定の管理
  • Pacemakerリソースクラス (OCF, LSB, Systemd, Service, STONITH, Nagios)の理解
  • Pacemakerリソースの管理
  • リソースのルールと制限(ロケーション、オーダー、コロケーション)の管理。
  • 先進的なリソースの特徴(テンプレート・グループ・クローンリソース・マルチステートリソース)を管理。
  • ノード情報の取得と、ノードの死活監視の管理。
  • Pacemakerクラスタでの、クォーラムとフェンシングの管理。
  • 共有ストレージでの、スプリットブレンディテクター(Split Brain Detector)の設定。
  • pcsを利用したPacemakerの管理。
  • crmshを利用したPacemakerの管理。
  • Pacemakerと連動したcorosyncの設定と管理。
  • PacemekerのACLの知識。
  • 他のクラスタエンジン(OpenAIS, Heartbeat, CMAN)の知識。

用語とユーティリティ:

  • pcs
  • crm
  • crm_mon
  • crm_verify
  • crm_simulate
  • crm_shadow
  • crm_resource
  • crm_attribute
  • crm_node
  • crm_standby
  • cibadmin
  • corosync.conf
  • authkey
  • corosync-cfgtool
  • corosync-cmapctl
  • corosync-quorumtool
  • stonith_admin
  • stonith
  • ocf:pacemaker:ping
  • ocf:pacermaker:NodeUtilization
  • ocf:pacermaker:ocf:SysInfo
  • ocf:pacemaker:HealthCPU
  • ocf:pacemaker:HealthSMART
  • sbd


課題 362: HAクラスタストレージ

362.1 DRBD (総重量: 6)

総重量 6
説明 DRBDデバイスをインストール・設定・管理・トラブルシューティングする知識と経験がある。これには、Pacemakerの実施が含まれる。DRBDの設定はバージョン9.0.xを対象にしている。

主な知識分野:

  • DRBDの構造の理解。
  • DRBDのリソース・状態・レプリケーションモードの理解。
  • DRBDディスクとデバイスの設定。
  • DRBDのネットワークとメッシュの設定。
  • DRBDの自動修復と、エラーハンドリングの設定。
  • DRBDクォーラムとスプリットブレインとフェンシングのハンドラの設定。
  • drbdadmを利用したDRBDの管理。
  • drbdsetupとdrbdmetaの原理の理解。
  • 停止後のDRBDデバイスのレストアと完全性の検証。
  • PacemakerのDRBDへの統合。
  • LINSTORの構造と特徴の理解。

用語とユーティリティ:

  • Protocol A, B and C
  • Primary, Secondary
  • Three-way replication
  • drbd kernel module
  • drbdadm
  • drbdmon
  • drbdsetup
  • drbdmeta
  • /etc/drbd.conf
  • /etc/drbd.d/
  • /proc/drbd


362.2 クラスタストレージアクセス (総重量: 3)

総重量 3
説明 リモートのブロックストレージに、Linuxノードを接続することができる。HAとクラスタストレージでLVMを利用する、マルチパスの設定だけではなく、iSCSIの管理を含む一般的なSANの技術と構造の理解が含まれている。

主な知識分野:

  • Storage Area Network(SAN)の概念の理解。
  • Fibre Channelトポロジを含む、Fibre Channelの概念の理解。
  • iSCSIのターゲットとイニシエータの管理と理解。
  • Device Mapper Multipath I/O (DM-MPIO)の設定と理解。
  • Distributed Lock Manager (DLM)の概念と理解。
  • クラスタ化されたLVMの管理と理解。
  • Pacemakerを利用したDLMとLVMの管理。

用語とユーティリティ:

  • tgtadm
  • targets.conf
  • iscsiadm
  • iscsid.conf
  • /etc/multipath.conf
  • multipath
  • kpartx
  • pvmove
  • vgchange
  • lvchange



362.3 クラスタファイルシステム (総重量: 4)

総重量 4
説明 Cストール・管理・トラブルシューティングができる。これには、Linuxで利用可能な他のクラスタ化されたファイルシステムの知識が含まれる。

主な知識分野:

  • クラスタファイルシステムと分散ファイルシステムの原理の理解。
  • Distributed Lock Manager(DLM)の理解。
  • クラスタ上のGFS2ファイルシステムの、作成・管理・トラブルシューティング。
  • クラスタ上のOCFS2ファイルシステムの、作成・管理・トラブルシューティング。
  • O2CBクラスタスタックの知識。
  • AFSやLustreなどの、一般的に使われている他のクラスタファイルシステムの知識。

用語とユーティリティ:

  • mkfs.gfs2
  • mount.gfs2
  • fsck.gfs2
  • gfs2_grow
  • gfs2_edit
  • gfs2_jadd
  • mkfs.ocfs2
  • mount.ocfs2
  • fsck.ocfs2
  • tunefs.ocfs2
  • mounted.ocfs2
  • o2info
  • o2image



課題 363: HA分散ストレージ

363.1 GlusterFSストレージクラスタ (総重量: 5)

総重量 5
説明 GlusterFSストレージクラスタを管理・運用することができる。

主な知識分野:

  • GlusterFSの構造とコンポーネントの理解。
  • GlusterFS peer・trusted storage pool・brick・ボリュームの管理。
  • 存在しているGlusterFSのマウントと利用。
  • GlusterFSのHAの観点での設定。
  • GlusterFSクラスターのスケールアップ。
  • 障害が発生したBrickの置き換え。
  • 物理メディアに障害が発生した時の、GlusterFSの復旧。
  • 停止時のGlusfterFSクラスタのレストアと完全性の検証。
  • GNFSの知識

用語とユーティリティ:

  • gluster (関連するサブコマンドを含む)


363.2 Cephストレージクラスタ (総重量: 8)

総重量 8
説明 Cephクラスタの運用と管理ができる。これには、RGW, RDBデバイスとCephFSの設定が含まれる。

主な知識分野:

  • Cephの構造とコンポーネントの理解。
  • OSD, MGR, MON, MDSの管理。
  • placement groupとプールの管理と理解。
  • ストレージバックエンド(FileStoreとBlueStore)の理解。
  • Cephクラスタの初期化。
  • Rados Block Devicesの作成と管理。
  • CephFSボリューム(スナップショトを含む)の作成と管理。
  • 既存のCephFSのマウントと利用。
  • CRUSH mapの調整と理解
  • CephのHAの観点での設定。
  • Cephクラスタのスケールアップ。
  • 停止時のCephクラスタのレストアと完全性の検証。
  • Ceph updateの主要概念(update order, tunable、特徴を含む)の理解。

主な知識分野:

  • ceph-deploy (関連するサブコマンドを含む)
  • ceph.conf
  • ceph (関連するサブコマンドを含む)
  • rados (関連するサブコマンドを含む)
  • rdb (関連するサブコマンドを含む)
  • cephfs (関連するサブコマンドを含む)
  • ceph-volume (関連するサブコマンドを含む)
  • ceph-authtool
  • ceph-bluestore-tool
  • crushtool



課題 364: 単一ノードHA

364.1 ハードウエアとリソースのHA (総重量: 2)

総重量 2
説明 ハードウエア障害やリソース不足の可能性のため、ローカルノードの監視することができる。

主な知識分野:

  • 定期的なディスクチェックの実行を含む、smartmontoolsを利用したS.M.A.R.T値の監視と理解。
  • 特定のUPCイベントでの、システム停止の設定。
  • リソース枯渇時にアラートが出るように、monitを設定。

用語とユーティリティ:

  • smartctl
  • /etc/smartd.conf
  • smartd
  • nvme-cli
  • apcupsd
  • apctest
  • monit


364.2 先進的なRAID (総重量: 2)

総重量 2
説明 Linux上でソフトウエアRAIDのデバイスを管理することができる。これには、障害発生後にRAIDアレイをリカバリするだけではなく、partitonable RAIDやRAIDコンテナといった先進的な特徴が含まれます。

主な知識分野:

  • ホットスペアディスク・partitonable RAID・RAIDコンテナを含む、様々なRAIDレベルを利用してRAIDデバイスを管理する。
  • 存在しているRAIDに、デバイスを追加、あるいはデバイスを取り外す。
  • 存在しているのRAIDレベルを変更する。
  • 障害発生後、RAIDデバイスを修復する。
  • RAIDジオメトリと様々なメタデータフォーマットの理解。
  • 様々なRAIDレベルにおける、機能と性能特性の理解。
  • mdadmでの監視とレポートの設定。

用語とユーティリティ:

  • mdadm
  • /proc/mdstat
  • /proc/sys/dev/raid/*


364.3 先進的なLVM (総重量: 3)

総重量 3
説明 LVMボリュームを設定できる。これには、LVMスナップショット・プール・RAIDの管理も含まれる。

主な知識分野:

  • リニアボリュームとストライプボリュームを含む、LVMの管理と理解。
  • LVMボリュームの、拡張(extend)・伸長(grow)・shrink・移動(move)。
  • LVMスナップショットの管理と理解。
  • LVMのシンプール(thin pool)とシックプール(thick pool)の管理と理解。
  • LVM RAIDの管理と理解。

用語とユーティリティ:

  • /etc/lvm/lvm.conf
  • pvcreate
  • pvdisplay
  • pvmove
  • pvremove
  • pvresize
  • vgcreate
  • vgdisplay
  • vgreduce
  • lvconvert
  • lvcreate
  • lvdisplay
  • lvextend
  • lvreduce
  • lvresize


364.4 ネットワークHA (総重量: 5)

総重量 5
説明 冗長的なネットワーク接続の設定と、VLANの管理を行うことができる。さらに、BGPの基本的な理解をしている。

主な知識分野:

  • ネットワークインターフェースの結合(ボンディング)の設定と理解。
  • ネットワークの結合(bond)モードとアルゴリズム(active-backup, blance-tlb, balance-alb, 802.3ad, balance-rr, balance-xor, broadcast)。
  • RSTPを含むHA向けのスイッチ設定を設定する。
  • 通常と結合(ボンディング)されたネットワークでのVLANの設定。
  • 結合(ボンディング)とVLAN設定の永続化。
  • 自立システムと、外部への冗長的なアップリンクを管理するために利用されるBGPの原理を、理解している。
  • Linuxのトラフィックシェーピングと、制御能力の知識。

用語とユーティリティ:

  • bonding.ko (関連するサブコマンドを含む)
  • /etc/network/interfaces
  • /etc/sysconfig/networking-scripts/ifcfg-*
  • /etc/systemd/network/*.network
  • /etc/systemd/network/*.netdev
  • nmcli
  • /sys/class/net/bonding_masters
  • /sys/class/net/bond*/bonding/miimon
  • /sys/class/net/bond*/bonding/slaves
  • ifenslave
  • ip