- 目次
- 運用・保守の王道タスク「バックアップ」
- まずは基本、何に保存するか
- 頻度でピント?
- 情報処理技術者試験でのバックアップ問題
- リストアという難題
- バックアップデータの保存の問題
- バックアップとは似て非なる「レプリケーション」
- バックアップよりもリストアが重要
運用・保守の王道タスク「バックアップ」
バレーボール日本女子、パリオリンピック予選(*1)でほぼ予想通りの3位だった今日この頃(9月下旬)。Liveで試合を見ていて、絶対エース(ヒーロー、いやヒロインが1人)というよりも、「全体的にメンバーがみんな活躍しているなー」と感じました。メンバー交代してもほとんど関係なし、フルで入っていたのってキャプテンの古賀紗理那選手くらい。メンバー14人中10人~12人は出場していたはず。まさに、これこそバックアップ要員の底上げ!
ということで、今回のテーマは、無理やりこじつけたバックアップ。バックアップとは、データが破損した時にその壊れたデータと入れ替える為に元のデータを予め複製しておくこと、らしいです。さらに、データを長期的に保管することが目的の場合、バックアップと同様にデータを複製するが、「データアーカイブ」といって区分することがあります。(以上 バックアップについての定義などから)
【参考】ITトレンド バックアップ とは
(https://it-trend.jp/words/bkup)
システム、特に企業システムは24時間365日動いているものも多いため、ハードウェア障害、ソフトウェアのバグ、さらには人的ミスなどでデータを損失する危険は多々あります。これらに対応する手段の一つがバックアップです。
今回は、保守・運用作業の基本中の基本ともいえるバックアップについて語ります。
まずは基本、何に保存するか
さて、バックアップというと決めなくてはいけないのは以下の3つです。
・媒体
・頻度
・保存期間
他にもいろいろありますし、情報処理技術者試験対策のバックアップのページには、ほんとに昔から決まり文句のようにあれこれ書かれているテーマもありますが、それは後ほど。
媒体は、昔むかしは磁気テープ(*2)などがありましたが、最近ではHDD、クラウドが多いように思えます。
また、クラウド以外を選択した場合には、図表35-1のように中小企業をターゲットにした調査では、「自社サーバー」「NAS」「外付けSSD・HDD」などが多いようです。
【参考/引用】PR TIME <中小企業の情報システム>マスターデータの保存先とバックアップデータの保存先を同じにしていませんか?(株式会社テクノルによる調査)
(https://prtimes.jp/main/html/rd/p/000000001.000104719.html)
頻度でピント?
バックアップの頻度は、企業システムですと「1日」つまり毎日なのでしょう。たぶん運用手順やシステム自体に「バックアップ」というタスクを組み込むのが普通でしょうから、5-10日にバックアップとかいうよりも毎日のほうが楽です。しかし、バックアップはデータ量に比例して確実に時間が掛かります。さらに、業務を終了した後でないとバックアップできないケースもあります。そのため、毎日バックアップを行いたいが、なるべく短い時間で終わらせたい、という要望が発生します。そこで次のような「情報処理技術者試験」のバックアップ問題が出てきたりします。
情報処理技術者試験でのバックアップ問題
さて、バックアップの種類として、よく試験に出てくる基本的な用語は、フル・差分・増分です。
・フルバックアップ:対象の全てのデータを保存
・差分バックアップ:最新の「フルバックアップ」からの「追加分」を保存
・増分バックアップ:直近の「バックアップ」からの「追加分」を保存
そして、さらに以下のような問題が出ていたりします。
「月曜日にフル、火曜日から金曜日は増分、土曜日は差分、日曜日はバックアップ無し」の運用でバックアップ1回に1本のテープを使う。さて、日曜日に障害が起きた場合、復旧のために最小何本のテープが必要か?
いったい誰得な問題なんでしょうかね。東大ナゾトレ(*3)ですか?
正解は、「フル+月+火+…+土」の6本ではなくて、差分は「フルからの追加分」なので、フル+土曜日の差分で復旧できます。土曜日の夜間(バックアップ)時点への復旧になります。そもそも、テープでのバックアップという点で少し残念な気もします。
実務的には、昔むかしはデータの容量と媒体のサイズ、バックアップの時間などを考えて、差分や増分などのバックアップなどが行われていますが、今だとデータの部分バックアップ(業務別のバックアップなど)、システムを含めたフル、端末の初期化用のバックアップなど多種多様なバックアップがあり、かつ媒体もストレージやクラウド(なぜクラウドかって? 場所がシステムから物理的に離れているから)。
ま、クイズのネタ用の話です。
リストアという難題
で、バックアップといえば、当然リストアの話になります。
リストアとはバックアップから現状に戻すこと。でも、意外というか当たり前のように戻らないもんです。
原因は、
1.リストア手順が整備されていない(やり方がわからない)
2.バックアップメディアが問題(正しいデータが入っていなかったなど)
3.バックアップ先の問題(システム自体も壊れていたなど)
実際に多いのは、「1.バックアップ手順の問題」
マニュアルや手順書、「バックアップ/リストアマニュアル」やら「BCP要領」「DR実施手順」(*4)やらに書いてある手順通りにやっても、いや手順自体がよくわからない。環境が違う、マニュアルとは異なるメッセージが返ってくる、など。
そもそも、「手順」や「マニュアル」類は、その手順通りにオペレーションしたことがない人が書いていることが多々あります。また、本番系ではなく、開発系と呼ばれる異なる環境で確認したマニュアルだったりします。さらに、リストアを実施するオペレーターさんは、マニュアル通りにオペレーションするしかできない人が多いです。応用も利きませんし、基礎もありません。これでは、作成者もNGで実施者もNG。リストアなんて不可能でしょう。例えるならば、消火訓練を見ているだけの小学生に火災現場で消火をお願いするようなものです。
バックアップデータの保存の問題
さて、バックアップというと決めなくてはいけないのは以下の3つです、と言いました。
・媒体 – 済
・頻度 – 済
・保存期間
2つについては説明は済みました。最後に「保存期間」ですが、バックアップデータの保存期間です。リストアを考えますと、1年分、365日保存しても仕方がありません。ムダにディスクを使うだけです。フルバックアップ2回分+差分/増分で大丈夫な気もします。しっかりと運用を考えている部門/会社ですと、1ヶ月(30日)×2、それも正/副の2セット、つまり 30日×2ヶ月×2セット=120回分取っているところがあります。後は、メディアやディスクを使いまわすだけです。まぁ、バックアップの正/副はかなり正しい発想だと思います。データが壊れていたり、保存場所がアレだったりすることがありますし、正はHDDに置き、副はクラウドに置いたりすれば、かなり生存確率(データの生存確率)は上がります。
バックアップとは似て非なる「レプリケーション」
ここで、バックアップとは全く異なる仕組み「レプリケーション(replication)」を説明します。なんか、同一に考えている自称エンジニアがいたので、「困ったもんだ」と思います。レプリケーションは、最初からシステム内に組み込んで、同期を取ってデータの複製をつくる仕組みです。なので、極論を言えば、元データを削除すればレプリケーション内のデータも削除されます。でも、バックアップされたデータは削除されていません。
レプリケーションは、データの複製であり、目的はシステム停止時の復旧時間の短縮、つまりダウンタイムの短縮です。また、元データと同じデータがレプリケーションデータです。バックアップデータは必ずしも元データと一致しているとは限りません(差分や増分だと確実に異なる)
また、メリットは復旧すべきタイミングを指定できる、つまり間違って消しちゃったをなくすことができるのがバックアップで間違って消したらそのままなのがレプリケーションです。
バックアップよりもリストアが重要
今回は原点に戻って、バックアップについて語りました。バックアップについては、バックアップよりもリストアの方が大事です。前述したように、データ自体があっても元に戻せなければ全く意味がないからです。
では良き眠りを(合掌)。
「死んだあと、どこへ埋められようと、本人の知ったことではない。 汚い溜桶の中だろうと、高い丘の上の大理石の塔の中だろうと、当人は気づかない。君は死んでしまった。大いなる眠りをむさぼっているのだ。」 by レイモンド・チャンドラー
-
- 商標について
本コラムに記載されている商品やサービスの名称は、関係各社の商標または商標登録です。文中では、(TM)や(R)を省略しているものもあります。
引用・参照について
本コラムで引用・参照した図表や文章については、明示して引用元・参照元を記載しております。
著作権・免責について
本コラムの著作権は、著作者に帰属します。本コラムは著者の主観に基づく情報の提供のみを目的としており、本コラムに記載された内容を用いた運用などは、読者の責任と判断においておこなってください。また、記載内容は、執筆時のものを使用しております。
- 商標について
*1 2024年パリ五輪の出場権をかけた国際大会。世界ランキング上位24チームが3つのグループに分かれて対戦、各グループ上位2チームがパリ五輪の出場権を獲得。日本女子の参加するプールBは9月16日(土)~9月24日(日)、男子大会は9月30日(土)~10月8日(日)に国立代々木競技場 第一体育館で開催。女子大会の結果は以下
国名 | 勝 | 負 | |
トルコ | 7 | 0 | オリンピック出場権確定 |
ブラジル | 6 | 1 | オリンピック出場権確定 |
日本 | 5 | 2 | – |
プエルトリコ | 4 | 3 | – |
アルゼンチン | 3 | 4 | – |
ベルギー | 2 | 5 | – |
ブルガリア | 1 | 6 | – |
ペルー | 0 | 7 | – |
いやー、トルコのバルガス選手、凄いわ。そして、日本の最終戦であるブラジル戦、第4セット以降にキャプテンの古賀選手がベンチに戻った件について、あれこれ言われていますが、コンディション的なものなのか、それとも戦術?
*2 磁気テープ。容量的にも保存期間的にももう無理でしょう。そういえば、テープの操作をする「mtコマンド」とかあったような。「mt -retension」で、テープのたるみを直すコマンドでした。
*3 東大ナゾトレは、東京大学謎解き制作集団AnotherVisionが作っている「東大ナゾトレ」のこと。フジ系の「今夜はナゾトレ」の人気コーナーでの出題もあります。2017年に発売。昔むかしで言いますと1966年発売の多胡輝の「頭の体操」でしょうか。
*4 BCPはBusiness Continuity Plan(事業継続計画)、DRはDisaster Recovery(災害復旧)。どちらも不可避な災害などによるシステム障害から復旧するための計画です。どちらも、バックアップからデータを復旧するのは必須です。
連載一覧
筆者紹介
大手IT会社に所属するPM兼SE兼何でも屋。趣味で執筆も行う。
代表作は「空想プロジェクトマネジメント読本」(技術評論社、2005年)、「ニッポンエンジニア転職図鑑』(幻冬舎メディアコンサルティング、2009年)など。2019年発売した「IT業界の病理学」(技術評論社)は2019年11月にAmazonでカテゴリー別ランキング3部門1位、総合150位まで獲得した迷書。
コメント
投稿にはログインしてください