データに紐づくポリシーの設定項目として、以下が考えられる
- バックアップ頻度
- e.g., daily, weekly, monthly
- バックアップ方式
- incremental backup (差分 backup) か full backup か
- バックアップ先
- file storage (e.g., linux storage) or object storage (e.g., s3)
- バックアップ方式により、決定される
- incremental backup -> file storage
- full backup -> object storage
- object storage の中でも、更に tape storage なども選択に上がる
- バックアップの世代管理 (保持期間)
- incremental backup が 1 世代の場合、実質的に full backup と同じ
- バックアップの暗号化
- する or しない
- -> 今回は考慮しない
- バックアップの圧縮
- する or しない
- -> 今回は考慮しない
それぞれのデータの性質に応じて、これらのポリシーを設定するべきであるが、同時に、コストも考慮しなければならない。 そのため、まず、下記のようなバックアップポリシーとバックアップ方式の対応表を作成した。
頻度 | 方式 | 世代管理 | バックアップ方式 |
---|---|---|---|
daily | full/inc. | 1 gen. | object storage に backup。更新頻度が高く、size が小さいデータを想定 |
daily | full | 7 gen. | スコープ外 |
daily | inc. | 7 gen. | file storage に rsync。更新頻度が高く、size が小さいデータを想定 |
weekly | full/inc. | 1 gen. | object storage に backup。更新頻度が比較的低いデータを想定 |
weekly | inc. | 4 gen. | file storage に rsync。更新頻度が比較的低いデータを想定 |
monthly | full/inc. | 1 gen. | object storage (低頻度アクセス) に backup。データ量が大きく重要性の高いデータを想定 |
- 上の表は網羅性としては、不十分である
- 例えば、
monthly - inc. - 6 gen.
なども考えられるが、データ量が大きいものを file storage に差分 backup するのはコストが掛かりすぎて現実的でない部分もある- 保持し続けるだけでコストが掛かるため、可用性のための backup としては適切ではない
- そのため、バックアップ方式を選ぶ UI からは、このような選択肢を削除する
- ポリシーを細かく設定する UI (もしくはポリシーを自由に追加できる UI) も考えられる
- 両方、検証してみて pros./cons. を検討する
- ポリシーを細かく設定する UI (もしくはポリシーを自由に追加できる UI) も考えられる
- 例えば、
- 要件として、可用性や耐障害性が求められる
- そのため、機関インフラ内で NAS などを運用し、そこをデータの保存先とすることは考慮しない
下の保存先案を、コストを軸に先にまとめる
t3.medium 相当のインスタンス + 10 TB storage を利用すると想定 (data upload 料金はどこも基本的に無料)
さくらインターネット
- 114,620 yen/month
AWS EC2 + EBS (gp2, SSD)
- 274,514 yen/month
AWS EC2 + EBS (st1, HDD, アトランタ)
- 105,764 yen/month
AWS EC2 + EBS (sc1, コールド HDD, アトランタ)
- 38,264 yen/month
AWS EC2 + EFS (standard)
- 244,514 yen/month
AWS EC2 + EFS (low freq. access)
- 24,514 yen/month
1 GB あたりの料金を比較
さくらインターネット
- 4.95 yen/month (ただし、転送量 8.8 yen/GB)
S3 標準
- 3.75 yen/month
S3 標準 - 低頻度アクセス
(ミリ秒単位のアクセスが必要な、長期保管だがアクセス頻度の低いデータ、最低ストレージ期間 30 日)- 2.07 yen/month
S3 Glacier Instant Retrieval
(ミリ秒単位で瞬時に取り出し、四半期に 1 回アクセスするような長期保存のアーカイブデータ)- 0.75 yen/month
- "オブジェクトストレージ@柏Ⅱ"
- ActiveScale (S3 互換)
- 300TB
- S3 互換 API が提供されているが、そちらを利用せず、rsync 先の file storage として利用することも可能だと思われる
- 大口としての契約は問い合わせが必要
- いわゆるインスタンス貸しは "さくらクラウド"
- https://cloud.sakura.ad.jp
- データの転送量は無料
- 石狩リージョンと東京リージョンが選択可能
- 石狩リージョンの方が安価かつ、可用性を考慮すると石狩の方が better
- 12 TB で 132,000 yen/month
- 11.0 yen/month
- 2core + 4GB (t3.medium 相当) の使用料は 4,620 yen/month
- オブジェクトストレージ
- https://cloud.sakura.ad.jp/specification/object-storage/
- データの転送量は無料
- だが、10 GB / month を超えると 1GB あたり 8.8円
- upload or download かの記述はなし
- S3 互換 API を提供
- 1GB あたり 4.95円
- わかりやすい資料として https://pages.awscloud.com/rs/112-TZM-766/images/AWS-04_AWS_Summit_Online_2020_STG01.pdf
- Block Storage (File Storage)
- Amazon Elastic Block Store (EBS)
- EC2 にアタッチして利用するブロックストレージ
- rsync 的に世代 backup したいならこちら
- https://aws.amazon.com/jp/ebs/pricing/
- 東京・大阪リージョンの場合、
汎用 SSD (gp2) ボリューム
(SSD) しか利用できない- HDD だと
スループット最適化 HDD (st1)
やコールド HDD (sc1)
がある (アトランタリージョン)st1
: 1 GB あたり 10.125 yen/monthsc1
: 1 GB あたり 3.375 yen/month
- HDD だと
gp2
: 1 GB あたり 27 yen/month- -> さくらインターネットの方が安価
- インターネット -> EC2 への転送量は無料
- EC2 instance t3.medium (2core, 4gb) の料金は 4514.4 yen/month
- 東京・大阪リージョンの場合、
- EC2 にアタッチして利用するブロックストレージ
- Amazon EC2 Instance Store
- https://repost.aws/ja/knowledge-center/instance-store-vs-ebs
- "インスタンスストアを一時的なストレージとして使用します。インスタンスストアボリュームに保存されたデータは、インスタンスの停止、終了、またはハードウェア障害が発生しても保持されません。"
- -> EBS を使うべき
- https://repost.aws/ja/knowledge-center/instance-store-vs-ebs
- Amazon Elastic Block Store (EBS)
- File Storage
- Amazon Elastic File System (EFS)
- EC2 に NFS mount する storage
- size はデータ量に応じて自動拡張される
- EC2 からのデータ転送は無料
- https://aws.amazon.com/jp/efs/pricing/
- 大阪リージョンを想定
スタンダード
: 1 GB あたり 24 yen/month低頻度アクセス (四半期に数回しかアクセスされないデータに対してコスト最適化)
: 1 GB あたり 2 yen/month
- EC2 に NFS mount する storage
- Amazon Elastic File System (EFS)
- Object Storage
- Amazon Simple Storage Service (S3)
- upload は無料
- download は deep な storage なほど高価 (e.g., S3 Glacier: 3.3 yen/GB)
- https://aws.amazon.com/jp/s3/pricing/
- 大阪リージョンを想定
S3 標準
: 1 GB あたり 3.75 yen/monthS3 標準 - 低頻度アクセス
(ミリ秒単位のアクセスが必要な、長期保管だがアクセス頻度の低いデータ、最低ストレージ期間 30 日):- 1 GB あたり 2.07 yen/month
S3 Glacier Instant Retrieval
(ミリ秒単位で瞬時に取り出し、四半期に 1 回アクセスするような長期保存のアーカイブデータ):- 1 GB あたり 0.75 yen/month
S3 Glacier Deep Archive
(1 年に 1-2 回アクセスされ、12 時間以内に復元できる長期のデータアーカイブ):- 1 GB あたり 0.3 yen/month
- -> 最短保存期間が 180 日なので、今回の要件には合わないと思われる
- Amazon Simple Storage Service (S3)