一种既便捷又超便宜的数据库(MySQL、MongoDB)备份与恢复方案:数据库的备份和恢复是很古老的话题了,但是现有的方案没找到顺手的,没办法只能重新发明轮子了。代码参考db-backup-and-restore
- 1.基本需求: 备份和容灾恢复,按指定时间周期备份,当生产系统故障时,能够进行恢复
- 2.业务需求: 能够回滚恢复到某个指定时间点的数据
- 2.1.比如用户误删除数据或者把数据搞乱掉了,要求恢复到2个月前的数据再重新开始
- 2.2.开发测试时,有时会使用某个历史节点的数据进行功能测试
- 3.备份和恢复使用方便,简单易懂
- 4.故障后的恢复过程速度快
- 5.廉价的备份成本
- 6.备份数据除了保存在本地外,也能够保存在云存储
- 7.支持mongodb、mysql等常用的业务数据库
详细参见官网介绍:阿里云的数据库备份服务RBS
RBS满足需求场景中的1、2、3,功能还是挺强大的,但是有两个致命缺点,一个是贵,另一个是死慢死慢的
第一点:贵,RBS是按备份数据量收费的,而备份数据量如下所示,“通过备份链路的实际数据大小”,跟你每个月执行备份的次数有关。如果我有50G数据,每天备份一次,每个月就要1000多块钱,另外备份存储也要单独收费
第二点:最不能忍受,恢复数据执行起来死慢死慢的,我做了个测试,总共50M数据文件,RBS恢复了2个小时还没有执行完,这么点数据量用mongorestore,几秒钟就可以执行完。
- mgob : 一个golang大神写的,是基于docker容器的Mongodb备份程序。可以备份到亚马逊的S3、gcloud,也可以本地备份。
- 但是不支持备份到阿里云,
- 而且恢复数据的操作不太理想,需要手工下载到本地,然后再执行mongorestore命令,不够傻瓜化
- PyBackup: 可以存储到oss、腾讯云、七牛等,还比较适合我们的需求场景,但是没有对应的数据恢复功能。另外备份任务定时执行是通过操作系统的cron控制的
- mongodb-backup-manager: 界面,但是说明文档不全,部署起来比较麻烦,自己本身还需要一个mongodb数据库。最关键的是也没有数据恢复功能
- AliyunRDS: 实现阿里云RDS数据库备份数据库自动定时下载,并转储阿里云OSS文件服务器, 使用C#实现的,还把工程文件上传,看着就不利索!
总结: 不管是阿里云的数据库备份RBS还是github已有的开源方案,都不是太适合我们的业务场景需求,只好重新造轮子了。
【方案总体框架】包含两个主要程序:
- 备份程序:常驻进程,周期性执行备份任务,备份文件保存在本地或者上传到云存储(如阿里云、七牛、腾讯云等)。
- 恢复程序:单次执行,通过引导步骤傻瓜式操作,简单易上手
【基于时间衰减的备份存储策略】 备份存储的时间衰减策略: 越近的数据越重要,保存的时间间隔越小,份数越多;越老的数据重要性越小,保存的时间间隔越大,份数越少 可以通过策略参数控制,例如:
"days": 6
最近6天,每天保存一份"weeks": 3
最近3周,每周保存一份"months": 6
最近6个月,每月保存一份"years": 5
最近5年,每年保存一份,超过5年以上就不保留备份了
比如5年的历史数据,备份数= 6 + 3 + 6 + 5 = 20
以每个备份20G的存储大小为例,20G*20份==400G,购买一个500G的归档型存储包,每年的存储费用为135元,算是非常便宜的方案了(参加 阿里云产品定价-对象存储OSS)
【恢复程序】的执行逻辑如下面有限状态机所示,用户只需要根据引导输入3个指令即可完成一个恢复:
- input_uri: 输入目标数据库的uri
- choice_task: 选择一个备份任务(在config.tasks中配置)
- choice_file: 选择一个备份文件 (可以是本地的备份文件,也可以是远端的备份文件)
python3.6版本以上
- 如果是mongodb,需要预安装mongodump和mongorestore命令
- 如果是mysql,需要预安装mysql客户端,可以支持mysql和mysqldump命令
git clone https://github.com/perfectstorm88/db-backup-and-restore
cd db-backup-and-restore
pip install -r requirements.txt
cp config.sample.yml config.yml
最简单的样例如下:
tmpPath: './temp'
archivePath: './archive'
local:
retention: 10 # number of backups to keep locally
tasks:
- name: 'mongo_my_test1'
type: 'mongodb'
schedule: "day 13:15" # 每天 13:15执行
params: # 通过mongodump执行的参数
uri: "mongodb://test:[email protected]:13722/lcz_test1" #
有两种启动方式,启动常驻进程,周期任务调度:
nohup python $(pwd)/backup.py -l & # nohup方式启动
另一种方式,是直接启动任务,忽略schedule参数,立即执行数据库备份,一般应用在测试场景,如
python backup.py -t mongo_my_test1
执行restore.py ,按着引导步骤执行即可
python restore.py
恢复程序】的执行逻辑如下面有限状态机所示,用户只需要根据引导输入3个指令即可完成一个恢复:
- input_uri: 输入目标数据库的uri
- choice_task: 选择一个备份任务(在config.tasks中配置)
- choice_file: 选择一个备份文件 (可以是本地的备份文件,也可以是远端的备份文件)
执行 python restore.py
命令,过程如下:
*******************welcome to use database restore program****************
# 【输入】选择一个备份任务(任务名称是在config.yml )
please choice the task to restore
0) mongo_lcz_test1
1) mysql_db1
-1) return last step
(choice task)->1
# 【输入】选择一个数据源文件
please choice the following file to restore
0) 20190829150621.zip 232.100 KB (local)
-1) return last step
(choice task)->0
# 【输入】输入目标数据库的uri
please input the destination db uri,format is [scheme://][user[:[password]]@]host[:port][/schema][?attribute1=value1&attribute2=value2]
(such as mysql://root:[email protected]/db1)
(uri)->mysql://root:[email protected]/db2
# 检查uri格式
now is check uri ....
# 解压缩zip文件
unzip file:/root/db-backup-and-restore/./archive/mysql_db1/20190829150621.zip
# 执行数据库恢复命令
2019-08-29 16:13:57,833 INFO start exec restore cmd: mysql -uroot -p123456 -h47.99.73.225 db2 < /root/db-backup-and-restore/temp/uIZ3XfhB/back.sql
2019-08-29 16:13:57,857 DEBUG mysql: [Warningder] Using a password on the command line interface can be insecure.
2019-08-29 16:14:01,041 DEBUG b
process exit
tmpPath: './temp'
archivePath: './archive'
# oss: # 存储到OSS
# url: "http://oss-cn-hangzhou.aliyuncs.com"
# bucket: "jfjun4test"
# accessKey: "accessKey"
# secretKey: "secretKey"
# prefix: 'backup/' # oss中的存储根路径
# # 存储策略,只有一个起作用,优先级timeDecay>retention>expireDays,
# expireDays: 730 # 最大保存天数
# retention: 14 # 最大保留分数
# timeDecay:
# - months: 6 # 如果超过2个月后,每个月只保留一份
# - years: 10 # 如果超过2年后,每年只保留一份
# - days: 6
# - weeks: 3
# 存放到本地,存放目录 {archivePath}/{task.name}/
local:
# 稀疏策略,如果配置了稀疏策略,则retention失效,expireDays失效
expireDays: 730 # 最大保存天数
retention: 10 # 最大保留份数
timeDecay: # 时间衰减保存策略
days: 6, # 最近6天,每天保存一份
weeks: 3, # 最近3周,每周保存一份
months: 6, # 最近6个月,每月保存一份
years: 5, # 最近5年,每年保存一份,超过5年以上就不保留备份了
tasks:
- name: 'mongo_lcz_test1'
type: 'mongodb'
# schedule表示执行时间策略
# "day 03:21" # 每天 03:21执行
# "hour :31" # 每小时 31分执行
# "monday 03:21" # 每周一 03:21执行
schedule: "day 13:15" # 每天 13:15执行
params: # 通过mongodump执行的参数
# uri: "mongodb://test:[email protected]:13722/lcz_test1"
d: lcz_test1
u: test
p: test
h: 127.0.0.1:13722
- name: 'mysql_db1'
type: 'mysql'
schedule: "day :00" # 每周
params: # 通过mysqldumap执行的参数
# uri: "mysql://root:[email protected]/db1"
u: "root"
p: "123456"
databases: "db1"
host: "127.0.0.1"
- 构建镜像
./build.sh #docker build --rm -t=db-backup-and-restore .
- 使用docker-deploy-sample目录的例子:
- config/config.yml 配置文件样例
- start_once.sh 手工执行一次备份
- start_demon.sh 以后台方式启动备份,按指定时间备份
- start_restore.sh 手工执行数据恢复操作
上述方案为全量备份,比较适合于中小型业务场景,比如200G以下的的数据量,如果是过T的数据量,可以考虑定期全量+增量备份方案,下面为扩展阅读
- MongoShake——基于MongoDB的跨数据中心的数据复制平台:基于mongodb oplog的集群复制工具,可以满足迁移和同步的需求,进一步实现灾备和多活功能
- mongodb增量备份脚本与原理: 对应开源项目,https://gitee.com/passer/mongodb_backup_script
- 史上最通俗易懂的IPFS入门介绍01:关于存储,有个朋友脑洞大开,推荐用IPFS