月既不解饮,影徒随我身——浅析Azure快照

  Azure磁盘快照是Azure备份等数据保护服务的基础。不同于传统本地存储快照指针的方式,Azure快照更类似磁盘有效数据的克隆,使用方式也有较大差异。快照的操作很简单,portal界面选择磁盘即可直接创建快照,但仔细研究一下,还是有很多有意思的地方。

Azure快照基础概念

  Azure磁盘快照分为两类:全量和增量,两者的区别和计价方式(以美东的Premium Disk为例)如下:

image-20210412113858152

  从描述中可以看出:

  • 快照分为全量和增量
  • 快照只支持本地副本保护:LRS或ZRS(如果Region支持)
  • Premium Disk的全量快照可以放在Premium存储或标准储存,增量快照只能放标准存储(标准SSD和标准磁盘的全量和增量快照都只能放在标准存储)
  • 快照的容量由磁盘的有效数据量决定,而非磁盘大小
  • 全量快照的基准点是当前磁盘;增量快照的基准点是上一次快照,无论上次快照是全量还是增量都可以

快照实验

  下边,我们搭建一台vm,验证快照功能。

实验设计

  vm使用windows 10,附加了一块1TB的数据盘用作快照测试,整体流程如下:

image-20210412122104055

  

  首先,再磁盘中放入一个10GB的文件,做全量快照Snapshot1,Snapshot1基于磁盘当前有效数据量,所以容量为10GB;然后做增量快照Snapshot2,由于增量快照基于Snapshot1,而磁盘没有任何变化,所以Snapshot2容量为0GB;向磁盘增加一个20GB的文件,磁盘有效数据量变为30GB,做全量快照Snapshot3,容量为30GB;接着做增量快照Snapshot4,同理容量为0GB;第三次向磁盘中放入一个40GB文件,磁盘有效数据量增加为70GB,再次做增量快照Snapshot5,这次增量快照的基准点是最近一次快照Snapshot4,所以Snapshot5的容量应该为70-30=40GB。

创建快照

  如下图,在创建好的VM的数据盘(F盘)里使用fsutil创建一个10GB的文件:

image-20210412123800600

  然后做第一次全量快照Snapshot1:

image-20210412123852977

image-20210412123932579

  可以看到,因为这块磁盘是Premium SSD,所以全量快照时可以选择不同的存储类型,这里统一选择Standard HDD,然后一直Next创建快照:

image-20210412124254594

  再对该磁盘创建增量快照Snapshot2:

image-20210412124426516

  由于增量快照只支持标准存储(Standard HDD),所以没有存储类型的选择。

  创建完成如下:

image-20210412124635041

  按此步骤增加文件后创建剩余的快照,列表如下:

image-20210412125216893

快照验证

  不同于传统存储快照可以直接回退,Azure的快照必须生成磁盘才能使用。

  用Snapshot1生成Disk1:

image-20210412125516456

image-20210412130007862

  同样步骤,使用后边几个快照创建磁盘Disk2——Disk5:

image-20210412130348348

  这些磁盘的来源还没附加到VM,所以没有Owner。

  回到VM的OS,我们在数据盘分别创建了3个文件:file01、file02、file03。按照创建快照的时间点,每个快照包含的文件如下:

快照 包含文件
Snapshot1 file01
Snapshot2 file01
Snapshot3 file01、file02
Snapshot4 file01、file02
Snapshot5 file01、file02、file03

  现在将从快照生成的磁盘附加到VM:

image-20210412131722784

  在OS附加这些磁盘(G——K盘):

image-20210412132303582

  检查磁盘内容:

image-20210412132454440

  符合预期。

进一步测试

  前边说到,增量快照是基于前一次快照的变化量。那么,如果前一次快照被删除,会出现什么情况?还是通过测试做验证。

  现在删除Snapshot1(第一次全量快照):

image-20210412132959650

  快照列表里已经没有Snapshot1:

image-20210412133143441

  再次用Snapshot2生成磁盘Disk6,并附加到VM:

image-20210412133426304

  附加到VM(L盘),检查里边的内容:

image-20210412133554775

  file01仍然存在,检查Hash,和之前的文件一致:

image-20210412135809745

  可以看出,即使删除作为基准点的快照,增量快照的安全也不受影响。

关于容量那些事

  如前所述,快照的容量是由磁盘的有效数据量决定,对于全量快照,有效数据量比较容易确认;但对于增量快照,通常磁盘的使用不是简单的增加文件,而是一系列的增删改等操作,但Azure的快照并不提供容量查询的功能,属性里看到的容量是对应磁盘的容量。我们通过一个变通方式来确认快照容量,即根据快照的成本来反推容量。

  重新创建一个VM,附加两块1TB的数据盘:

image-20210416100410665

  进入OS,将两块出具盘分别创建分区和格式化(F盘和G盘):

image-20210416101108812

  分别在F盘和G盘各创建一个300GB的文件,F盘用windows自带fsutil工具,G盘有第三方的rdfc工具:

image-20210416102643765

  可以看到,fsutil很快,而rdfc非常慢。原因是fsutil直接用0填充生成的稀疏文件,rdfc则是用随机数填充,真正生成了一个文件。完成后两个磁盘的占用空间基本一致:

image-20210416224024743

  对两个磁盘分别做全量快照SnapshotF和SnapshotG:

image-20210416224405527

  放置两天后,查看快照的使用成本。进入快照overview,有一个view cost的按钮:

image-20210419095606190

  点击进入,选择Daily costs:

image-20210421142824637

  G盘快照每天的成本大约$0.19。

image-20210421142858861

  同样查看F盘的快照成本如下,基本为0:

image-20210421143048046

  从对比可以看出:

  • G盘和F盘虽然从空间占用基本一样,但快照成本相差较大,F盘的文件基本全部为0填充,快照时并没有实际占用空间,所以快照没有实际占用空间,成本为0
  • G盘的文件实际大小为300GB,理论上的每天成本为$0.05/30*300=$0.50,但实际为$0.19,说明快照存储时使用了类似压缩去重的技术,节约空间

小结

  快照snapshot是一个很平常的概念,在云端和本地有不同的机制。

  虽然快照的操作很简单,但如果能熟练掌握,使用场景非常广泛,例如业务升级、数据更新等,可以利用快照做即时保护;另外在环境复制、远程迁移vm等情况下,也可以通过快照实现。

  这篇文章简单介绍了azure snapshot,希望对大家有帮助。