备份
在信息技术中,备份或数据备份是在其他地方获取和存储的计算机数据的副本,因此可以在数据丢失事件发生后恢复原始内容。提到这样做的动词形式是“备份”,而名词和形容词形式为“备份”。备份可用于在数据删除或损坏中丢失数据后恢复数据,或从较早的时间中恢复数据。 备份提供了一种简单的灾难恢复形式;但是,并非所有备份系统都能够重建计算机系统或其他复杂配置,例如计算机群集, Active Directory Server或数据库服务器。
备份系统至少包含一个值得保存的所有数据的副本。数据存储要求可能很大。信息存储库模型可用于为此存储提供结构。有不同类型的数据存储设备用于复制辅助存储中的数据备份到存档文件。这些设备也可以通过不同的方式来提供地理分散,数据安全性和可移植性。
选择,提取和操纵数据以存储。该过程可以包括处理实时数据的方法,包括打开文件,以及压缩,加密和删除。其他技术适用于企业客户端服务器备份。备份方案可能包括验证备份数据的可靠性的干式运行。任何备份计划都有局限性和人为因素。
贮存
备份策略需要一个信息存储库,即汇总数据“源”备份的“数据二级存储空间”。存储库可以像所有备份媒体(DVD等)的列表以及所产生的日期一样简单,也可以包括计算机索引,目录或关系数据库。
需要存储备份数据,需要备份旋转方案,该系统是将数据备份到计算机媒体的系统,该系统通过覆盖数据存储媒体的适当使用来限制了分别保留不同日期的备份的数量不再需要备份。该方案确定了如何以及何时将每件可移动存储用于备份操作以及一旦将其存储在其上的备份数据后保留了多长时间。 3-2-1规则可以帮助备份过程。它指出,应该至少有3个数据副本,存储在2种不同类型的存储媒体上,并且应将一个副本保存在偏远位置(这可以包括云存储)。应使用2个或更多不同的媒体来消除由于类似原因而导致的数据丢失(例如,光盘可能忍受在水下而LTO磁带可能不会,并且由于头部崩溃或纺锤体损坏而导致SSD不会失败,因为它们没有任何运动部件,与硬盘驱动器不同)。异地副本可预防火灾,盗窃物理媒体(例如磁带或碟片)以及洪水和地震等自然灾害。受身体保护的硬盘驱动器是异地副本的替代方法,但是它们的局限性仅在有限的时间内能够抵抗火灾,因此,一个异地副本仍然是理想的选择。
备份方法
非结构化
非结构化的存储库可能只是一堆磁带,DVD-RS或外部HDD,并且有关备份的内容以及何时备份的信息。此方法是最容易实施的,但由于缺乏自动化,因此不可能实现高水平的可恢复性。
完整/系统成像
使用此备份方法的存储库包含以一个或多个特定时间点获取的完整源数据副本。复制系统图像,该方法经常被计算机技术人员使用来记录已知的良好配置。但是,成像通常是将标准配置部署到许多系统的一种方式,而不是作为使持续备份的不同系统备份的工具。
增加的
自参考点以来,增量备份存储数据更改。未更改数据的重复副本未复制。通常,所有文件的完整备份是一次或不频繁的间隔,作为增量存储库的参考点。随后,在连续的时间段之后进行许多增量备份。还原从最后一次完整备份开始,然后应用增量。一些备份系统可以创建一个 一系列增量的合成完整备份,因此提供了相当于经常进行完整备份的等效备份。当完成一个单个存档文件时,这会加快恢复最新版本的文件。
近CDP
连续数据保护(CDP)是指立即保存对数据所做的每一个更改的副本的备份。这允许将数据恢复到任何时间点,并且是最全面,最先进的数据保护。接近CDP的备份应用程序通常以“ CDP”销售- 自动以特定的间隔进行增量备份,例如每15分钟,一小时或24小时一次。因此,它们只能允许还原到间隔边界。近CDP备份应用程序使用日记帐,通常基于周期性的“快照”,这是在特定时间点冻结的数据的仅阅读副本。
接近CDP( Apple Time Machine除外)意图运行主机系统上的每一个更改,通常是通过保存字节或块级别的差异而不是文件级差异。这种备份方法不同于简单的磁盘镜像,因为它可以使日志的滚动和恢复旧的数据图像。 Intent-Goging允许预防实时数据的一致性,保护自一致的文件,但要求应用程序“ quieed并准备好备份”。
对于普通的个人备份应用程序而言,近CDP更可行,而不是真正的CDP,它必须与虚拟机或等效物结合使用,因此通常在企业客户端服务器备份中使用。
软件可能会创建单个文件的副本,例如书面文档,多媒体项目或用户偏好,以防止因停电,操作系统崩溃或耗尽的磁盘空间引起的失败的写入事件,从而导致数据丢失。常见的实现是文件名的附加“ .bak”扩展名。
反向增量
反向增量备份方法存储了源数据的最新存档文件“镜像”,以及其当前状态和以前状态的“镜像”之间的一系列差异。反向增量备份方法以非图像完整备份开始。完成完整备份后,系统会定期将完整备份与实时副本同步,同时存储重建旧版本所需的数据。这可以使用硬链路(就像Apple Time Machine一样)或使用二进制差异来完成。
微分
自上次完整备份以来,差异备份仅节省了已更改的数据。这意味着最多使用存储库中的两个备份来恢复数据。但是,随着最后一次完整备份(因此,数据的累积变化)的时间增加,执行差异备份的时间也会增加。恢复整个系统需要从最新的完整备份开始,然后仅应用最后一个差异备份。
自从上次完整备份以来,差异备份复制了已创建或更改的文件,无论是否做过任何其他差异备份,而自从任何类型的最新备份以来创建或更改的增量备份复制文件(完整或增量) 。可以通过最后一个修改文件属性的最新日期/时间和/或文件大小的更改来检测到文件的更改。增量备份的其他变化包括多级增量和块级增量,这些增量比较了文件的一部分,而不仅仅是整个文件。
储存媒介
无论使用哪种存储库模型,都必须将数据复制到存档文件数据存储介质中。所使用的介质也称为备份目的地的类型。
磁带
磁带很长一段时间以来一直是最常用的批量数据存储,备份,存档和交换的介质。以前这是一个较便宜的选择,但是对于较小的数据而言,情况不再如此。磁带是一种顺序访问介质,因此连续编写或阅读数据的速率可能非常快。虽然磁带媒体本身的每个空间成本较低,但磁带驱动器通常比硬盘驱动器和光学驱动器一样昂贵。
许多磁带格式已经专有或特定于某些市场,例如大型机或特定品牌的个人计算机。到2014年, LTO已成为主要的磁带技术。剩下的其他可行的“超级”格式是IBM 3592 (也称为TS11XX系列)。 Oracle Storagetek T10000在2016年停产。
硬碟
随着时间的流逝,随着时间的推移,使用硬盘存储的使用已逐渐变得更便宜。硬盘通常易于使用,可广泛使用,并且可以快速访问。但是,硬盘备份是耐耐耐受的机械设备,并且可能比磁带更容易损坏,尤其是在运输时。在2000年代中期,几家驱动器制造商开始生产使用坡道加载和加速度计技术(有时称为“冲击传感器”)的便携式驱动器,到2010年,使用该技术的驱动器的行业平均水平显示,该技术的驱动器表明驱动器保持不变,并且正在工作。经过36英寸的非运营量后,掉落到工业地毯上。一些制造商还提供“坚固的”便携式硬盘驱动器,其中包括硬盘周围令人震惊的箱子,并声称一系列较高的下降规格。多年来,硬盘备份的稳定性比磁带备份的稳定性要短。
外部硬盘可以通过SCSI , USB , FireWire或ESATA等本地接口连接,也可以通过Ethernet , ISCSI或Fiber通道等较长距离技术连接。一些基于磁盘的备份系统通过虚拟磁带库或其他方式支持数据重复数据删除,这可以减少每日和每周备份数据消耗的磁盘存储容量的量。
光学存储
光学存储使用激光来存储和检索数据。可记录的CD ,DVD和蓝光光盘通常与个人计算机一起使用,通常便宜。这些光盘的容量和速度通常低于硬盘或磁带。光学介质的进步可能会在未来缩小这一差距。
可以通过测量可更正的次要数据误差的速率来预测由逐渐介质降解造成的潜在数据损失,这些数据误差的速度连续性太多增加了无法纠正的扇区的风险。对错误扫描的支持在光驱动器供应商之间有所不同。
许多光盘格式都是蠕虫类型,这使其可用于档案目的,因为数据无法更改。此外,光盘不容易受到头部崩溃,磁性,迫在眉睫的进水或电力潮流的影响。而且,驱动器的故障通常只是停止旋转。
光学介质是模块化的;存储控制器与媒体本身没有绑定,例如硬盘驱动器或闪存存储(→闪存控制器),从而可以通过其他驱动器将其删除并访问。但是,可记录的媒体可能会在长期暴露在光线下降低。
一些光学存储系统允许在没有与光盘接触的无人接触的情况下进行分类数据备份,从而允许更长的数据完整性。法国2008年的一项研究表明,通常售出的CD-RS的寿命为2 - 10年,但后来一家制造商估计其CD-RS的寿命为含金层的寿命高达100年。索尼的专有光盘档案库可以在2016年达到250mb/s的读取率。
固态硬盘
固态驱动器(SSD)使用集成电路组件来存储数据。闪存,拇指驱动器, USB闪存驱动器,紧凑型, SmartMedia ,存储棒和安全的数字卡设备的低容量相对昂贵,但方便备份相对较低的数据量。固态驱动器不包含任何可移动的零件,从而使其不易受到物理损害的影响,并且最多可容纳500 mbit/s的巨大吞吐量,最多可容纳6 Gbit/s。可用的SSD变得更加宽敞,更便宜。闪存备份比硬盘备份较少稳定。
远程备份服务
远程备份服务或云备份涉及服务提供商,该服务提供商将数据异常存储。这已被用来防止可能破坏本地存储的备用的火灾,洪水或地震等事件。基于云的备份(通过或类似于Google Drive之类的服务, Microsoft OneDrive )提供了一层数据保护。但是,用户必须信任提供商,以维持其数据的隐私和完整性,并通过使用加密来增强机密性。由于速度和可用性受用户在线连接的限制,因此具有大量数据的用户可能需要使用云种子和大规模恢复。
管理
可以使用各种方法来管理备份媒体,在可访问性,安全性和成本之间达到平衡。这些媒体管理方法不是相互排斥的,并且经常合并以满足用户的需求。在发送到近线磁带库之前,使用在线磁盘进行分阶段数据是一个常见的示例。
在线的
在线备份存储通常是最容易访问的数据存储类型,并且可以开始以毫秒为单位的还原。内部硬盘或磁盘阵列(也许连接到SAN )是在线备份的一个示例。这种类型的存储空间很方便且快速,但很容易被偶然地,恶意动作或在数据删除病毒有效载荷后被删除或覆盖。
近线
附近存储通常比在线存储较不访问且便宜,但对于备份数据存储仍然有用。机械设备通常用于将媒体单元从存储转移到可以读取或编写数据的驱动器中。通常,它具有类似于在线存储的安全属性。一个示例是一个磁带库,其恢复时间从几秒钟到几分钟不等。
离线
离线存储需要采取一些直接操作来提供对存储媒体的访问:例如,将磁带插入磁带驱动器或插入电缆。由于数据无法通过任何计算机访问,除非在有限的书写或回读时,因此它们在很大程度上可以免疫在线备份故障模式。访问时间取决于媒体是现场还是异地。
现场数据保护
备用媒体可能会被发送到现场保险库,以防止灾难或其他特定地点问题。该保险库可以像系统管理员的家庭办公室一样简单,也可以像灾难性的,温度控制的高安全性掩体一样复杂,并具有用于备份媒体存储的设施。数据复制品可以异场地使用,但也可以在线(例如,现场突袭镜)。作为备份,这种复制品的价值相当有限。
备份网站
备份站点或灾难恢复中心用于存储可以使计算机系统和网络在发生灾难时恢复并正确配置的数据。一些组织有自己的数据恢复中心,而另一些组织则将其签给第三方。由于成本高,很少被认为是将数据移至DR站点的首选方法。一种更典型的方法是远程磁盘镜像,这可以使DR数据尽可能保持最新。
选择和提取数据
备份操作从选择和提取数据的相干单元开始。现代计算机系统上的大多数数据都存储在离散单元中,称为文件。这些文件被组织到文件系统中。决定在任何给定时间备份的内容都涉及权衡。通过备份过多的冗余数据,信息存储库将填充得太快。备份不足的数据最终会导致关键信息的丢失。
文件
- 复制文件:进行文件副本是执行备份的最简单,最常见的方法。执行此基本功能的一种手段都包含在所有备份软件和所有操作系统中。
- 部分文件复制:备份可以仅包括在给定时间段内更改的文件中的块或字节。这可以大大减少所需的存储空间,但需要更高的复杂性才能在恢复情况下重建文件。一些实现需要与源文件系统集成。
- 删除文件:为了防止故意删除的文件的无意恢复,必须保留删除的记录。
- 文件的版本操作:大多数备份应用程序,除了只做完整/系统成像的应用程序,还备份自上次备份以来已修改的文件。 “这样,您可以检索给定文件的许多不同版本,如果将其删除在硬盘上,您仍然可以在[信息存储库]存档中找到它。”
文件系统
- 文件系统转储:可以制作整个文件系统的副本。这也称为“原始分区备份”,与磁盘成像有关。该过程通常涉及卸载文件系统并运行诸如DD(UNIX)之类的程序。由于磁盘是顺序读取的,并具有大型缓冲区,因此这种类型的备份可以比正常读取每个文件更快,尤其是当文件系统包含许多小文件,高度分散或几乎完整时。但是,由于此方法还读取没有包含有用数据的免费磁盘块,因此此方法也可以比常规读数较慢,尤其是当文件系统几乎为空时。某些文件系统(例如XFS )提供了一个“转储”实用程序,该实用程序在跳过未使用的部分时依次读取磁盘以进行高性能。相应的还原实用程序可以选择性地恢复单个文件或操作员选择的整个卷。
- 更改的识别:某些文件系统对每个文件都有一个存档位,说明它最近更改了。一些备份软件查看文件的日期,并将其与最后一个备份进行比较,以确定文件是否已更改。
- 版本控制文件系统:版本化文件系统跟踪所有更改文件的更改。 Linux的NILFS版本控制文件是一个示例。
实时数据
积极更新的文件提出了备份的挑战。备份实时数据的一种方法是暂时呼应它们(例如,关闭所有文件),拿一个“快照”,然后恢复实时操作。此时,可以通过普通方法来备份快照。快照是某些文件系统的瞬时函数,它显示了文件系统的副本,就好像它是在特定时间点冻结的,通常是通过复印件机制。在更改文件时拍摄文件会导致无法使用的损坏的文件。在传统数据库或Microsoft Exchange Server等应用程序中可能发现的那样,在相互关联的文件中也是如此。一词模糊备份可用于描述看起来像正确运行的实时数据的备份,但并不代表单个时间点的数据状态。
备份的数据文件的备份选项不可能或不2级,包括:
- 打开文件备份:许多备份软件应用程序都承担了以内部一致状态备份打开文件。一些应用程序只需检查是否正在使用打开文件,然后再试一次。其他应用程序排除了经常更新的打开文件。可以通过自然/诱导的暂停来备份一些低利用性交互式应用程序。
- 相互关联的数据库文件备份:一些相互关联的数据库文件系统提供了一种在线和可用时生成数据库“热备份”的方法。这可能包括数据文件的快照以及备份运行时所做更改的快照日志。还原后,将应用日志文件中的更改将数据库的副本带到初始备份结束的时间点。可以通过协调的快照来备份其他低利用性交互式应用程序。但是,只能通过连续数据保护来备份真正的高可用性交互式应用程序。
元数据
并非所有存储在计算机上的信息都存储在文件中。准确地从头开始恢复完整的系统,也需要跟踪此非文件数据。
- 系统说明:需要系统规范以在灾难发生后进行确切的替换。
- 引导扇区:有时可以比保存更容易重新创建启动扇区。它通常不是普通文件,并且没有它不会启动系统。
- 分区布局:需要正确重新创建原始系统的原始磁盘的布局以及分区表和文件系统设置。
- 文件元数据:每个文件的权限,所有者,组,ACL和任何其他元数据都需要备份以进行还原以正确重新创建原始环境。
- 系统元数据:不同的操作系统有不同的存储配置信息的方式。 Microsoft Windows保留了与典型文件更难还原的系统信息注册表。
操纵数据和数据集优化
它通常有用或需要操纵备份数据以优化备份过程。这些操作可以提高备份速度,恢复速度,数据安全性,媒体使用率和/或减少带宽要求。
自动数据修饰
可以自动删除过时的数据,但是对于个人备份应用程序,与企业客户端服务器备份应用程序相反,可以自动数据“修饰”可以自定义 - 最多可以全球延迟或禁用删除。
压缩
可以使用各种方案来缩小要存储的源数据的大小,从而使用较少的存储空间。压缩通常是磁带驱动硬件的内置功能。
重复数据删除
由于备份类似配置的工作站而引起的冗余可以减少,因此仅存储一个副本。该技术可以在文件或原始块级别应用。这种潜在的大幅减少称为重复数据删除。在任何数据移至备份媒体之前,它都可以在服务器上发生,有时称为源/客户端重复数据删除。这种方法还减少了将备份数据发送到其目标媒体所需的带宽。该过程也可以在目标存储设备上发生,有时称为内联或后端重复数据删除。
复制
有时,备份将复制到第二组存储媒体。这可以做到重新排列存档文件以优化还原速度,或在其他位置或其他存储介质上使用第二份副本,就像企业客户端服务器备份的磁盘与磁盘到磁盘的能力一样。
加密
高容量可移动的存储媒体(例如备用磁带)如果丢失或被盗,则会出现数据安全风险。加密这些媒体上的数据可以减轻此问题,但是加密是一个CPU密集的过程,可以放慢备份速度,而加密备份的安全性仅与密钥管理策略的安全性一样有效。
多路复用
当要备份的计算机要比有目标存储设备要多的计算机要多得多时,可以使用单个存储设备带有几个同时备份的能力很有用。但是,通过“多路复用备份”填充计划的备份窗口仅用于磁带目的地。
重构
在存档文件中重新安排备份集的过程称为重构。例如,如果备份系统每天使用单个磁带来存储所有受保护的计算机的增量备份,则还原一台计算机可能需要许多磁带。重构可用于将一台计算机的所有备份合并到单个磁带上,从而创建“合成完整备份”。这对于备份系统的备份系统特别有用。
舞台
有时,备份将被复制到分期磁盘,然后再将其复制到胶带上。此过程有时称为D2D2T,这是磁盘到磁盘到录像带的首字母缩写。如果在基于网络的备份系统中经常面对的最终目标设备与源设备的速度与源设备匹配的速度有问题,则可能会很有用。它还可以用作应用其他数据操纵技术的集中位置。
目标
- 恢复点目标(RPO):重新启动的基础架构反映的时间点表示为“由于重大事件,IT服务可能会从IT服务中丢失数据(交易)的最大目标周期”。从本质上讲,这是由于恢复而经历的后退。最理想的RPO将是数据丢失事件之前的点。使最新的恢复点可实现,需要增加源数据和备份存储库之间同步的频率。
- 恢复时间目标(RTO):灾难与恢复业务功能之间经过的时间。
- 数据安全性:除了保留所有者对数据的访问外,数据还必须限制在未经授权的访问中。备份必须以不损害原始所有者承诺的方式执行。这可以通过数据加密和适当的媒体处理策略来实现。
- 数据保留期:法规和政策可能会导致预计将保留在特定时期的情况,但不会再保留。在此期间保留备份可能会导致不必要的责任和对存储介质的最佳使用。
- 校验和哈希功能验证:备份到磁带存档文件的应用程序需要此选项以验证数据已准确复制。
- 备份过程监视:企业客户端服务器备份应用程序需要一个允许管理员监视备份过程的用户界面,并证明了对组织外部的监管机构的合规性;例如, HIPAA可能需要在美国的保险公司证明其客户数据符合记录保留要求。
- 用户启动的备份和还原:避免或从轻微灾难中恢复,例如无意中删除或覆盖一个或多个文件的“良好”版本,计算机用户(与管理员相比)可能会启动备份和还原(不一定是从最终文件或文件夹的备份。
也可以看看
关于备份
相关话题