数据恢复的概念及注意事项以及恢复方法
数据恢复:单纯从字面上的解释也就是恢复数据。
一、什么是数据?
名词解释:进行各种统计、计算、科学研究或技术设计等所依据的数值。
数据的应用领域非常广泛,但在这里我们仅针对计算机领域中部分应用来了解。
在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号的介
质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号
和模拟量等的通称。
电子计算机加工处理的对象
早期的计算机主要用于科学计算,故加工的对象主要是表示数值的数字。现代计
算机的应用越来越广,能加工处理的对象包括数字、文字、字母、符号、文件、
图像等。
二、什么是数据恢复?
当存储介质出现损伤或由于人员误操作、操作系统本身故障所造成的数据看不见、
无法读取、丢失。工程师通过特殊的手段读取在正常状态下不可见、不可读、无
法读的数据。
数据恢复是指通过技术手段,将保存在台式机硬盘、笔记本硬盘、服务器硬盘、
存储磁带库、移动硬盘、U盘、数码存储卡、Mp3等等设备上丢失的电子数据进行
抢救和恢复的技术。
三、从哪恢复?
数据记录设备:数据以某种格式记录在计算机内部或外部存储介质上。
存储介质是指存储数据的载体。比如软盘、光盘、DVD、硬盘、闪存、U盘、CF
卡、SD卡、MMC卡、SM卡、记忆棒(MemoryStick)、xD卡等。目前最流行的存
储介质是基于闪存(Nandflash)的,比如U盘、CF卡、SD卡、SDHC卡、MMC
卡、SM卡、记忆棒、xD卡等。
四、如何恢复?
针对不同故障的不同问题具体分析、判断。
数据恢复的故障类型
大体上可分为硬故障和软故障两类。
硬故障是指存储介子的物理硬件发生故障、损坏。
如:硬盘物理故障(数据储存装置--主要是磁盘)
大量坏道(启动困难、经常死机、格式化失败、读写困难);
电路板故障:电路板损坏、芯片烧坏、断针断线。(通电后无任何声音、电路板有
明显的烧痕等);
盘体故障:磁头损坏、磁头老化、磁头烧坏(常有一种“咔嚓咔嚓”的磁头撞击
声);电机损坏(电机不转,通电后无任何声音);
固件信息丢失、固件损坏等。(CMOS不认盘、“磁盘管理”中无法找到该硬盘);
盘片划伤。
软故障是相对于硬故障而言的,即存储介子物理硬件没有损坏,通过软件即可解
决的故障。包括误删除、误格式化、误分区、误GHOST等。
删除
删除操作却简单的很,当我们需要删除一个文件时,系统只是在文件分配表内在该
文件前面写一个删除标志,表示该文件已被删除,他所占用的空间已被"释放",其
他文件可以使用他占用的空间。所以,当我们删除文件又想找回他(数据恢复)
时,只需用工具将删除标志去掉,数据被恢复回来了。当然,前提是没有新的文
件写入,该文件所占用的空间没有被新内容覆盖。
格式化
格式化操作和删除相似,都只操作文件分配表,不过格式化是将所有文件都加上
删除标志,或干脆将文件分配表清空,系统将认为硬盘分区上不存在任何内容。
格式化操作并没有对数据区做任何操作,目录空了,内容还在,借助数据恢复知
识和相应工具,数据仍然能够被恢复回来。
注意:格式化并不是100%能恢复,有的情况磁盘打不开,需要格式化才能打开。
如果数据重要,千万别尝试格式化后再恢复,因为格式化本身就是对磁盘写入的
过程,只会破坏残留的信息。
低级格式化
就是将空白的磁盘划分出柱面和磁道,再将磁道划分为若干个扇区,每个扇区又
划分出标识部分ID、间隔区GAP和数据区DATA等。可见,低级格式化是高级格
式化之前的一件工作,它不仅能在DOS环境来完成,也能在xp甚至vista系统下
完成。而且低级格式化只能针对一块硬盘而不能支持单独的某一个分区。每块硬
盘在出厂时,已由硬盘生产商进行低级格式化,因此通常使用者无需再进行低级
格式化操作。
分区
硬盘存放数据的基本单位为扇区,我们可以理解为一本书的一页。当我们装机或
买来一个移动硬盘,第一步便是为了方便管理--分区。无论用何种分区工具,都
会在硬盘的第一个扇区标注上硬盘的分区数量、每个分区的大小,起始位置等信
息,术语称为主引导记录(MBR),也有人称为分区信息表。当主引导记录因为各
种原因(硬盘坏道、病毒、误操作等)被破坏后,一些或全部分区自然就会丢失
不见了,根据数据信息特征,我们可以重新推算计算分区大小及位置,手工标注
到分区信息表,“丢失”的分区回来了。
覆盖
数据恢复工程师常说:“只要数据没有被覆盖,数据就有可能恢复回来”。
因为磁盘的存储特性,当我们不需要硬盘上的数据时,数据并没有被拿走。删除
时系统只是在文件上写一个删除标志,格式化和低级格式化也是在磁盘上重新覆
盖写一遍以数字0为内容的数据,这就是覆盖。
一个文件被标记上删除标志后,他所占用的空间在有新文件写入时,将有可能被
新文件占用覆盖写上新内容。这时删除的文件名虽然还在,但他指向数据区的空
间内容已经被覆盖改变,恢复出来的将是错误异常内容。同样文件分配表内有删
除标记的文件信息所占用的空间也有可能被新文件名文件信息占用覆盖,文件名
也将不存在了。
当将一个分区格式化后,有拷贝上新内容,新数据只是覆盖掉分区前部分空间,
去掉新内容占用的空间,该分区剩余空间数据区上无序内容仍然有可能被重新组
织,将数据恢复出来。
同理,克隆、一键恢复、系统还原等造成的数据丢失,只要新数据占用空间
小于破坏前空间容量,数据恢复工程师就有可能恢复你要的分区和数据。
服务器数据恢复
磁盘阵列中针对不同的应用使用的不同技术,称为RAID等级。RAID是英文
RedundantArrayofInexpensiveDisks的缩写,中文简称为廉价磁盘冗余阵列。
而每一等级代表一种技术。这个等级并不代表技术的高低,RAID5并不高于RAID
3。至于要选择那一种RAID等级的产品,纯视用户的操作环境及应用而定,与等
级的高低没有必然的关系。
RAID就是一种由多块硬盘构成的冗余阵列。
虽然RAID包含多块硬盘,但是在操作系统下是作为一个独立的大型存储设备
出现。利用RAID技术于存储系统的好处主要有以下三种:
1.通过把多个磁盘组织在一起作为一个逻辑卷提供磁盘跨越功能
2.通过把数据分成多个数据块(block)并行写入/读出多个磁盘以提高访问
磁盘的速度
3.通过镜像或校验操作提供容错能力
最初开发RAID的主要目的是节省成本,当时几块小容量硬盘的价格总和要低
于大容量的硬盘。目前来看RAID在节省成本方面的作用并不明显,但是RAID可
以充分发挥出多块硬盘的优势,实现远远超出任何一块单独硬盘的速度和吞吐量。
除了性能上的提高之外,RAID还可以提供良好的容错能力,在任何一块硬盘出现
问题的情况下都可以继续工作,不会受到损坏硬盘的影响。
RAID技术分为几种不同的等级,分别可以提供不同的速度,安全性和性价比。
根据实际情况选择适当的RAID级别可以满足用户对存储系统可用性、性能和容量
的要求。常用的RAID级别有以下几种:NRAID,JbOD,RAID0,RAID1,RAID0+1,
RAID3,RAID5等。目前经常使用的是RAID5和RAID(0+1)。
RAID0(StripedDiskArraywithoutFaultTolerance)
RAID0是把所有的硬盘并联起来成为一个大的硬盘组。其容量为所有属于这个组
的硬盘的总和。所有数据的存取均以并行分割方式进行。由于所有存取的数据均
以平衡方式存取到整组硬盘里,存取的速度非常快。越是多硬盘数量的RAID0
阵列其存取的速度就越快。容量效率方面也是所有RAID格式中最高的,达到100%。
但RAID0有一个致命的缺点–就是它跟普通硬盘一样没有一点的冗余能力。一旦
有一个硬盘失效时,所有的数据将尽失。没法重组回来!一般来讲,RAID0只用
于一些已有原数据载体的多媒体文件的高速读取环境。如视频点播系统的数据共
享部分等。RAID0只需要两个或以上的硬盘便能组成。
RAID1(Mirroring)
RAID1是硬盘镜像备份操作。由两个硬盘所组成。其中一个是主硬盘而另外
一个是镜像硬盘。主硬盘的数据会不停的被镜像到另外一个镜像硬盘上。由于所
有主硬盘的数据会不停地镜像到另外一个硬盘上,故RAID1具有很高的冗余能
力。达到最高的100%。可是正由于这个镜像做法不是以算法操作,故它的容量效
率非常的低,只有50%。RAID1只支持两个硬盘操作。容量非常有限,故一般只
用于操作系统中。
RAID0+1(MirroringandStriping)
RAID0+1即由两组RAID0的硬盘作RAID1的镜像容错。虽然RAID0+1具
备有RAID1的容错能力和RAID0的容量性能。但RAID0+1的容量效率还是与
RAID1一样只有50%,故同样地没有被普及使用。
RAID3(Stripingwithdedicatedparity)
RAID3在安全方面以奇偶校验(paritycheck)做错误校正及检测,只需要
一个额外的校检磁盘(paritydisk)。奇偶校验值的计算是以各个磁盘的相对应
位作XOR的逻辑运算,然后将结果写入奇偶校验磁盘,任何数据的修改都要做奇
偶校验计算。如某一磁盘故障,换上新的磁盘后,整个磁盘阵列(包括奇偶校验磁
盘)需重新计算一次,将故障磁盘的数据恢复并写入新磁盘中,如奇偶校验磁盘
故障,则重新计算奇偶校验值,以达容错的要求。
RAID5(Stripingwithdistributedparity)
RAID5也是一种具容错能力的RAID操作方式,但与RAID3不一样的是RAID
5的容错方式不应用专用容错硬盘,容错信息是平均的分布到所有硬盘上。当阵
列中有一个硬盘失效,磁盘阵列可以从其他的几个硬盘的对应数据中算出已掉失
的数据。由于我们需要保证失去的信息可以从另外的几个硬盘中算出来,我们就
需要在一定容量的基础上多用一个硬盘以保证其他的成员硬盘可以无误地重组失
去的数据。其总容量为(N-1)x最低容量硬盘的容量。从容量效率来讲,RAID5
同样地消耗了一个硬盘的容量,当有一个硬盘失效时,失效硬盘的数据可以从其
他硬盘的容错信息中重建出来,但如果有两个硬盘同时失效的话,所有数据将尽
失。
RAID6
与RAID5相比,RAID6增加了第二个独立的奇偶校验信息块。两个独立的
奇偶系统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会
影响数据的使用。但RAID6需要分配给奇偶校验信息更大的磁盘空间,相对于
RAID5有更大的“写损失”,因此“写性能”非常差。较差的性能和复杂的实施
方式使得RAID6很少得到实际应用。
常见的RAID6组建类型RAID6(6D+2P)
1RAID6(6D+2P)原理
和RAID5相似,RAID6(6D+2P)根据条带化的数据生成校验信息,条带化
数据和校验数据一起分散存储到RAID组的各个磁盘上。在图1中,D0,D1,D2,
D3,D4和D5是条带化的数据,P代表校验数据,Q是第二份校验数据。
RAID6(6D+2P)根据条带化的数据生成校验信息,条带化数据和校验数据一
起分散存储到RAID组的各个磁盘上
RAID6校验数据生成公式(P和Q):
P的生成用了异或
P=D0XORD1XORD2XORD3XORD4XORD5
Q的生成用了系数和异或
Q=A0*D0XORA1*D1XORA2*D2XORA3*D3XORA4*D4XORA5*D5
D0~D5:条带化数据
A0~A5:系数
XOR:异或
*:乘
在RAID6中,当有1块磁盘出故障的时候,利用公式1恢复数据,这个过程
是和RAID5一样的。而当有2块磁盘同时出故障的时候,就需要同时用公式1
和公式2来恢复数据了。
各系数A0~A5是线性无关的系数,在D0,D1,D2,D3,D4,D5,P,Q中有
两个未知数的情况下,也可以联列求解两个方程得出两个未知数的值。这样在一
个RAID组中有两块磁盘同时坏的情况下,也可以恢复数据。
上面描述的是校验数据生成的算法。其实RAID6的核心就是有两份检验数据,
以保证两块磁盘同时出故障的时候,也能保障数据的安全。
RAID7
这是一种新的RAID标准,其自身带有智能化实时操作系统和用于存储管理的
软件工具,可完全独立于主机运行,不占用主机CPU资源。RAID7可以看作是一
种存储计算机(StorageComputer),它与其他RAID标准有明显区别。除了以上
的各种标准,我们可以如RAID0+1那样结合多种RAID规范来构筑所需的RAID
阵列,例如RAID5+3(RAID53)就是一种应用较为广泛的阵列形式。用户一般
可以通过灵活配置磁盘阵列来获得更加符合其要求的磁盘存储系统。
NAS的概念
网络存储服务器NAS(NetworkAttachedStorage),是一个专用为提供高性
能、低拥有成本和高可靠性的数据保存和传送产品。NAS设备是为提供一套安全,
稳固的文件和数据保存,容易使用和管理而设计,其定义为特殊的独立的专用数
据存储服务器,内嵌系统软件,可以提供NFS、SMB/CIFS文件共享。NAS是基于
IP协议的文件级数据存储,支持现有的网络技术,比如以太网、FDDI等。NAS设
备完全以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而有效
释放带宽,大大提高了网络整体性能,也可有效降低总拥有成本,保护用户投资。
把文件存放在同一个服务器里让不同的电脑用户共享和集合网络里不同种类的电
脑正是NAS网络存储的主要功能。正因为NAS网络存储系统应用开放的,工业标
准的协议,不同类型的电脑用户运行不同的操作系统可以实现对同一个文件的访
问。所以已经不再在意到底是Windows用户或UNIX用户。他们同样可以安全地
和可靠地使用NAS网络存储系统中的数据。
NAS的特点
NAS以其流畅的机构设计,具有突出的性能:
移除服务器I/O瓶颈:
NAS是专门针对文件级数据存储应用而设计的,将存储设备与服务器完全分
离,从而将服务器端数据I/O瓶颈彻底消除。服务器不用再承担向用户传送数据
的任务,更专注于网络中的其它应用,也提高了网络的整体性能。
简便实现NT与UNIX下的文件共享:
NAS支持标准的网络文件协议,可以提供完全跨平台文件混合存储功能。不
同操作系统下的用户均可将数据存储一台NAS设备中,从而大大节省存储空间,
减少资源浪费。
简便的设备安装、管理与维护:
NAS设备提供了最简便快捷的安装过程,经过简单的调试就可以流畅应用。
一般基于图形界面的管理系统可方便进行设备的掌控。同样,网络管理员不用分
别对设备进行管理,集中化的数据存储与管理,节省了大量的人力物力。
?按需增容,方便容量规划:
NAS设备可以提供在线扩容能力,大大方便了网络管理员的容量设计。即使
应付无法预见的未来存储容量增长,也显得异常轻松自如。而且,这种数据容量
扩充的时候,不用停顿整个网络的服务,这将极大的减少因为停机造成的成本浪
费。
高可靠性:
除了刚才我们提到的因为移除服务器端I/O瓶颈而大大提高数据可用性外,
NAS设备还采用多种方式提高数据的可用性、可靠性,比如RAID技术的采用、冗
余部件(电源、风扇等)的采用以及容错系统的设计等,当然对于不同的设备,
可能也会采用其他更高性能的方式或解决方案。
降低总拥有成本:
NAS有一个最吸引用户的地方,就是具有极低的总拥有成本.
NAS的主要长处
第一,NAS适用于那些需要通过网络将文件数据传送到多台客户机上的用户。
NAS设备在数据必须长距离传送的环境中可以很好地发挥作用。
第二,NAS设备非常易于部署。可以使NAS主机、客户机和其他设备广泛分
布在整个企业的网络环境中。NAS可以提供可靠的文件级数据整合,因为文件锁
定是由设备自身来处理的。
第三,NAS应用于高效的文件共享任务中,例如UNIX中的NFS和WindowsNT
中的CIFS,其中基于网络的文件级锁定提供了高级并发访问保护的功能。
SAN的概念
SAN(StorageAreaNetwork,存储区域网),被定义为一个共用的高速专用
存储网络,存储设备集中在服务器的后端,因此SAN是专用的高速光纤网络。架
构一个真正的SAN,需要接专用的光纤交换机和集线器。存储区域网络是网络体
系结构中一种相对新的概念,也是链接服务器和独立于工作网络的在线存储设备
的网络。虽然,网络依然在发展过程中,但最重要的SAN技术似乎是用于SCSI总
线连接的光纤通道改进功能。
SAN的优势
SAN的优势可以表现在一下几个方面:
高数据传输速度:
以光纤为接口的存储网络SAN提供了一个高扩展性、高性能的网络存储机构。
光纤交换机、光纤存储阵列同时提供高性能和更大的服务器扩展空间,这是以
SCSI为基础的系统所缺乏的。同样,为企业今后的应用提供了一个超强的可扩展
性。
加强存储管理:
SAN存储网络各组成部分的数据不再在以太网络上流通从而大大提高以太网
络的性能。正由于存储设备与服务器完全分离,用户获得一个与服务器分开的存
储管理理念。复制、备份、恢复数据趋向和安全的管理可以中央的控制和管理手
段进行。加上把不同的存储池(StoragePools)以网络方式连接,企业可以以任
何他们需要的方式访问他们的数据,并获得更高的数据完整性。
加强备份/还原能力的可用性:
SAN的高可用性是基于它对灾难恢复,在线备份能力和对冗余存储系统和数
据的时效切换能力而来。
同种服务器的整合:
在一个SAN系统中,服务器全连接到一个数据网络。全面增加对一个企业共
有存储阵列的连接,高效率和经济的存储分配可以通过聚合的和高磁盘使用率中
获得。
综合SAN的优势,它在高性能数据备份/恢复、集中化管理数据及远程数据保
护领域得到广泛的应用。
五、重要性及意义?
此文仅是让大家基本了解数据存储和数据恢复的基本原理,目的是让大家不
再感觉到数据恢复的神秘,懂得一点数据恢复的知识和数据恢复原理,可以最大
限度的拯救遭遇意外的数据,避免更大的损失。真正的原理和数据恢复工作要稍
微复杂一些。
注意:当数据出现问题时请勿自行操作以免造成数据覆盖无法恢复,切记!!!
本文发布于:2023-03-03 00:17:10,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/1677773831116767.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:数据丢失.doc
本文 PDF 下载地址:数据丢失.pdf
留言与评论(共有 0 条评论) |