数据迁移(又称分级存储管理,hierarchical storage management,hsm)是一种将离线存储与在线存储融合的技术。它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的数据按指定的策略自动迁移到磁带库(简称带库)等二级大容量存储设备上。当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一级磁盘上。对于用户来说,上述数据迁移操作完全是透明的,只是在访问磁盘的速度上略有怠慢,而在逻辑磁盘的容量上明显感觉大大提高了。通俗地讲,数据迁移是一种可以把大量不经常访问的数据存放在带库、盘库等离线介质上,只在盘阵上保存少量访问频率高的数据的技术。当那些磁带等介质上数据被访问时,系统自动的把这些数据回迁到盘阵中;同样,盘阵中很久未访问的数据被自动迁移到磁带介质上,从而大大降低投入和管理成本。
DB2的数据迁移实现
现在,许多医院可能没有磁带设备和盘库,如果要采用数据迁移技术,需要购置这些存储产品,最重要的还要购置数据迁移管理软件。这样,病历可以通过录入或照像先转为数字信息,再通过主机,存储于盘阵或带库和光盘库中。在管理软件的管理下,它会把三天两头到医院看病患者的病历信息保存在盘阵上,而把几个月或1~2年甚至更多时间才到医院看一次病的患者的病历保存在成本低的带库或盘库中。由于建立了这套存储管理系统,病人看病查询病历资料的速度大为提高。无论是常见病人还是罕见病人,查询病历几乎是即时的。不光快,还省钱呢。
我们再来算一笔账: 以10tb存储容量为例,如果购买一台相当容量的带库大约100万元,若是盘库,大约75万元,加上数据迁移软件(如legato公司的diskxtender)9万元,总投资成本是84万~109万元。虽然第一次投资比较大,但是可以用30~50年或更多的时间,比起人工管理的成本,花费只是其1/7~1/3。此外,如果与单纯用盘阵保管病历的存储方式比较,花费也是低的,数据迁移方式大概只占其总投入的1/3~1/2。
数据迁移与存储方式
在这里,我们有必要解释一下数据迁移技术与san、das及nas技术的关系。数据迁移技术可以利用san、das和nas完成数据的迁移工作,san、das和nas本身不具备迁移功能,只是这些系统的末端挂接的带库、盘库可以承载被迁移的数据而已。特别地,nas设备中的数据可被迁移到带库等备份设备中,或从它们中迁出,它自己不可直连备份设备。
EMC存储设备
数据迁移的实现方式
那么,数据怎样实现迁移呢?从原理上来讲,首先,文件先由数据迁移系统选择,再被拷贝到hsm介质上。当文件被正确拷贝后,一个和原文件相同名字的标志文件被创建,但它只占用比原文件小得多的磁盘空间。以后,当用户访问这个标志文件时,hsm系统能将原始文件从正确的介质上恢复过来。所有这些工作需要一定的策略来管理实施。
浪潮存储管理方案
hsm软件提供多种数据迁移策略,目前主要通过高水位、低水位及清除位来设置符合存储原则的标识。当数据达到高水位时,hsm软件会将数据迁移至二级存储设备中或三级存储设备中,直至底水位才停止,然后,将在一级存储设备中的存储空间释放出来。另外,用户也可以自己建立相应地数据迁移策略,比如按文件访问的时间、大小等原则。
HP数据存储管理软件
hsm软件都带有介质管理功能,通过此模块hsm软件可对磁带库、光盘库进行管理,从而实现数据的多层复制功能。同样它还提供自动的安排数据迁移时间,灵活方便的控制数据迁移日程。
易混淆的理论澄清
数据迁移自问世以来,常常同备份混淆起来。那看过上文对于数据迁移的介绍,咱们再来看看备份。
备份是把在线数据保存为离线数据的一种数据保护方式,备份的对象是文件系统。当需要调到主机中时,需要运用数据恢复技术,恢复的时间极长,还需要人工干预。迁移则不同,它不仅可以把在线数据保存为离线数据,还把离线数据模拟成在线数据,也就是说,从用户角度看,数据“一直”在线,调用磁带设备上的数据只需2分钟,而且调用是全自动的。另外,迁移技术保存的是文件而不是整个文件系统,对磁盘和磁带数据的更新也是随时随地的。在投资上,也有差别,后者需要在前者基础之上购买迁移管理软件。
Lsi存储件展示
.分页: [1] [2]
- 上一篇:备份技术简介
- 下一篇:常用的存储备份技术大比较