[转] 当一个硬盘掉线后如何重建阵列 | |
[2010-03-14] | |
使用SMOR Configuration Utility 来替换掉线硬盘 用一个新的硬盘替换掉掉线的硬盘。请注意把这个新的硬盘的SCSI ID设置成原来掉线硬盘一样的SCSI ID。新的硬盘的容量至少要和旧硬盘的大小一样,否则不能进行重建硬盘。 重启系统,在PC自检时,当RAID卡提示按Ctrl+A时请同时按Ctrl+A键 进入RAID的BIOS以后,在控制区的左侧选中有硬盘掉线的阵列。这个阵列会被高亮显示。 请同时按Alt+R键来打开阵列菜单 选择Rebuild以开始阵列的重建 使用软件Storage Manager Pro来替换掉线硬盘 用一个新的硬盘替换掉掉线的硬盘。请注意把这个新的硬盘的SCSI ID设置成原来掉线硬盘一样的SCSI ID。新的硬盘的容量至少要和旧硬盘的大小一样,否则不能进行重建硬盘。 重起操作系统 打开Storage Manager Pro管理软件 选择local system 图标然后选择Open System以显示阵列信息 选择Logical Configuration View 双击阵列组图标来打开Array Group Information窗口 点击在Array Group Information 窗口点击Rebuild来启动重建阵列过程 注意:当重建过程开始后,这个硬盘会显示一个小旗在它的旁边。重建完成的百分比也会被显示出来。 Q3:什么是NVRAM? NVRAM是非易变RAM,是Adaptec 阵列卡存储基本的建立在硬盘上的阵列信息的地方。NVRAM可以存放的信息不会因为关机或者断电而丢失。但是NVRAM里存放的信息在一定情况下是可以改变的。 Q4:安装SCSI卡时为什么显示信息 每次把SCSI/RAID卡安装在系统里,都会出现这个错误信息“Expansion ROM not Initialized”;把卡取出错误就会消失。怎么样解决这个问题呢? “Expansion ROM not Initialized”是由于主板的内存扩展不足引起的。通常可以用更新主板的BIOS来解决,但是这个并不是SCSI卡的功能。 一些主板会有一个可使用的上位内存区(upper memory area);另一些没有上位内存区,而是只能支持一个扩展内存(extended memory)。一些制造商会保留这块内存作为自己使用,如USB或者其它系统里的专有I/O设备。有限的可用上位内存可能限制外加卡的ROM被装载,如在Adaptec SCSI 卡的ROM。 通常这种情况可由下列错误信息识别出来: ? 在卡的BIOS自检时机器停住不动; ? 在卡自检时显示错误信息“Expansion ROM error”或者“Expansion ROM not Initialized” ? 不能进入卡的BIOS 在这里由于主板的BIOS特点,您只能去检查主板制造商有没有固件的更新或者是可以改变系统BIOS的上位内存区。如果这个上位内存区被禁用,您就可能没有办法来在这个主板上使用Adaptec的适配卡。 注意:如果主板支持EBDA(Extended BIOS Data Area),那么您所使用的适配卡也要支持这个功能。双方同时支持这个功能,改功能才会生效。但是Adaptec SCSI卡不支持该功能。 我们看到用户在每次冷启动遇到“Expansion ROM”错误信息,但是仍然可以在操作系统里正常使用这个适配卡(不做为启动设备)。 多数操作系统,如Windows系统在其完全启动后不使用BIOS来控制设备。他们通过系统里的虚拟驱动程序来控制设备。这就是这些卡在系统过了BIOS,ROM的错误信息仍然可以工作的原因。 Q5:当一个硬盘坏了,换了硬盘后,卡BIOS 里显示那个硬盘”Missing Member”。为何不能重建? 当阵列因为硬盘在某种情况下(硬盘损坏,硬盘被拔出 或 阵列信息损坏),在换了新的硬盘后还是显示”Missing”。 卡没有自动重建。在BIOS 里设了(Automatic Failover”, 换了硬盘,Initialize 了新的硬盘), 但是阵列就不能重建。要如何才能重建呢? 若要重建阵列, 需要把新加的硬盘设置成热备盘(Hotspare)才能重建。热备可以在卡的BIOS Array Configuration Utility 里设置,CLI 或是Adaptec Storage Manager (ASM) 管理软件。 注意:Automatic Failover只有在硬盘柜支持热插拔功能,并且把硬盘插会原来的位置时阵列才会自动重建。 Q6:当系统启动自检时,SCSI卡显示 "no boot devices available" 或者 "no INT13 devices", 然后显示 "BIOS not installed” SCSI卡的BIOS是被用作bootstrap loader,来通过IVT(Interrupt vector table)链接硬盘(INT13设备)到系统的BIOS里的, 当没有任何硬盘链接到SCSI卡时,SCSI卡自检的消息是正常的。BIOS会扫描SCSI ID 0,1 和2,如果没有发现任何设备,“BIOS not installed”会显示出来。当您需要从连在卡上的设备启动时,您才需要这个BIOS功能。 如果不要显示这个消息,可以在BIOS里把这个功能禁用。 您可以启动您的系统,当卡有提示信息的时候,按Ctrl+A,进入SCSISelect,然后选择Configure/View Host Adapter Settings-> Advanced Configuration, 在里面选择Host Adapter BIOS 或者 SCSI Controller Int-13 Support,然后根据卡的版本选择Disable or Disable Scan Bus。 注意:这个消息只是BIOS显示的一个信息,并不是一个错误信息。启动卡的BIOS并不会把信息装载到内存里,所有对设备的控制都是通过驱动程序来进行的。 Q7:什么时候SCSI卡的BIOS需要被禁用呢? 当您需要从连在卡上的设备启动时,您才需要启动SCSI卡BIOS功能。 您需要在这个时候禁用BIOS或者Int13 support: ? SCSI卡没有需要操作任何硬盘 ? 这个机器需要从ATA硬盘启动 ? 多个SCSI卡装在同一个系统里,这个卡没有连接要启动的系统盘 注意:当您受到" BIOS not installed "这个消息,并且卡上没有连接任何硬盘时,您可以安全的禁用卡的BIOS。这个卡仍然可以正常工作即使BIOS被禁用。 在多数情况下,不需要启动卡的BIOS就可以在连接到SCSI卡上的CD-ROM启动。 Q8: 怎么才能检验我的RAID阵列是否冗余? 很多用户希望在将服务器投入使用前,测试一下RAID卡和阵列是否具冗余性。本文就阐述了最逼真的仿真一个实际故障的正确方法。 请勿使用下列任何方法来仿真故障。 ?用下列手段将造成无法预料的结果和系统不稳定: 请勿在系统开机时拔掉硬盘电源 请勿在系统开机时拔掉SCSI线缆 请勿在拔掉硬盘电源后,启动系统 请勿拔掉SCSI线缆后,启动系统 请勿从外部机架中拔出硬盘 上述任何手段都不能精确地模拟真实故障,并且会对元件造成损坏。 请遵照下面的步骤来正确地在冗余阵列上模拟故障: 首先创建RAID1,5,0/1,0/5。然后安装操作系统。您不必等到阵列创建完毕后再安装操作系统。本文假设操作系统是Windows2000。当操组系统安装好后,安装给适配卡 配备的 Adaptec Storage Manager 软件。 必须等阵列完成建立过程,如此RAID才能处于理想状态。阵列如果不是在理想条件或状态下,是无法容错或冗余的。 当完成创建且阵列状态为理想(optimal)时,启动Storage Manager 工具。您应当可以看到RAID控制卡以及连到卡上的硬盘。属于阵列内部的硬盘将在硬盘图标上有一个蓝色的RAID字样。假如您把某个硬盘设为热备份硬盘,该盘会在硬盘图标上有一个红色的圈和一个白色的加号。我们建议在故障仿真中不要使用热备份设置,除非您打算测试特定的功能。 下一步,双击RAID阵列中的一员。屏幕上会显示出SCSI设备的信息。在屏幕上有一个标示为故障硬盘的按钮。选中“故障硬盘”则会把该盘标记为故障盘。为避免意外的阵列损失,您用这个方法只能假定一个故障盘。 在指定故障盘后,系统应当继续正常运转。系统能在降级模式(Degraded Mode)下重新启动。当测试完成后,再打开Storage Manager工具,双击代表故障RAID阵列的LSU(Logic Storage Unit),并选择重建。确保阵列在做其他测试前重建完毕。 假如您测试热备份功能,一旦“故障盘”按钮按下,热备份盘会介入,并自动开始阵列重建。假如重建未开始,那就激活某些硬盘操作如双击“我的电脑”,再访问RAID。这也将启动重建过程。 还有另外一个替代方法来测试阵列冗余性,此法无需安装操作系统或Storage Manager. 首先建立冗余RAID1,5,0/1,0/5。假如你要测试系统能够启动,打开fdisk并创建一个小的DOS分区。重启系统并用/s指令格式化该分区。一旦阵列建立完毕,重启系统并进入SMOR。 一旦进入SMOR,按下Alt+F10+o(字母o而非数字0)。选中RAID阵列中的某一成员,按下Alt+a。跳出的选项之一是“令硬盘失效”。选择该选项就会把该硬盘标为故障盘。为避免阵列的意外损失,此法只能指定一个故障盘。 在指定一个故障盘后,系统应当可以继续正常运行。并且能以降级模式重新启动。 假如您测试热备份功能,一旦“故障盘”按钮按下,热备份盘会介入,并自动开始阵列重建。我们建议在故障仿真中不要使用热备份设置,除非您打算测试特定的功能。 当测试完毕,进入SMOR工具,按下ALT+R并选择重建。确保阵列在做其他测试前完成重建。 小心:上述方法仅作为举例。在模拟故障时要极为小心。总是存在丢失所有的数据的风险。如果您事先未备份关键数据,您可能会永远失去它们。 Q9:怎么才能迫使阵列中失效的硬盘恢复到理想状态? 在阵列中的一个或多个硬盘被标为失效,但是我们相当肯定它们是完好的,能否强行将失效硬盘恢复到理想状态并加回到阵列中,而不必将它们重建回阵列。 的确,当某个硬盘被控制卡认为有故障时,通常假定硬盘存在某种形式的缺陷,应当迅速予以更换,以防止由于阵列总是试图将它重建而导致阵列崩溃。 然而,在极少情况下,硬盘被标为故障,但其实是故障警告过早。也就是说硬盘由于其他某些环境因素而被踢出局且标为“故障盘”,但事实上硬盘没有任何物理问题,完全可以安全地编入现有的阵列中。 发生这种情况时,可以强行把硬盘设回理想状态而不用经过耗时的重建。 下面是操作的具体步骤: 1、启动系统,按下(Ctrl+A或 Ctrl+D,根据您的系统的具体设定),进入控制卡BIOS。 2、在控制卡BIOS窗口的右方,选中RAID图标并回车,将图标放大。 3、选择阵列中处于故障状态的硬盘,同时按下 (Alt + F10 + O) ,注:是字母“O”而不是数字“0”。 4、然后,按下(Alt + A)进入“执行(Action)”菜单,选择“令其理想化(Make Optimal) 5、此时,故障盘就恢复到原来的理想状态。继续选择阵列中其他相信是完好的盘直到所有硬盘都达到理想状态。而后,您就可以实施正常的阵列操作。 这种方法适用于阵列中的每个硬盘都被标为“故障”,而其实早先操作系统处于无法访问状态。 但是,假如在任何RAID结构中有两个以上硬盘确实有问题,这个办法就不是恢复硬盘的可行之选,因为被迫理想化的硬盘通常会很快再度失效。 |
|
[关闭该页] |