ROSE 共享存储双机热备解决方案
为什么需要高可用系统 随着计算机应用的不断深入,企业对计算机系统的依赖程度也日渐增加。尤其在一些关键行业的关键应用上,应用的后台核心系统是否具有高可用性能力,已经成为影响一个公司业务成败的关键因素。 高可用性包括保护业务关键数据的完整性和维持应用程序的连续运行等方面。在这些信息处理系统中保存了大量的关键业务数据,一旦信息发生丢失或破坏,将带来灾难性的影响和损失。 在传统观念中,往往选择价格昂贵的专有计算机系统来提高业务系统运行的稳定性,系统实施与维护本钱极高。而价格较低的单一的PC服务器系统目前还无法满足用户对于安全性与可用性的要求。在资源有限的情况下,如何保证业务系统的高可用性和数据的安全,已成为众多用户关注的焦点问题。 Ro公司提供的高可用性系统解决方案,为用户提供了具有单点故障容错能力的系统平台。它采用主服务发生故障时备服务器接收的机制,实现在线故障自动切换,实现系统7×24小时不连续运行,防止停机造成的损失。 Ro基于共享存储的双机高可用解决方案 基于存储共享的双机热备是双机热备的标准方案。双机系统的两台服务器都与共享存储设备连接,用户的操作系统、应用软件和双机软件分别安装在两台主机的部存储〔硬盘〕上,应用服务的数据如此存放在共享存储设备上。 两台主机之间通过私有心跳网络连接,随时监控对方的运行状态。
当工作主机发生故障,无常提供服务时,备机会与时侦测到故障信息,并根据切换策略与时进展故障转移,由备机接收故障主机上的工作,并进展报警,提示管理人员对故障主机进展维护。 对于用户而言,这一切换过程是全自动、完全透明的,在很短的时间完成,防止业务的长时间停顿给用户造成不可估量的损失。由于使用的是共享存储设备,因此两台主机使用的实际上是同一份数据,不用担心数据一致性的问题。当故障排除后,管理人员可以选择自动或手动将业务切换回原主机;也可以选择不切换,此时维修好的主机就作为备份机,双机系统继续工作。 Ro基于共享存储的双机热备方案支持两种工作模式:主备模式、主主模式,可根据用户自身业务与软硬件情况合理配置。
解决方案优点:
● 对服务器硬件配置要求不高,可以根据应用情况采用不同型号或配置● 可利用原有生产系统快速构建双机系统,性价比高●系统切换时间短,最大程度减少业务中断的影响●切换过程对应用程序无影响,无需重新启动或登录,做到无人值守●系统效率高,系统中数据读写、管理与容错由磁盘阵列来完成。而系统服务器故障监控切换处理由HA软件来完成。双机监控依靠RS232串口线路或专用TCP/IP网路线路,既不占用主机CPU资源也不占用根底业务网络带宽,在实际应用中得到用户的一致好评●支持丰富的应用配置,如:Oracle、MSSQL、Syba、MySQL、文件服务、Web服务等,无需额外插件支持用户自定义应用●硬件可采用机架式结构,便于维护管理
RoHA产品介绍
RoHA高可用系统解决方案,由两台服务器和一台共享存储设备组成主要硬件环境,通过RoHA持续、稳定、高效的软件系统,实现两个节点的高可用功能。采用Ro基于共享存储的高可用解决方案,实现企业关键业务7×24小时不连续运营,是企业最优之选。
RoHA的工作原理
RoHA双机系统的两台服务器〔主机〕都与磁盘阵列〔共享存储〕系统连接,用户的操
作系统、应用软件和RoHA高可用软件分别安装在两台主机上,数据库等共享数据存放在存储系统上,两台主机之间通过私用心跳网络连接。配置好的系统主机开始工作后,RoHA软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的RoHA软件都可监控另一台主机的状态。当工作主机发生故障时,心跳信息就会产生变化,这种变化可以通过私用网络被RoHA软件捕捉。当捕捉到这种变化后RoHA就会控制系统进展主机切换,即备份机启动和工作主机一样的应用程序接收工作主机的工作〔包括提供TCP/IP网络服务、存储系统的存取等服务〕并进展报警,提示管理人员对故障主机进展维修。当维修完毕后,可以根据RoHA的设定自动或手动再切换回来,也可以不切换,此时维修好的主机就作为备份机,双机系统继续工作。 RoHA实现容错功能的关键在于,对客户端来说主机是透明的,当系统发生错误而进展切换时,即主机的切换在客户端看来没有变化,所有基于主机的应用都仍然正常运行。RoHA采用了虚拟IP地址映射技术来实现此功能。客户端通过虚拟地址和工作主机通讯,无论系统是否发生切换,虚拟地址始终指向工作主机。在进展网络服务时,RoHA提供一个逻辑的虚拟地址,任何一个客户端需要请求服务时只需要使用这个虚拟地址。正常运行时,虚拟地址与网络服务由主服务器提供。当主服务器出现故障时,RoHA会将虚拟地址转移到另外一台服务器的网卡上,继
续提供网络服务。切换完成后,在客户端看来系统并没有出现故障,网络服务仍然可以使用。除IP地址外,HA还可以提供虚拟的计算机别名供客户端访问。对于数据库服务,当有主服务器出现故障时,另外一台服务器就会自动接收,同时启动数据库和应用程序,使用户数据库可以正常操作。